Cursusaanbod
Inleiding
Installeren en configureren van Dataiku Data Science Studio (DSS)
- Systeemeisen voor Dataiku DSS
- Apache Hadoop en Apache Spark-integraties instellen
- Dataiku DSS configureren met webproxies
- Migreren van andere platformen naar Dataiku DSS
Overzicht van Dataiku DSS-functies en architectuur
- Kernobjecten en grafieken die fundamenteel zijn voor Dataiku DSS
- Wat is een recept in Dataiku DSS?
- Typen datasets die door Dataiku DSS worden ondersteund
Een Dataiku DSS-project maken
Datasets definiëren om verbinding te maken met data-ressourcen in Dataiku DSS
- Werken met DSS-connectors en bestandsindelingen
- Standaard DSS-indelingen versus Hadoop-specifieke indelingen
- Bestanden uploaden voor een Dataiku DSS-project
Overzicht van het serverbestandssysteem in Dataiku DSS
Beheerde mappen maken en gebruiken
- Dataiku DSS-recept voor een samengvoegde map
- Lokale versus niet-lokale beheerde mappen
Een bestandssysteemdataset construeren met behulp van inhoud van beheerde mappen
- Opruimen met een DSS-code-recept
Werken met Metrics Dataset en Internal Stats Dataset
Het DSS Download-recept implementeren voor HTTP Dataset
SQL-datasets en HDFS-datasets verplaatsen met behulp van DSS
Datasets in Dataiku DSS ordenen
- Schrijfvolgorde versus leesvolgorde
Data visuals voor een Dataiku DSS-project verkennen en voorbereiden
Overzicht van Dataiku-schema's, opslagtypen en betekenissen
Data-opschoning, normalisatie en verrijkingsscripts uitvoeren in Dataiku DSS
Werken met de Dataiku DSS Charts-interface en typen visuele aggregaties
Het interactieve statistiekenfunctie van DSS gebruiken
- Univariante analyse versus bivariante analyse
- Gebruik maken van het Principal Component Analysis (PCA) DSS-gereedschap
Overzicht van machine learning met Dataiku DSS
- Supervised ML versus unsupervised ML
- Referenties voor DSS ML-algoritmen en functies
- Deep Learning met Dataiku DSS
Overzicht van de flow afgeleid van DSS-datasets en recepten
Bestaande datasets in DSS transformeren met visuele recepten
DSS-recepten gebruiken op basis van door gebruikers gedefinieerde code
Code-exploratie en -experimentatie optimaliseren met DSS-codeblokken
Geavanceerde DSS-visualisaties en aangepaste frontend-functies schrijven met Webapps
Werken met de DSS Code Reports-functie
Data-projectelementen delen en vertrouwd raken met het DSS-dashboard
Een Dataiku DSS-project ontwerpen en pakketteren als een herbruikbare toepassing
Overzicht van geavanceerde methoden in Dataiku DSS
- Geoptimaliseerde datasets-partitionering implementeren met behulp van DSS
- Specifieke DSS-verwerkingsdelen uitvoeren via berekeningen in Kubernetes-containers
Overzicht van samenwerking en versiebeheer in Dataiku DSS
Automatiseringscenario's, metingen en controles implementeren voor DSS-projecttesten
Een project implementeren en updaten met behulp van de DSS-automatisatieknooppunt en bundels
Werken met real-time APIs in Dataiku DSS
- Extra APIs en Rest APIs in DSS
Dataiku DSS-tijdseries analyseren en voorspellen
Een project in Dataiku DSS beveiligen
- Projecttoestemmingen en dashboardautorisaties beheren
- Geavanceerde beveiligingsopties implementeren
Dataiku DSS integreren met de Cloud
Problemen oplossen
Samenvatting en conclusie
Vereisten
- Ervaring met Python, SQL en R programmeertalen
- Basiskennis van gegevensverwerking met Apache Hadoop en Spark
- Begrip van machine learning concepten en data modellen
- Achtergrond in statistische analysen en data science concepten
- Ervaring met het visualiseren en communiceren van gegevens
Publiek
- Ingenieurs
- Data Scientists
- Data Analisten