Cursusaanbod

Inleiding

Installeren en configureren van Dataiku Data Science Studio (DSS)

  • Systeemeisen voor Dataiku DSS
  • Apache Hadoop en Apache Spark-integraties instellen
  • Dataiku DSS configureren met webproxies
  • Migreren van andere platformen naar Dataiku DSS

Overzicht van Dataiku DSS-functies en architectuur

  • Kernobjecten en grafieken die fundamenteel zijn voor Dataiku DSS
  • Wat is een recept in Dataiku DSS?
  • Typen datasets die door Dataiku DSS worden ondersteund

Een Dataiku DSS-project maken

Datasets definiëren om verbinding te maken met data-ressourcen in Dataiku DSS

  • Werken met DSS-connectors en bestandsindelingen
  • Standaard DSS-indelingen versus Hadoop-specifieke indelingen
  • Bestanden uploaden voor een Dataiku DSS-project

Overzicht van het serverbestandssysteem in Dataiku DSS

Beheerde mappen maken en gebruiken

  • Dataiku DSS-recept voor een samengvoegde map
  • Lokale versus niet-lokale beheerde mappen

Een bestandssysteemdataset construeren met behulp van inhoud van beheerde mappen

  • Opruimen met een DSS-code-recept

Werken met Metrics Dataset en Internal Stats Dataset

Het DSS Download-recept implementeren voor HTTP Dataset

SQL-datasets en HDFS-datasets verplaatsen met behulp van DSS

Datasets in Dataiku DSS ordenen

  • Schrijfvolgorde versus leesvolgorde

Data visuals voor een Dataiku DSS-project verkennen en voorbereiden

Overzicht van Dataiku-schema's, opslagtypen en betekenissen

Data-opschoning, normalisatie en verrijkingsscripts uitvoeren in Dataiku DSS

Werken met de Dataiku DSS Charts-interface en typen visuele aggregaties

Het interactieve statistiekenfunctie van DSS gebruiken

  • Univariante analyse versus bivariante analyse
  • Gebruik maken van het Principal Component Analysis (PCA) DSS-gereedschap

Overzicht van machine learning met Dataiku DSS

  • Supervised ML versus unsupervised ML
  • Referenties voor DSS ML-algoritmen en functies
  • Deep Learning met Dataiku DSS

Overzicht van de flow afgeleid van DSS-datasets en recepten

Bestaande datasets in DSS transformeren met visuele recepten

DSS-recepten gebruiken op basis van door gebruikers gedefinieerde code

Code-exploratie en -experimentatie optimaliseren met DSS-codeblokken

Geavanceerde DSS-visualisaties en aangepaste frontend-functies schrijven met Webapps

Werken met de DSS Code Reports-functie

Data-projectelementen delen en vertrouwd raken met het DSS-dashboard

Een Dataiku DSS-project ontwerpen en pakketteren als een herbruikbare toepassing

Overzicht van geavanceerde methoden in Dataiku DSS

  • Geoptimaliseerde datasets-partitionering implementeren met behulp van DSS
  • Specifieke DSS-verwerkingsdelen uitvoeren via berekeningen in Kubernetes-containers

Overzicht van samenwerking en versiebeheer in Dataiku DSS

Automatiseringscenario's, metingen en controles implementeren voor DSS-projecttesten

Een project implementeren en updaten met behulp van de DSS-automatisatieknooppunt en bundels

Werken met real-time APIs in Dataiku DSS

  • Extra APIs en Rest APIs in DSS

Dataiku DSS-tijdseries analyseren en voorspellen

Een project in Dataiku DSS beveiligen

  • Projecttoestemmingen en dashboardautorisaties beheren
  • Geavanceerde beveiligingsopties implementeren

Dataiku DSS integreren met de Cloud

Problemen oplossen

Samenvatting en conclusie

Vereisten

  • Ervaring met Python, SQL en R programmeertalen
  • Basiskennis van gegevensverwerking met Apache Hadoop en Spark
  • Begrip van machine learning concepten en data modellen
  • Achtergrond in statistische analysen en data science concepten
  • Ervaring met het visualiseren en communiceren van gegevens

Publiek

  • Ingenieurs
  • Data Scientists
  • Data Analisten
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Voorlopige Aankomende Cursussen

Gerelateerde categorieën