Cursusaanbod

Inleiding tot de Stratio Platform

  • Overzicht van de Stratio-architectuur en kernmodules
  • De rol van Rocket en Intelligence in de datalevenscyclus
  • Inloggen en navigeren in de Stratio UI

Werken met de Rocket Module

  • Gegevensinname en pipeline-creatie
  • Verbinden van gegevensbronnen en transformaties configureren
  • Gebruik van PySpark voor voorafgaande bewerkingen in Rocket

PySpark Essentials voor Stratio Gebruikers

  • PySpark gegevensstructuren en operaties
  • Lussenconstructies: voor, terwijl, als/anders gebruik
  • Aanmaken van aangepaste functies met def en toepassen

Geavanceerd Gebruik van Rocket met PySpark

  • Streaming-inname en transformaties
  • Gebruik van lussen en functies in batch- en real-time scenario's
  • Beste praktijken voor prestaties in PySpark pipelines

Onderzoeken van de Intelligence Module

  • Overzicht van gegevensmodellering en analysefuncties
  • Kenmerkselectie, transformatie en exploratie
  • De rol van PySpark bij aangepaste analyses en inzichten

Bouwen van Geavanceerde Analytics Workflows

  • Aanmaken van door gebruikers gedefinieerde functies (UDFs) in Intelligence
  • Toepassen van voorwaarden en lussen voor gegevenslogica
  • Toepassingen: segmentatie, aggregatie en voorspelling

Implementatie en Collaboration

  • Opslaan, exporteren en hergebruiken van workflows
  • Samenwerken met andere teamleden in Stratio
  • Overzicht van de output en integratie met downstream tools

Samenvatting en Volgende Stappen

Vereisten

  • Ervaring met Python programmeren
  • Begrip van data-analyse of big data-verwerkingsconcepten
  • Basiskennis van Apache Spark en verdeeld rekenen

Publiek

  • Data-ingenieurs die werken met Stratio-gebaseerde platforms
  • Analisten of ontwikkelaars die de Rocket- en Intelligence-modules gebruiken
  • Technische teams die overstappen naar PySpark workflows binnen Stratio
 14 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën