Cursusaanbod
Inleiding
Overzicht van toegangsbenaderingen voor gegevens (Hive, databases, etc.)
Overzicht van Spark-functies en -architectuur
Installeren en configureren van Spark
Begrijpen van DataFrames in Spark
Tabels definiëren en datasets importeren
Data Frames opvragen met SQL
Agrgregaties, JOINs en geneste query's uitvoeren
Gegevens uploaden en toegankelijk maken
Verschillende soorten gegevens opvragen
- JSON, Parquet, etc.
Data Lakes opvragen met SQL
Probleemoplossing
Samenvatting en conclusie
Vereisten
- Erfaring met SQL-query's
- Programmeerervaring in een willekeurige taal
Doelgroep
- Data-analisten
- Data-scientists
- Data-engineers
Getuigenissen (3)
De oefeningen en de uitwisseling tijdens de vragen- en antwoorden sessies
Antoine - Physiobotic
Cursus - Scaling Data Pipelines with Spark NLP
Automatisch vertaald
Ik vond het fijn dat het praktisch was. Ik hield ervan om de theoretische kennis toe te passen met praktijkvoorbeelden.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Het feit dat we de meeste informatie, cursussen, presentaties en oefeningen mee konden nemen, zodat we ze kunnen doornemen en eventueel herhalen wat we het eerste keer niet begrepen of verbeteren wat we al gedaan hebben.
Raul Mihail Rat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald