Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Introductie:
- Apache Spark in Hadoop Ecosysteem
- Korte intro voor python, scala
Basis (theorie):
- Architectuur
- RDD
- Transformatie en acties
- Fase, taak, afhankelijkheden
Met behulp van Databricks omgeving begrijp je de basis (hands-on workshop):
- Oefeningen met behulp van RDD API
- Basisfuncties voor actie en transformatie
- PairRDD
- Verbinden
- Strategieën voor caching
- Oefeningen met behulp van de DataFrame-API
- VonkSQL
- DataFrame: selecteren, filteren, groeperen, sorteren
- UDF (door de gebruiker gedefinieerde functie)
- Kijken naar DataSet API
- Streaming
Met behulp van AWS-omgeving inzicht in de implementatie (hands-on workshop):
- Basisprincipes van AWS-lijm
- Begrijp de verschillen tussen AWS EMR en AWS Glue
- Voorbeeldtaken in beide omgevingen
- Begrijp de voor- en nadelen
Extra:
- Inleiding tot Apache Airflow orkestratie
Vereisten
Programmeervaardigheden (bij voorkeur Python, Scala)
SQL basis
21 Uren
Testimonials (3)
Heeft hands-on sessies / opdrachten.
Poornima Chenthamarakshan - Intelligent Medical Objects
Cursus - Apache Spark in the Cloud
Automatisch vertaald
1. Juiste balans tussen hogere concepten en technische details. 2. Andras is zeer deskundig over zijn onderwijs. 3. Oefening
Steven Wu - Intelligent Medical Objects
Cursus - Apache Spark in the Cloud
Automatisch vertaald
Leer spark streaming, databricks en aws redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Cursus - Apache Spark in the Cloud
Automatisch vertaald