Cursusaanbod
Introductie
Begrijpen Big Data
Overzicht van Spark
Overzicht van Python
Overzicht van PySpark
- Gegevens distribueren met behulp van een veerkrachtig framework voor gedistribueerde datasets
- Berekeningen distribueren met behulp van Spark API-operators
Instellen Python met Spark
Instellen PySpark
Amazon Web Services (AWS) EC2-instanties gebruiken voor Spark
Instellen Databricks
Opzetten van het AWS EMR cluster
De basis leren van Python Programming
- Aan de slag met Python
- Het Jupyter-notebook gebruiken
- Variabelen en eenvoudige gegevenstypen gebruiken
- Werken met lijsten
- if-instructies gebruiken
- Gebruikersinvoer gebruiken
- Werken met while Loops
- Functies implementeren
- Werken met klassen
- Werken met bestanden en uitzonderingen
- Werken met projecten, gegevens en API's
De basisprincipes van Spark DataFrame leren
- Aan de slag met Spark DataFrames
- Basisbewerkingen implementeren met Spark
- Groupby- en aggregatiebewerkingen gebruiken
- Werken met tijdstempels en datums
Werken aan een Spark DataFrame-projectoefening
Begrijpen Machine Learning met MLlib
Werken met MLlib, Spark en Python voor Machine Learning
Regressies begrijpen
- Lineaire regressietheorie leren
- Implementatie van een Regressie Evaluatie Code
- Werken aan een voorbeeld van lineaire regressieoefening
- Logistische regressietheorie leren
- Implementeren van een logistieke regressiecode
- Werken aan een voorbeeld van logistische regressieoefening
Inzicht in Random Forests en beslissingsbomen
- Leerboom Methoden Theorie
- Uitvoeringsbesluitbomen en Random Forest codes
- Werken aan een steekproef Random Forest classificatieoefening
Werken met K-betekent Clusteren
- Inzicht in K-means Clustering Theorie
- Implementeren van een K-means Clustering Code
- Werken aan een voorbeeld van een clusteroefening
Werken met aanbevelingssystemen
Implementatie van natuurlijke taalverwerking
- Begrijpen Natural Language Processing (NLP)
- Overzicht van NLP Tools
- Werken aan een voorbeeld van NLP-oefening
Streamen met Spark aan Python
- Overzicht Streamen met Spark
- Voorbeeld Spark Streaming Oefening
Slotwoord
Vereisten
- Algemene programmeervaardigheden
Audiëntie
- Ontwikkelaars
- IT-professionals
- Datawetenschappers
Getuigenissen (6)
Ik vond het fijn dat het praktisch was. Ik hield ervan om de theoretische kennis toe te passen met praktijkvoorbeelden.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
De curs ging over een reeks zeer complexe en onderling verbonden onderwerpen, waar Pablo diepgaande expertise in heeft. Soms gingen nuances verloren bij de communicatie en/of vanwege tijdsdruk, waardoor de verwachtingen mogelijk niet helemaal werden ingehouden. Er waren ook enkele UHG/Azure Databricks instellingsproblemen, maar Pablo en UHG losten deze snel op zodra ze duidelijk werden - dit toonde volgens mij een hoge graad van begrip en professionaliteit tussen UHG en Pablo,
Michael Monks - Tech NorthWest Skillnet
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Persoonlijke aandacht.
ARCHANA ANILKUMAR - PPL
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Praktijkgericht onderwijs..
Abraham Thomas - PPL
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
De lessen werden gegeven in een Jupyter notebook. De onderwerpen waren gestructureerd met een logische volgorde en hielpen natuurlijk bij het ontwikkelen van de sessie, van de eenvoudigere delen naar de complexere. Ik ben al een gevorderd Python-gebruiker met een achtergrond in Machine Learning, dus vond ik het cursus makkelijker te volgen dan mogelijk sommige van mijn klasgenoten die de opleiding hebben gevolgd. Ik waardeer dat enkele van de meest elementaire concepten werden overgeslagen en dat hij zich richtte op de belangrijkste zaken.
Angela DeLaMora - ADT, LLC
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
oefeningstaken
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald