Cursusaanbod
Introductie
Begrijpen Big Data
Overzicht van Spark
Overzicht van Python
Overzicht van PySpark
- Gegevens distribueren met behulp van een veerkrachtig framework voor gedistribueerde datasets
- Berekeningen distribueren met behulp van Spark API-operators
Instellen Python met Spark
Instellen PySpark
Amazon Web Services (AWS) EC2-instanties gebruiken voor Spark
Instellen Databricks
Opzetten van het AWS EMR cluster
De basis leren van Python Programming
- Aan de slag met Python
- Het Jupyter-notebook gebruiken
- Variabelen en eenvoudige gegevenstypen gebruiken
- Werken met lijsten
- if-instructies gebruiken
- Gebruikersinvoer gebruiken
- Werken met while Loops
- Functies implementeren
- Werken met klassen
- Werken met bestanden en uitzonderingen
- Werken met projecten, gegevens en API's
De basisprincipes van Spark DataFrame leren
- Aan de slag met Spark DataFrames
- Basisbewerkingen implementeren met Spark
- Groupby- en aggregatiebewerkingen gebruiken
- Werken met tijdstempels en datums
Werken aan een Spark DataFrame-projectoefening
Begrijpen Machine Learning met MLlib
Werken met MLlib, Spark en Python voor Machine Learning
Regressies begrijpen
- Lineaire regressietheorie leren
- Implementatie van een Regressie Evaluatie Code
- Werken aan een voorbeeld van lineaire regressieoefening
- Logistische regressietheorie leren
- Implementeren van een logistieke regressiecode
- Werken aan een voorbeeld van logistische regressieoefening
Inzicht in Random Forests en beslissingsbomen
- Leerboom Methoden Theorie
- Uitvoeringsbesluitbomen en Random Forest codes
- Werken aan een steekproef Random Forest classificatieoefening
Werken met K-betekent Clusteren
- Inzicht in K-means Clustering Theorie
- Implementeren van een K-means Clustering Code
- Werken aan een voorbeeld van een clusteroefening
Werken met aanbevelingssystemen
Implementatie van natuurlijke taalverwerking
- Begrijpen Natural Language Processing (NLP)
- Overzicht van NLP Tools
- Werken aan een voorbeeld van NLP-oefening
Streamen met Spark aan Python
- Overzicht Streamen met Spark
- Voorbeeld Spark Streaming Oefening
Slotwoord
Vereisten
- Algemene programmeervaardigheden
Audiëntie
- Ontwikkelaars
- IT-professionals
- Datawetenschappers
Testimonials (6)
Ik vond het praktisch. Het was geweldig om de theoretische kennis toe te passen met praktische voorbeelden.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
De cursus ging over een reeks zeer complexe onderwerpen die met elkaar verbonden zijn en Pablo heeft in-diepte kennis van elk van deze onderwerpen. Soms gingen nuances verloren in de communicatie en/of door tijdsdruk, en mogelijk werden verwachtingen daarom niet helemaal ingelost. Er waren ook enkele UHG/Azure Databricks instellingproblemen, maar Pablo/UHG lossen deze snel op zodra ze duidelijk werden - dit toonde voor mij een hoog niveau van begrip en professionaliteit tussen UHG en Pablo,
Michael Monks - Tech NorthWest Skillnet
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Individuele aandacht.
ARCHANA ANILKUMAR - PPL
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Praktijkgerichte opleiding..
Abraham Thomas - PPL
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
De lessen werden gegeven in een Jupyter notebook. De onderwerpen waren logisch opgebouwd en hielpen op een natuurlijke manier de sessie te ontwikkelen van de makkelijkste delen naar de complexere. Ik ben al een geavanceerde gebruiker van Python met een achtergrond in Machine Learning, dus vond ik de cursus makkelijker te volgen dan, mogelijk, sommige van mijn medestudenten die de training volgden. Ik waardeer dat sommige van de meest elementaire concepten overgeslagen werden en dat hij zich richtte op de meest substantiële zaken.
Angela DeLaMora - ADT, LLC
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
oefeningopdrachten
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald