Course Outline

Invoering

Begrijpen Big Data

Overzicht van Spark

Overzicht van Python

Overzicht van PySpark

  • Gegevens distribueren met behulp van het veerkrachtige gedistribueerde datasetsframework
  • Berekening distribueren met behulp van Spark API-operators

Instellen Python met Spark

Opstellen PySpark

Met behulp van Amazon Web Services (AWS) EC2-instanties voor Spark

Opstellen Databricks

Het AWS EMR-cluster opzetten

De basisbeginselen leren van Python Programming

  • Aan de slag met Python
  • Het Jupyter-notebook gebruiken
  • Variabelen en eenvoudige gegevenstypen gebruiken
  • Werken met lijsten
  • If-instructies gebruiken
  • Gebruikersinvoer gebruiken
  • Werken met while-lussen
  • Functies implementeren
  • Werken met klassen
  • Werken met bestanden en uitzonderingen
  • Werken met projecten, gegevens en API's

Leer de basisprincipes van Spark DataFrame

  • Aan de slag met Spark DataFrames
  • Basisbewerkingen implementeren met Spark
  • Groupby- en aggregatiebewerkingen gebruiken
  • Werken met tijdstempels en datums

Werken aan een Spark DataFrame-projectoefening

Machine Learning begrijpen met MLlib

Werken met MLlib, Spark en Python voor Machine Learning

Regressies begrijpen

  • Lineaire regressietheorie leren
  • Implementatie van een regressie-evaluatiecode
  • Werken aan een voorbeeld van een lineaire regressieoefening
  • Logistieke regressietheorie leren
  • Implementatie van een logistieke regressiecode
  • Werken aan een voorbeeld van een logistieke regressieoefening

Inzicht in Random Forests en beslissingsbomen

  • Boommethodentheorie leren
  • Implementatie van beslisbomen en Random Forest codes
  • Werken aan een voorbeeld Random Forest Classificatie-oefening

Werken met K- betekent Clusteren

  • Het begrijpen van K-betekent Clustering Theorie
  • Het implementeren van een K-means Clustering Code
  • Werken aan een voorbeeld van een clusteroefening

Werken met aanbevelingssystemen

Implementatie van natuurlijke taalverwerking

  • Begrijpen Natural Language Processing (NLP)
  • Overzicht van NLP-tools
  • Werken aan een voorbeeld NLP-oefening

Streamen met Spark aan Python

  • Overzicht Streamen met Spark
  • Voorbeeld Spark Streaming Oefening

Slotopmerkingen

Requirements

  • Algemene programmeervaardigheden

Publiek

  • Ontwikkelaars
  • IT-professionals
  • Datawetenschappers
 21 Hours

Number of participants



Price per participant

Getuigenissen (2)

Related Courses

Data Analysis with Python, Pandas and Numpy

14 Hours

Accelerating Python Pandas Workflows with Modin

14 Hours

Machine Learning with Python and Pandas

14 Hours

Scaling Data Analysis with Python and Dask

14 Hours

FARM (FastAPI, React, and MongoDB) Full Stack Development

14 Hours

Developing APIs with Python and FastAPI

14 Hours

Scientific Computing with Python SciPy

7 Hours

Game Development with PyGame

7 Hours

Web application development with Flask

14 Hours

Advanced Flask

14 Hours

Build REST APIs with Python and Flask

14 Hours

GUI Programming with Python and Tkinter

14 Hours

Kivy: Building Android Apps with Python

7 Hours

GUI Programming with Python and PyQt

21 Hours

Web Development with Web2Py

28 Hours

Related Categories

1