Course Outline

Introductie

  • Overzicht van de functies en architectuur van Spark en Hadoop
  • Inzicht in big data
  • Python Basisprincipes van programmeren

Slag

  • Instellen van Python, Spark en Hadoop
  • Inzicht in datastructuren in Python
  • Inzicht in PySpark API
  • Inzicht in HDFS en MapReduce

Integratie van Spark en Hadoop met Python

  • Spark RDD implementeren in Python
  • Gegevens verwerken met MapReduce
  • Gedistribueerde gegevenssets maken in HDFS

Machine Learning met Spark MLlib

Verwerken Big Data met Spark Streaming

Werken met aanbevelingssystemen

Werken met Kafka, Sqoop, Kafka en Flume

Apache Mahout met Spark en Hadoop

Probleemoplossing

Samenvatting en volgende stappen

Requirements

  • Ervaring met Spark en Hadoop
  • Python programmeerervaring

Publiek

  • Datawetenschappers
  • Ontwikkelaars
 21 Hours

Number of participants



Price per participant

Getuigenissen (2)

Related Courses

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Data Analysis with Python, Pandas and Numpy

14 Hours

Accelerating Python Pandas Workflows with Modin

14 Hours

Machine Learning with Python and Pandas

14 Hours

Scaling Data Analysis with Python and Dask

14 Hours

FARM (FastAPI, React, and MongoDB) Full Stack Development

14 Hours

Developing APIs with Python and FastAPI

14 Hours

Scientific Computing with Python SciPy

7 Hours

Game Development with PyGame

7 Hours

Web application development with Flask

14 Hours

Advanced Flask

14 Hours

Build REST APIs with Python and Flask

14 Hours

Related Categories

1