Course Outline

Inleiding tot Programming Big Data met R (bpdR)

  • Uw omgeving instellen voor het gebruik van pbdR
  • Reikwijdte en hulpmiddelen beschikbaar in pbdR
  • Pakketten die vaak worden gebruikt met Big Data naast pbdR

Interface voor het doorgeven van berichten (MPI)

  • PbdR MPI gebruiken 5
  • Parallelle verwerking
  • Point-to-point communicatie
  • Matrixen verzenden
  • Optelmatrices
  • Collectieve communicatie
  • Matrices optellen met Reduce
  • Verstrooien/verzamelen
  • Andere MPI-communicatie

Gedistribueerde matrixen

  • Een gedistribueerde diagonale matrix creëren
  • SVD van een gedistribueerde matrix
  • Parallel bouwen van een gedistribueerde matrix

Statistics Toepassingen

  • Monte Carlo-integratie
  • Gegevenssets lezen
  • Lezen over alle processen
  • Uitzenden vanuit één proces
  • Gepartitioneerde gegevens lezen
  • Gedistribueerde regressie
  • Gedistribueerd Bootstrap
 21 Hours

Number of participants



Price per participant

Getuigenissen (2)

Related Courses

Introduction to Data Visualization with Tidyverse and R

7 Hours

Data Vault: Building a Scalable Data Warehouse

28 Hours

Spark Streaming with Python and Kafka

7 Hours

Confluent KSQL

7 Hours

Apache Ignite for Developers

14 Hours

Unified Batch and Stream Processing with Apache Beam

14 Hours

Apache Apex: Processing Big Data-in-Motion

21 Hours

Apache Storm

28 Hours

Apache NiFi for Administrators

21 Hours

Apache NiFi for Developers

7 Hours

Apache Flink Fundamentals

28 Hours

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Related Categories

1