Plan du cours

Introduction

  • Vue d'ensemble de Databricks et Apache Spark
  • Comprendre l'architecture Databricks

Pour commencer

  • Mise en place de l'environnement
  • Mise en place et configuration de Databricks
  • Naviguer dans l'interface utilisateur Databricks
  • Créer un espace de travail Databricks

Travailler avec des données dans Databricks

  • Connexion à une source de données Apache Spark
  • Comprendre les bases des colonnes et des types de données
  • Gérer le système de fichiers dans les Notebooks

Gestion des emplois et des grappes

  • Créer et configurer des clusters
  • Création de tâches à l'aide du Notebook
  • Exécution des tâches
  • Affichage des travaux et de leurs détails

Utilisation du lac Delta dans Databricks

  • Chargement des données dans Delta Lake
  • Gestion des données dans Delta Lake

Sécurisation Databricks

  • Gestion de la sécurité Databricks
  • Gestion de la sauvegarde et de la restauration

Dépannage

Résumé et prochaines étapes

Pré requis

  • Compréhension de base de l'analyse des données
  • Connaissance de Apache Spark

Audience

  • Ingénieurs de données
  • Data Scientists
  • Développeurs
 14 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (1)

Cours Similaires

Analytic Functions Fundamentals

21 heures

Apache Arrow for Data Analysis across Disparate Data Sources

14 heures

AWS Glue Fundamentals

14 heures

Azure for Data Engineer

35 heures

A Practical Introduction to Data Analysis and Big Data

35 heures

Data and Analytics - from the ground up

42 heures

Scaling Data Analysis with Python and Dask

14 heures

Data Analysis for Marketers

14 heures

Data Analytics With R

21 heures

Datameer for Data Analysts

14 heures

Data Analysis with Python, Pandas and Numpy

14 heures

A Practical Introduction to Data Science

35 heures

Introduction to dbt Cloud

21 heures

Dremio for Self-Service Data Analysis

21 heures

Elasticsearch for Developers

14 heures

Catégories Similaires

1