Cursusaanbod

Inleiding

  • Inleiding tot Cloud Computing en Big Data-oplossingen
  • Overzicht van de functies en architectuur van Apache Hadoop

  • Hadoop instellen

    • Een Hadoop-cluster plannen (on-premise, cloud, etc.)
    • Het besturingssysteem en de Hadoop-distributie selecteren
    • Resources inrichten (hardware, netwerk, etc.)
    • Software downloaden en installeren
    • Het cluster voor flexibiliteit dimensioneren

    • Meten met HDFS

      • Hadoop Distributed File System (HDFS) begrijpen
      • Overzicht van de HDFS Command Reference
      • Toegang tot HDFS krijgen
      • Basisbestandsoperaties uitvoeren op HDFS
      • S3 gebruiken als aanvulling op HDFS

      • Overzicht van MapReduce

        • Dataflow in het MapReduce-framework begrijpen
        • Map, Shuffle, Sort en Reduce
        • Demo: Top salarissen berekenen

        • Meten met YARN

          • Resourcebeheer in Hadoop begrijpen
          • Werken met ResourceManager, NodeManager en Application Master
          • Taken plannen onder YARN
          • Taken plannen voor grote aantallen knooppunten en clusters
          • Demo: Taakplanning

          • Hadoop integreren met Spark

            • Opslag voor Spark inrichten (HDFS, Amazon S3, NoSQL, etc.)
            • Resilient Distributed Datasets (RDDs) begrijpen
            • Een RDD maken
            • RDD-transformaties implementeren
            • Demo: Een tekstzoekprogramma voor filmtitels implementeren

            • Een Hadoop-cluster beheren

              • Hadoop monitoreren
              • Een Hadoop-cluster beveiligen
              • Knooppunten toevoegen en verwijderen
              • Een prestatietest uitvoeren
              • Een Hadoop-cluster afstellen om de prestaties te optimaliseren
              • Back-up, herstel en business continuity plannen
              • Hoge beschikbaarheid (HA) garanderen

              • Een Hadoop-cluster upgraden en migreren

                • Workloadvereisten beoordelen
                • Hadoop upgraden
                • Van on-premise naar cloud en vice versa verhuizen
                • Herstellen van uitval

                • Problemen oplossen

                  Samenvatting en conclusie

Vereisten

  • Systeembronbeheerders ervaring
  • Erfaring met Linux command line
  • Inzicht in big data concepten

Doelgroep

  • Systeembeheerders
  • DBAs
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën