Lokale, door instructeurs geleide live Apache Spark-trainingscursussen demonstreren door praktische oefening hoe Spark past in het Big Data-ecosysteem en hoe Spark kan worden gebruikt voor data-analyse. Apache Spark-training is beschikbaar als 'live training op afstand' of 'live training op locatie'. Online live training (ook bekend als "live training op afstand") wordt uitgevoerd via een interactieve, externe desktop . Live training op locatie kan lokaal worden uitgevoerd op het terrein van de klant in Leuven of in bedrijfstrainingscentra van NobleProg in Leuven. NobleProg -- Uw lokale trainingsaanbieder
Leuven
Park Inn by Radisson Leuven, Martelarenlaan 36, Louvain, België, 3010
Leuven
Leuven (in het Nederlands Leuven, in het Duits Löwen) is een Nederlandstalige stad in B...
Leuven
Leuven (in het Nederlands Leuven, in het Duits Löwen) is een Nederlandstalige stad in België gelegen in het Vlaamse Gewest, hoofdstad van de provincie Vlaams-Brabant en hoofdstad van het district dat zijn naam draagt. Het wordt bewaterd door de Dijle, een zijrivier van de Rupel. Het is een universiteitsstad waar de Katholieke Universiteit Leuven is gevestigd, een Nederlandstalige tak ontstaan uit de splitsing van de oudste universiteit van België. Leuven staat ook bekend om het hoofdkantoor van AB InBev, de grootste brouwerij ter wereld. Leuven is de bierhoofdstad van België.
De dichtstbijzijnde luchthaven bij het trainingscentrum
15 kilometer ten oosten van de luchthaven van Brussel.
Dichtstbijzijnde treinstation bij het trainingscentrum
station Leuven
De dichtstbijzijnde parkeerplaats bij het trainingscentrum
Deze door een instructeur geleide, live training in Leuven (op locatie of op afstand) is gericht op ontwikkelaars die Spark, Hadoop en Python willen gebruiken en integreren om grote en complexe datasets te verwerken, analyseren en transformeren.Aan het einde van deze training kunnen deelnemers:
Zet de benodigde omgeving op om big data te gaan verwerken met Spark, Hadoop en Python.
Begrijp de functies, kerncomponenten en architectuur van Spark en Hadoop.
Leer hoe u Spark, Hadoop en Python kunt integreren voor de verwerking van big data.
Ontdek de tools in het Spark-ecosysteem (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka en Flume).
Bouw aanbevelingssystemen voor samenwerkingsfilters, vergelijkbaar met Netflix, YouTube, Amazon, Spotify en Google.
Gebruik Apache Mahout om machine learning-algoritmen te schalen.
Deze live training onder leiding van een instructeur in Leuven (online of op locatie) is bedoeld voor beginnende tot gemiddelde systeembeheerders die Spark-clusters willen implementeren, onderhouden en optimaliseren.Aan het einde van deze training zijn de deelnemers in staat om:
Installeer en configureer Apache Spark in verschillende omgevingen.
Clusterresources beheren en Spark-toepassingen bewaken.
Optimaliseer de prestaties van Spark-clusters.
Implementeer beveiligingsmaatregelen en zorg voor een hoge beschikbaarheid.
Veelvoorkomende problemen met Spark opsporen en oplossen.
In deze door een instructeur geleide, live training leren deelnemers hoe ze Python en Spark samen kunnen gebruiken om big data te analyseren terwijl ze aan praktische oefeningen werken.Aan het einde van deze training kunnen deelnemers:
Leer hoe u Spark met Python kunt gebruiken om Big Data te analyseren.
Werk aan oefeningen die praktijkgevallen nabootsen.
Gebruik verschillende tools en technieken voor big data-analyse met PySpark.
Big data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken. De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving. In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen. Aan het einde van deze training kunnen deelnemers:
Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
Begrijp de kenmerken van medische gegevens
Pas big data-technieken toe om met medische gegevens om te gaan
Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen
Publiek
ontwikkelaars
Data Scientists
Indeling van de cursus
Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.
Notitie
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Deze instructeur-geleide, live training in Leuven (op locatie of op afstand) is gericht op systeembeheerders die willen leren hoe ze clusters binnen hun organisatie kunnen opzetten, implementeren en beheren.Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apache Hadoop.
Begrijp de vier belangrijkste componenten in het Hadoop-ecosysteem: HDFS, MapReduce, YARN en Hadoop Common.
Gebruik Hadoop Distributed File System (HDFS) om een cluster te schalen naar honderden of duizenden knooppunten.
Stel HDFS in om te functioneren als opslagengine voor on-premise Spark-implementaties.
Stel Spark in voor toegang tot alternatieve opslagoplossingen zoals Amazon S3 en NoSQL databasesystemen zoals Redis, Elasticsearch, Couchbase, Aerospike, enz.
Voer administratieve taken uit zoals het inrichten, beheren, monitoren en beveiligen van een Apache Hadoop-cluster.
Deze door een instructeur geleide, live training in Leuven (op locatie of op afstand) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.Aan het einde van deze training kunnen deelnemers:
Gebruik Hortonworks om Hadoop betrouwbaar op grote schaal uit te voeren. Verenig de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark. Gebruik Hortonworks om elk onderdeel van een Spark-project te onderzoeken, valideren, certificeren en ondersteunen. Verwerk verschillende soorten gegevens, waaronder gestructureerd, ongestructureerd, in beweging en in rust.
In deze door een instructeur geleide, live training in Leuven (op locatie of op afstand), leren deelnemers hoe ze verschillende Stream Processing raamwerken kunnen opzetten en integreren met bestaande big data-opslagsystemen en gerelateerde softwareapplicaties en microservices.Aan het einde van deze training kunnen deelnemers:
Installeer en configureer verschillende Stream Processing frameworks, zoals Spark Streaming en Kafka Streaming.
Begrijp en selecteer het meest geschikte raamwerk voor de taak.
Verwerken van gegevens continu, gelijktijdig en record voor record.
Integreer Stream Processing oplossingen met bestaande databases, datawarehouses, datameren, enz.
Integreer de meest geschikte bibliotheek voor streamverwerking met bedrijfsapplicaties en microservices.
Magellan is een open-source gedistribueerde uitvoeringssysteem voor geospatiale analyse van big data. Geïmplementeerd boven Apache Spark, breidt het Spark SQL uit en biedt een relatieve abstractie voor geospatiale analyses.
Deze instructeur geleide, live training introduceert de concepten en benaderingen voor de implementatie van geospatiale analyses en wandelt deelnemers door middel van de creatie van een predictieve analyse toepassing met behulp van Magellan op Spark.
Aan het einde van deze training zullen de deelnemers in staat zijn:
Efficiënt zoeken, parsen en deelgenomen geospatiale dataset op schaal
Implementatie van geospatiale gegevens in business intelligence en predictive analytics toepassingen
Gebruik ruimtecontext om de capaciteiten van mobiele apparaten, sensoren, logs en draagbare apparaten uit te breiden
Format van de cursus
Interactieve lezingen en discussie.
Veel oefeningen en oefeningen.
Hand-on implementatie in een live-lab-omgeving.
Cursus aanpassingsopties
Om een aangepaste training voor deze cursus te vragen, neem dan contact met ons op om te organiseren.
Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op ontwikkelaars die big data-analyse willen uitvoeren met behulp van Apache Spark in hun .NET-applicaties.Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apache Spark.
Begrijp hoe .NET Spark API's implementeert, zodat ze toegankelijk zijn vanuit een .NET-applicatie.
Ontwikkel applicaties voor gegevensverwerking met behulp van C# of F#, die datasets kunnen verwerken waarvan de grootte wordt gemeten in terabytes en pedabytes.
Ontwikkel machine learning-functies voor een .NET-toepassing met behulp van Apache Spark-mogelijkheden.
Voer verkennende analyses uit met behulp van SQL queries op big datasets.
Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op datawetenschappers die de SMACK-stack willen gebruiken om dataverwerkingsplatforms voor big data-oplossingen te bouwen.Aan het einde van deze training kunnen deelnemers:
Implementeer een datapijplijnarchitectuur voor het verwerken van big data.
Ontwikkel een clusterinfrastructuur met Apache Mesos en Docker.
Analyseer gegevens met Spark en Scala.
Beheer ongestructureerde gegevens met Apache Cassandra.
Deze instructeur-geleide, live training in Leuven (op locatie of op afstand) is gericht op ingenieurs die een Apache Spark systeem willen opzetten en implementeren voor het verwerken van zeer grote hoeveelheden gegevens.Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Apache Spark.
Verwerk en analyseer snel zeer grote datasets.
Begrijp het verschil tussen Apache Spark en Hadoop MapReduce en wanneer u welke moet gebruiken.
Integreer Apache Spark met andere machine learning-tools.
Apache Spark leercurve van Apache Spark neemt in het begin langzaam toe, het kost veel inspanning om het eerste rendement te behalen. Deze cursus is bedoeld om door het eerste moeilijke gedeelte te springen. Na het volgen van deze cursus zullen de deelnemers de basisprincipes van Apache Spark begrijpen, ze zullen RDD duidelijk onderscheiden van DataFrame, ze zullen Python en Scala API leren kennen, ze zullen uitvoerders en taken begrijpen, etc. Ook volgens de best practices richt deze cursus zich sterk op cloud-implementatie, Databricks en AWS. De studenten zullen ook de verschillen begrijpen tussen AWS EMR en AWS Glue, een van de nieuwste Spark-services van AWS. PUBLIEK: Data Engineer, DevOps , Data Scientist
DOELSTELLING: Deze cursus introduceert Apache Spark . De studenten leren hoe Spark past in het Big Data ecosysteem en hoe Spark gebruikt kan worden voor data-analyse. De cursus behandelt Spark shell voor interactieve gegevensanalyse, Spark internals, Spark API's, Spark SQL , Spark streaming en machine learning en graphX. PUBLIEK : Ontwikkelaars / gegevensanalisten
Deze door een instructeur geleide, live training (op locatie of op afstand) is gericht op datawetenschappers en ontwikkelaars die Spark NLP, gebouwd bovenop Apache Spark, willen gebruiken om modellen voor tekstverwerking in natuurlijke taal te ontwikkelen, implementeren en schalen en pijpleidingen.Aan het einde van deze training kunnen deelnemers:
Zet de noodzakelijke ontwikkelomgeving op om NLP-pijplijnen te bouwen met Spark NLP.
Begrijp de functies, architectuur en voordelen van het gebruik van Spark NLP.
Gebruik de vooraf getrainde modellen die beschikbaar zijn in Spark NLP om tekstverwerking te implementeren.
Leer hoe u modellen bouwt, traint en schaalt Spark NLP voor productieprojecten.
Pas classificatie, gevolgtrekkingen en sentimentanalyse toe op praktijkvoorbeelden (klinische gegevens, inzichten in klantgedrag, enz.).
Deze instructeur-geleide, live training in Leuven (op locatie of op afstand) is gericht op software-ingenieurs die big data willen streamen met Spark Streaming en Scala.Aan het einde van deze training kunnen deelnemers:
Maak Spark-applicaties met de programmeertaal Scala.
Gebruik Spark Streaming om continue gegevensstromen te verwerken.
Verwerk stromen van realtime gegevens met Spark Streaming.
Spark SQL is de module van Apache Spark voor het werken met gestructureerde en ongestructureerde gegevens. Spark SQL geeft informatie over de structuur van de gegevens en de berekeningen die worden uitgevoerd. Deze informatie kan worden gebruikt om optimalisaties uit te voeren. Twee veel voorkomende toepassingen voor Spark SQL zijn: - om SQL query's uit te voeren. - om gegevens van een bestaande Hive installatie te lezen. In deze door een instructeur geleide, live training (op locatie of op afstand), leren deelnemers hoe ze verschillende soorten gegevenssets kunnen analyseren met Spark SQL . Aan het einde van deze training kunnen deelnemers:
Installeer en configureer Spark SQL .
Voer gegevensanalyse uit met Spark SQL .
Query-gegevenssets in verschillende indelingen.
Visualiseer gegevens en queryresultaten.
Indeling van de cursus
Interactieve lezing en discussie.
Veel oefeningen en oefenen.
Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
MLlib is Spark's machine learning (ML) bibliotheek. Het doel is om praktische machine learning schaalbaar en eenvoudig te maken. Het bestaat uit algemene leeralgoritmen en hulpprogramma's, waaronder classificatie, regressie, clustering, collaboratieve filtering, vermindering van de dimensionaliteit, evenals optimalisatieprimitieven op een lager niveau en pijplijn-API's op een hoger niveau. Het is verdeeld in twee pakketten:
spark.mllib bevat de originele API gebouwd bovenop RDD's.
spark.ml biedt een API op een hoger niveau gebouwd bovenop DataFrames voor het construeren van ML-pijpleidingen.
Publiek Deze cursus is bedoeld voor ingenieurs en ontwikkelaars die een ingebouwde machinebibliotheek voor Apache Spark
In deze door een instructeur geleide, live training leren deelnemers over het technologieaanbod en de implementatiebenaderingen voor het verwerken van grafiekgegevens. Het doel is om objecten uit de echte wereld, hun kenmerken en relaties te identificeren, deze relaties vervolgens te modelleren en ze als gegevens te verwerken met behulp van een Graph Computing (ook bekend als Graph Analytics) aanpak. We beginnen met een breed overzicht en beperken ons tot specifieke tools terwijl we een reeks casestudies, praktische oefeningen en live implementaties doorlopen.Aan het einde van deze training kunnen deelnemers:
Begrijp hoe grafiekgegevens worden bewaard en doorlopen.
Selecteer het beste raamwerk voor een bepaalde taak (van grafische databases tot raamwerken voor batchverwerking).
Implementeer Hadoop, Spark, GraphX en Pregel om graph computing parallel uit te voeren op veel machines.
Bekijk big data-problemen uit de echte wereld in termen van grafieken, processen en traversals.
Read more...
Last Updated:
Getuigenissen (10)
Veel praktijkvoorbeelden, verschillende manieren om hetzelfde probleem aan te pakken, en soms niet zo voor de hand liggende trucs om de huidige oplossing te verbeteren
Rafał - Nordea
Cursus - Apache Spark MLlib
Machine Translated
Oefeningen en uitwisselingen tijdens vragen en antwoorden
Antoine - Physiobotic
Cursus - Scaling Data Pipelines with Spark NLP
Machine Translated
Betrokkenheid en bereidheid om secundaire onderwerpen uit te leggen.
Marek - Krajowy Rejestr Długów Biuro Informacji Gospodarczej S.A.
Cursus - Apache Spark Fundamentals
Machine Translated
I liked that it was practical. Loved to apply the theoretical knowledge with practical examples.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
The fact that we were able to take with us most of the information/course/presentation/exercises done, so that we can look over them and perhaps redo what we didint understand first time or improve what we already did.
Raul Mihail Rat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
very interactive...
Richard Langford
Cursus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Cursus - A Practical Introduction to Stream Processing
Having hands on session / assignments
Poornima Chenthamarakshan - Intelligent Medical Objects
Cursus - Apache Spark in the Cloud
The VM I liked very much
The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly
I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Cursus - Big Data Analytics in Health
This is one of the best hands-on with exercises programming courses I have ever taken.
Laura Kahn
Cursus - Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP
Apache Spark training cursus in Leuven, Spark opleiding cursus in Leuven, Weekend Apache Spark cursus in Leuven, Avond Apache Spark training in Leuven, Apache Spark instructeur geleid Leuven, Spark een op een training in Leuven, Apache Spark instructeur in Leuven, Apache Spark trainer in Leuven, Apache Spark coaching in Leuven, Spark instructeur geleid in Leuven,Spark lessen in Leuven, Apache Spark privé cursus in Leuven, Apache Spark een op een opleiding in Leuven, Apache Spark boot camp in Leuven, Avond Spark cursus in Leuven, Spark on-site in Leuven, Weekend Spark training in Leuven, Apache Spark op locatie in Leuven