Cursusaanbod
Inleiding tot Gegevensanalyse en Big Data
- Wat maakt Big Data 'groot'?
- Snelheid, Volume, Variëteit, Betrouwbaarheid (VVVV)
- Limieten van traditionele gegevensverwerking
- Gedistribueerde verwerking
- Statistische analyse
- Type Machine Learning-analyse
- Data visualisatie
Rollen en verantwoordelijkheden in Big Data
- Beheerders
- Ontwikkelaars
- Dataanalisten
Talen die worden gebruikt voor gegevensanalyse
- R-taal
- Waarom R voor gegevensanalyse?
- Gegevensmanipulatie, berekening en grafische weergave
- Python
- Waarom Python voor gegevensanalyse?
- Manipuleren, verwerken, reinigen en samenvatten van gegevens
Benaderingen voor gegevensanalyse
- Statistische analyse
- Tijdreeksanalyse
- Vooruitblik met correlatie- en regressiemodellen
- Inferentiële statistiek (schatting)
- Descriptieve statistiek in Big Data-sets (bijv. het berekenen van het gemiddelde)
- Machine Learning
- Toezichthoudend vs niet-toezichthoudend leren
- Classificatie en clustering
- Schatting van kosten voor specifieke methoden
- Filtering
- Natuurlijke taalverwerking
- Tekstverwerking
- Begrijpen van de betekenis van tekst
- Automatische tekstgeneratie
- Sentiment- en themaanalyse
- Computer Vision
- Afbeeldingen verkrijgen, verwerken, analyseren en begrijpen
- 3D-scènes reconstrueren, interpreteren en begrijpen
- Afbeeldingsgegevens gebruiken om beslissingen te nemen
Big Data-infrastructuur
- Gegevensopslag
- Gestructureerde databases (SQL)
- MySQL
- Postgres
- Oracle
- Niet-gestructureerde databases (NoSQL)
- Cassandra
- MongoDB
- Neo4j
- Inzicht in nuances
- Hierarchische databases
- Objectgeoriënteerde databases
- Documentgeoriënteerde databases
- Grafgeoriënteerde databases
- Andere
- Gestructureerde databases (SQL)
- Gedistribueerde verwerking
- Hadoop
- HDFS als gedistribueerd bestandssysteem
- MapReduce voor gedistribueerde verwerking
- Spark
- All-in-one in-memory cluster computing framework voor grote gegevensverwerking
- Gestructureerde streaming
- Spark SQL
- Machine Learning-bibliotheken: MLlib
- Grafische verwerking met GraphX
- Hadoop
- Schaalbaarheid
- Publieke cloud
- AWS, Google, Aliyun, etc.
- Prive-cloud
- OpenStack, Cloud Foundry, etc.
- Automatische schaalbaarheid
- Publieke cloud
Het juiste oplossing kiezen voor het probleem
De toekomst van Big Data
Samenvatting en volgende stappen
Vereisten
- Een algemeen begrip van wiskunde
- Een algemeen begrip van programmeren
- Een algemeen begrip van databases
Doelgroep
- Ontwikkelaars / programmeurs
- IT consultants
Getuigenissen (7)
Hoe big data werken, dataprogramma's, meer kennis van hoe onze huidige wereld werkt met behulp van data
Ozayr Hussain - Vodacom
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
De praktische kant van de opleiding.
Patrick - Vodacom PTy Ltd
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
Interactieve onderwerpen en de stijl die de docent gebruikt om de onderwerpen voor de studenten te vereenvoudigen
Miran Saeed - Sulaymaniyah Asayish Agency
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
De trainer en zijn vermogen om te presenteren
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
Oefeningen in de praktijk
JOEL CHIGADA - University of the Western Cape
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
R-programmeren
Osden Jokonya - University of the Western Cape
Cursus - A Practical Introduction to Data Analysis and Big Data
Automatisch vertaald
Overall the Content was good.
Sameer Rohadia
Cursus - A practical introduction to Data Analysis and Big Data
Automatisch vertaald