Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
spark.mllib: gegevenstypen, algoritmen en hulpprogramma's
- Soorten gegevens
- Basis statistieken
- Samenvattende statistieken
- Correlaties
- Gestratificeerde steekproeven
- Hypothese testen
- Significantie testen voor streaming
- Willekeurige gegevensgeneratie
- Classificatie en regressie
- lineaire modellen (SVM's, logistische regressie, lineaire regressie)
- naïeve Bayes
- Beslisbomen
- ensembles van bomen (Random Forests en Gradient-Boosted Trees)
- isotone regressie
- Gezamenlijk filteren
- afwisselende kleinste kwadraten (ALS)
- Clustering
- k-middel
- Gaussiaans mengsel
- clustering van energie-iteratie (PIC)
- latente Dirichlet-allocatie (LDA)
- Het doorsnijden van K-middelen
- Streaming K-Means
- Dimensionaliteit reductie
- enkelvoudige waarde ontleding (SVD)
- analyse van de voornaamste componenten (PCA)
- Extractie en transformatie van functies
- Frequente patroonmining
- FP-groei
- Verenigingsreglement
- Voorvoegsel Span
- Evaluatie metrieken
- Exporteren van PMML-modellen
- Optimalisatie (ontwikkelaar)
- stochastische gradiënt afdaling
- BFGS MET BEPERKT GEHEUGEN (L-BFGS)
spark.ml: API's op hoog niveau voor ML-pijplijnen
- Overzicht: schatters, transformatoren en pijpleidingen
- Objecten extraheren, transformeren en selecteren
- Classificatie en regressie
- Clustering
- Geavanceerde onderwerpen
Vereisten
Kennis van een van de volgende zaken:
- Java
- Scala
- Python
- SparkR.
35 Uren
Testimonials (1)
Veel praktijkvoorbeelden, verschillende manieren om hetzelfde probleem aan te pakken, en soms niet zo voor de hand liggende trucs om de huidige oplossing te verbeteren
Rafal - Nordea
Cursus - Apache Spark MLlib
Automatisch vertaald