Cursusaanbod

spark.mllib: gegevenstypen, algoritmen en hulpprogramma's

  • Soorten gegevens
  • Basis statistieken
    • Samenvattende statistieken
    • Correlaties
    • Gestratificeerde steekproeven
    • Hypothese testen
    • Significantie testen voor streaming
    • Willekeurige gegevensgeneratie
  • Classificatie en regressie
    • lineaire modellen (SVM's, logistische regressie, lineaire regressie)
    • naïeve Bayes
    • Beslisbomen
    • ensembles van bomen (Random Forests en Gradient-Boosted Trees)
    • isotone regressie
  • Gezamenlijk filteren
    • afwisselende kleinste kwadraten (ALS)
  • Clustering
    • k-middel
    • Gaussiaans mengsel
    • clustering van energie-iteratie (PIC)
    • latente Dirichlet-allocatie (LDA)
    • Het doorsnijden van K-middelen
    • Streaming K-Means
  • Dimensionaliteit reductie
    • enkelvoudige waarde ontleding (SVD)
    • analyse van de voornaamste componenten (PCA)
  • Extractie en transformatie van functies
  • Frequente patroonmining
    • FP-groei
    • Verenigingsreglement
    • Voorvoegsel Span
  • Evaluatie metrieken
  • Exporteren van PMML-modellen
  • Optimalisatie (ontwikkelaar)
    • stochastische gradiënt afdaling
    • BFGS MET BEPERKT GEHEUGEN (L-BFGS)

spark.ml: API's op hoog niveau voor ML-pijplijnen

  • Overzicht: schatters, transformatoren en pijpleidingen
  • Objecten extraheren, transformeren en selecteren
  • Classificatie en regressie
  • Clustering
  • Geavanceerde onderwerpen

Vereisten

Kennis van een van de volgende zaken:

  • Java
  • Scala
  • Python
  • SparkR.
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (1)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën