Cursusaanbod

Overzicht van Speech Recognition Technologieën

  • Geschiedenis en ontwikkeling van spraakherkenning
  • Acoustische modellen, taalmodellen en decodering
  • Moderne architecturen: RNNs, transformers en Whisper

Audio Voorbewerking en Basisprincipes van Transcriptie

  • Omgaan met audioformaten en steekproefsnelheden
  • Reinigen, bijsnijden en segmenteren van audio
  • Tekst genereren uit audio: real-time vs batch

Handen aan de kniepen met Whisper en Andere APIs

  • Installeren en gebruik van OpenAI Whisper
  • Cloud APIs (Google, Azure) aanroepen voor transcriptie
  • Prestatie, vertraging en kosten vergelijken

Taal, Accenten en Domeinadaptatie

  • Werken met meerdere talen en accenten
  • Aangepaste woordenschat en ruisbestendigheid
  • Behandeling van juridische, medische of technische taal

Uitvoerindeling en Integraie

  • Tijdstempels, leestekens en sprekerslabels toevoegen
  • Exporteren naar tekst, SRT of JSON-formaten
  • Transcripties integreren in apps of databanken

Use Case Implementatie Labs

  • Vergaderingen, interviews of podcasts transcriberen
  • Stem-naar-tekst commando-systemen
  • Realtime ondertitels voor video/audio-streams

Evaluatie, Beperkingen en Ethiek

  • Nauwkeurigheidsmetingen en modelbenchmarks
  • Vooroordelen en billijkheid in spraakmodellen
  • Overwegingen over privacy en naleving

Samenkomst en Volgende Stappen

Vereisten

  • Begrip van algemene AI- en machine learning-concepten
  • Kennis van audio- of media-bestandsformaten en tools

Publiek

  • Datawetenschappers en AI-ingenieurs die werken met spraakgegevens
  • Softwareontwikkelaars die transcribieergebaseerde toepassingen bouwen
  • Organisaties die spraakherkenning voor automatisering verkennen
 14 Uren

Aantal deelnemers


Prijs Per Deelnemer

Voorlopige Aankomende Cursussen

Gerelateerde categorieën