Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
EXO Infrastructure as Code
- Overzicht van EXO-implementatiepatronen: single-node, multi-node en RDMA-clusters
- Automatiseren van afhankelijkheidsinstallatie (Xcode, uv, Node.js, Rust) met configuratiebeheer
- Nix flakes gebruiken voor reproduceerbare EXO-bouwen en developer-omgevingen
- Ansible playbooks of shellscripts schrijven voor onbemande clusterprovisionering
Reproduceerbare Builds en CI-integratie
- Afhankelijkheden fixeren en de dashboard bouwen in CI-pipelines
- EXO-smoketests uitvoeren in GitHub Actions of GitLab CI-runners
- Golden images en snapshot-gebaseerde rollback-werkstromen maken voor macOS- en Linux-VM's
- Versieer custom modelcards samen met applicatiecode
Clusterdiscovery en netwerkautomatisering
- mDNS en statische DNS configureren voor betrouwbare libp2p-node-discovery
- Automatiseren van netwerkprofielcreatie en Thunderbolt-bridgebeheer op macOS
- Custom namespaces (EXO_LIBP2P_NAMESPACE) gebruiken om dev, staging en prod-clusters te scheiden
- Firewallregels en netwerksegmentatie voor multi-tenant-omgevingen
Opslag en modellevenscyclusbeheer
- Strategieën ontwerpen voor EXO_MODELS_DIRS en EXO_MODELS_READ_ONLY_DIRS
- NFS- of SAN-shares mounten als read-only modelrepositories voor snelle provisionering
- Garbage collection van verouderde caches en retentiebeleid voor versieerde weights
- Automatiseren van modelpre-downloads en healthchecks voorafgaand aan rolling updates
Monitoring en alerting
- EXO-logs verzenden naar gecentraliseerd logboekbeheer (ELK, Loki of Splunk)
- Grafana-dashboards bouwen vanuit EXO_TRACING_ENABLED-uitvoer
- Alerten bij veranderingen in clustermembership, OOM-gebeurtenissen en pieken in inferentielatency
- Correlatie van macmon-hardwaretelemetrie met modelprestatieregressies
Updates, rollbacks en disaster recovery
- EXO-binary-upgrades stagen op een canary-node voordat ze wereldwijd in het fleet worden uitgerold
- Modelniveau rollback: overschakelen tussen gekwantificeerde versies zonder opnieuw te downloaden
- Clustertoestand, custom namespaces en gecachte weights back-uppen en herstellen
- Recovery-runbooks documenteren voor scenario's waarin het volledige cluster opnieuw moet worden opgebouwd
Security hardening en compliance
- TLS toepassen op de reverse proxy-laag (nginx, traefik) voor het dashboard en API
- API-rate limiting en IP-whitelisting implementeren voor EXO-eindpunten
- Clusters isoleren met VLAN's en zero-trust netwerkbeleid
- Toegang auditen en een inventaris bijhouden van geïmplementeerde modellen en versies
Vereisten
- Ervaring met DevOps-praktijken (CI/CD, IaC, container-orchestratie)
- Vertrouwdheid met macOS- of Linux-systeembeheer en pakketbeheer
- Begrip van netwerk-, DNS- en opslagconcepten
Doelgroep
- DevOps-engineers
- Infrastructuurarctitecten
- SRE's die verantwoordelijk zijn voor on-premise AI-werklasten
21 Uren
Getuigenissen (2)
Craig was erg betrokken bij de training, zorgde altijd dat we goed opletten, paste de voorbeelden aan op onze dagelijkse activiteiten en gaf altijd antwoord als er iets gevraagd werd, zelfs als de informatie niet in de presentatie stond.
Ecaterina Ioana Nicoale - BOOKING HOLDINGS ROMANIA SRL
Cursus - DevOps Foundation®
Automatisch vertaald
Hoog niveau van betrokkenheid en kennis van de trainer
Jacek - Softsystem
Cursus - DevOps Engineering Foundation (DOEF)®
Automatisch vertaald