Prenez contact avec nous

Plan du cours

Fondamentaux multimodaux de Hunyuan et configuration du laboratoire

  • Compréhension des capacités multimodales de Hunyuan pour les cas d'usage liés à l'image, la 3D et la vidéo.
  • Identification de scénarios métier pratiques pour les équipes créatives, produit et contenu.
  • Préparation de l'environnement de laboratoire, des actifs d'exemple et de l'accès aux modèles.
  • Exécution des premières tâches de génération et examen des sorties.

Conception des prompts et modèles de flux de travail

  • Structuration des prompts pour obtenir des résultats multimodaux cohérents.
  • Utilisation des prompts textuels, des images de référence et des paramètres d'entrée de base.
  • Choix des flux de travail adaptés à la génération d'images, de vidéos ou de modèles 3D.
  • Itération des prompts en fonction de la qualité des sorties et de l'intention métier.

Ateliers de génération et d'examen d'images

  • Création d'images marketing, de produits et de concepts à partir de prompts.
  • Affinement du style visuel, de la composition et de la cohérence du contenu.
  • Examen des sorties pour évaluer leur utilité, leur qualité et leur adéquation avec la marque.
  • Organisation des sorties d'images pour validation et utilisation ultérieure.

Ateliers de génération vidéo

  • Création de courtes vidéos à partir de prompts et d'entrées préparées.
  • Contrôle du style, de l'intention de la scène et de la variation des sorties.
  • Examen des vidéos pour évaluer la clarté, la continuité et l'utilité pratique.
  • Préparation des sorties vidéo pour la démonstration ou les flux de travail de contenu.

Ateliers de création d'actifs 3D

  • Génération d'actifs 3D de base à partir de textes ou d'images.
  • Vérification de la géométrie, de la qualité des textures et de l'utilisabilité des actifs.
  • Exportation des actifs pour la visualisation, le prototypage ou les pipelines de contenu.
  • Comparaison des situations où la génération 3D est appropriée par rapport aux flux de travail image ou vidéo.

Intégration, gouvernance et prochaines étapes

  • Diffusion des actifs générés via des applications simples, des services ou des API.
  • Connexion des sorties multimodales aux flux de travail liés au produit, au contenu et à la validation.
  • Application de contrôles pratiques pour la qualité, la sécurité de la marque, les droits d'auteur et l'utilisation responsable.
  • Planification des cas d'usage pilotes et des prochaines étapes pour l'adoption interne.

Pré requis

  • Compréhension de base des concepts de l'IA et de l'IA générative.
  • Expérience d'utilisation d'applications web, d'API ou d'outils de développement courants.
  • Expérience de base en Python ou en script.

Public cible

  • Développeurs créant des fonctionnalités de produits alimentées par l'IA.
  • Chefs de produit techniques et architectes de solutions.
  • Équipes innovation, médias et digital travaillant avec du contenu image, vidéo ou 3D.
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires