IA locale pour production graphique : entraîner ses propres modèles à partir de projets architecturaux (perfectionnement)

Les nouvelles pratiques numériques

Intervenants

Laurent Lescop, Architecte dplg – Enseignant (ENSA Nantes) - Chercheur CRENAU/AAU UMR CNRS 1563 - Docteur HDR Culture numérique

Contexte

L’IA générative devient un outil clé pour la visualisation architecturale, mais les modèles pré-entraînés ne sont pas toujours adaptés aux besoins spécifiques des agences.

Entraîner ses propres modèles permet de générer des images cohérentes avec une identité visuelle spécifique, en intégrant des styles architecturaux, des matériaux ou des ambiances uniques.

Cette journée optionnelle introduit les bases de l’entraînement de modèles sur des ensembles de données architecturales et explore les outils open source permettant d’affiner la génération d’images selon des références existantes.

Objectifs

Ce programme vise à comprendre les principes de l’entraînement d’un modèle IA pour la génération d’images. À l’issue de la formation, les participants seront capables de :

  • Identifier les types de modèles personnalisables (Lora, DreamBooth, fine-tuning de Checkpoints).
  • Préparer un dataset optimisé à partir de projets architecturaux existants.
  • Apprendre les bases de l’entraînement sur une machine locale ou via un service cloud.
  • Tester et ajuster un modèle entraîné pour obtenir des résultats pertinents.
  • Intégrer un modèle personnalisé dans ComfyUI et l'utiliser dans un workflow.
  • Évaluer les performances et limites d’un modèle sur des cas concrets.

Programme

MATIN

Introduction à l’entraînement de modèles
  • Qu’est-ce que l’apprentissage de modèles en IA générative ?
  • Présentation des techniques : Lora, DreamBooth, Fine-Tuning
  • Comparaison entre l'entraînement local (GPU) et les solutions cloud (Google Colab, Runpod).
  • Exemples d’applications en architecture (création de styles visuels uniques, adaptation aux projets d’agence).
Préparation du dataset
  • Sélection des images : cohérence, diversité, qualité.
  • Prétraitement des images : résolution, cadrage, suppression des artefacts.
  • Annotation des images : utilisation de BLIP, WDTagger pour optimiser les descriptions textuelles.
  • Organisation des fichiers et gestion des métadonnées.
APRES-MIDI

Entraînement d’un modèle sur un projet architectural
  • Installation et configuration de Kohya SS ou Auto1111 DreamBooth.
  • Paramétrage des hyperparamètres : nombre d’époques, taux d’apprentissage, batch size.
  • Lancement d’un entraînement sur un dataset d’architecture.
  • Suivi des performances et ajustements.
  • Génération des premières images avec le modèle entraîné.
Intégration et exploitation dans ComfyUI
  • Chargement et test du modèle dans ComfyUI.
  • Ajustement des prompts pour tirer parti du modèle personnalisé.
  • Comparaison des résultats avec un modèle générique.
Travaux pratiques : Génération d’alternatives architecturales avec le modèle entraîné.

Echanges et questions

Evaluations

Conclusion