En bref : Dans l’industrie, collecter des centaines d’exemples « défectueux » par référence est coûteux et souvent impossible au lancement d’un produit. Les approches few‑shot avec modèles vision‑langage (LVLM) comme IADGPT révolutionnent l’inspection qualité avec seulement quelques images de référence.
1) Technologie & défis
Dans l’industrie, collecter des centaines d’exemples « défectueux » par référence est coûteux et souvent impossible au lancement d’un produit. Les approches few‑shot avec modèles vision‑langage (LVLM) comblent ce manque : la pré‑publication IADGPT montre qu’un modèle unique peut détecter, localiser et expliquer des anomalies à partir de quelques images de référence, grâce à un entraînement progressif et au in‑context learning.
En parallèle, le nouveau dataset MVTec AD 2 rehausse le niveau (transparence, rétro‑éclairage, micro‑défauts) et rappelle que la robustesse en conditions réelles est le vrai juge (performances SOTA < 60% AU‑PRO en moyenne).
2) Problème & approche
Problème typique : démarrer un contrôle qualité visuel sur un nouveau SKU avec peu d’images.
Approche pragmatique : constituer 10–20 images « bonnes » (+ quelques défauts si disponibles), évaluer un baseline classique et une approche few‑shot LVLM comme IADGPT sur des métriques lisibles (AUROC image‑level, AU‑PRO pixel‑level) et stresser le système sous variations d’éclairage/pose inspirées de AD 2.
Ce protocole, adossé aux benchmarks historiques MVTec AD, permet d’obtenir rapidement un signal « go/no‑go » et d’objectiver les gains avant un pilote.
Bouteilles en ligne : détection d’anomalies avec approches few‑shot et modèles LVLM
3) Conclusion & ARCY
Chez ARCY, nous intégrons ces approches few‑shot et LVLM dans nos solutions d’inspection qualité et de vision industrielle (défauts, comptage, EPI), avec un accompagnement de bout en bout : cadrage KPI, POC supervisé, déploiement on‑prem/edge si besoin.
Vous étudiez un démarrage avec peu de données mais des exigences fortes de traçabilité ? Contactez‑nous pour concevoir un protocole court, mesurable et transférable en production.
4) Sources (sélection)
- IADGPT - Unified LVLM for Few‑Shot Industrial Anomaly Detection, Localization, and Reasoning via In‑Context Learning (arXiv, 14 août 2025). arXiv
- MVTec AD 2 - Advanced Scenarios for Unsupervised Anomaly Detection. arXiv • mvtec.com
- MVTec AD - Dataset de référence (CVPR 2019). CVF Open Access
- Contexte LVLM pour l'anomalie industrielle (AnomalyGPT, AAAI 2024). ACM DL
