Les Yeux

Vision Service

Local Intelligence : Edge AI Gateway avec VLM, OCR et Détection pour une corrélation multi-modale des données de test. 100% local, 0€ de cloud.

Les 3 Capabilities

Intelligence visuelle multi-modale sur Edge AI

Vision-Language Model

Qwen-VL

Compréhension contextuelle d'images avec questions en langage naturel

Cas d'usage :

•Vérification d'affichage LCD/LED
•Détection d'anomalies visuelles
•Validation de l'état des LEDs
•OCR intelligent contextuel

OCR Multi-Langues

EasyOCR + Tesseract

Extraction de texte avec support de 80+ langues

Cas d'usage :

•Lecture de logs d'afficheur
•Extraction de numéros de version
•Validation de labels
•Détection d'erreurs typographiques

Détection d'Objets

YOLO

Détection et localisation d'objets en temps réel

Cas d'usage :

•Détection de composants hardware
•Validation de position d'éléments
•Comptage d'objets
•Détection de défauts visuels

Cloud vs Edge AI

Pourquoi nous avons choisi l'Edge

Feature	Cloud AI	Edge AI
Coût par requête	0.05€	0€
Latence	500-2000ms	100-300ms
Confidentialité	Données externalisées	100% local
Disponibilité	Dépend du réseau	Toujours disponible

Corrélation Multi-Modale

La puissance de combiner plusieurs sources de données

Exemple Réel : Bug d'Affichage LCD

1
UART Log : Commande SET_DISPLAY=ON envoyée
2
Camera Capture : Image de l'écran LCD capturée
3
VLM Analysis : "L'écran est noir, aucun contenu visible"
4
Verdict : Bug détecté - Commande envoyée mais écran reste éteint
5
GitHub Issue : Créée automatiquement avec screenshot et logs