Les Yeux

Vision Service

Local Intelligence : Edge AI Gateway avec VLM, OCR et Détection pour une corrélation multi-modale des données de test. 100% local, 0€ de cloud.

Les 3 Capabilities

Intelligence visuelle multi-modale sur Edge AI

Vision-Language Model

Qwen-VL

Compréhension contextuelle d'images avec questions en langage naturel

Cas d'usage :

  • Vérification d'affichage LCD/LED
  • Détection d'anomalies visuelles
  • Validation de l'état des LEDs
  • OCR intelligent contextuel

OCR Multi-Langues

EasyOCR + Tesseract

Extraction de texte avec support de 80+ langues

Cas d'usage :

  • Lecture de logs d'afficheur
  • Extraction de numéros de version
  • Validation de labels
  • Détection d'erreurs typographiques

Détection d'Objets

YOLO

Détection et localisation d'objets en temps réel

Cas d'usage :

  • Détection de composants hardware
  • Validation de position d'éléments
  • Comptage d'objets
  • Détection de défauts visuels

Cloud vs Edge AI

Pourquoi nous avons choisi l'Edge

FeatureCloud AIEdge AI
Coût par requête0.05€0€
Latence500-2000ms100-300ms
ConfidentialitéDonnées externalisées100% local
DisponibilitéDépend du réseauToujours disponible

Corrélation Multi-Modale

La puissance de combiner plusieurs sources de données

Exemple Réel : Bug d'Affichage LCD

  1. 1
    UART Log : Commande SET_DISPLAY=ON envoyée
  2. 2
    Camera Capture : Image de l'écran LCD capturée
  3. 3
    VLM Analysis : "L'écran est noir, aucun contenu visible"
  4. 4
    Verdict : Bug détecté - Commande envoyée mais écran reste éteint
  5. 5
    GitHub Issue : Créée automatiquement avec screenshot et logs