Le Deep Learning… pas toujours adapté à la reconnaissance d’image ou d’objet

Technologie

À date, les solutions de reconnaissance visuelle existantes basées sur le Deep Learning fonctionnent en deux temps :

  1. Établissement d’un dataset de référence : collecte du maximum de données disponibles sur l’image ou l’objet qu’on souhaite comparer/identifier
  2. Entraînement des algorithmes de Deep Learning sur ce dataset : le réseau de neurones artificiels qui constitue le modèle « apprend par l’exemple» à reconnaître l’image ou l’objet de référence jusqu’à l’obtention d’un score satisfaisant.

 Pour être robuste, une telle solution requiert  :

  • Un très grand nombre de versions de l’image de référence, dans des situations les plus diversifiées possibles, pour enrichir le dataset (ex. un même objet sous des orientations et éclairages différents)
  • Un temps de mise en place d’apprentissage relativement long : bien que les temps d’entraînement des algorithmes se soient réduits ces dernières années, l’ensemble des étapes de récupération des images du dataset, de leur nettoyage, de définition de l’architecture d’entraînement et des paramètres peut prendre plusieurs jours
  • Des ressources en calcul d’autant plus importantes pour les images de grandes tailles
  • Une intervention humaine technique pour affiner le modèle et le rendre fiable. L’expertise d’un développeur est nécessaire pour comprendre les scores obtenus et les améliorer.

 Or, les projets ne disposent pas toujours de tels délais, ressources techniques ou compétences humaines.

De plus, certains cas d’usage ne permettent tout simplement pas d’avoir un grand nombre d’images de référence… Si je souhaite identifier des reproductions d’une œuvre d’art, je n’ai par définition, qu’une seule image de référence sur laquelle entraîner mon modèle ! Ainsi, dans de nombreuses problématiques de reconnaissance visuelle, recourir au Deep Learning ne sera pas pertinent !

 Et LTU dans tout ça ?

LTU a développé une solution innovante qui consiste à analyser une image (ou un objet) pour lui attribuer une description visuelle appelée « Signature unique » . En utilisant cette signature, la solution est capable de détecter et d’identifier les images proches d’une image de requête. 

Cette technologie brevetée offre des performances notables sur le marché de la Computer Vision. En particulier dans les cas d’usage où entraîner un modèle de Deep Learning s’avérerait trop complexe, coûteux ou chronophage.

Nous n’excluons cependant pas le Deep Learning ! Si cela est adapté à vos besoins, la technologie LTU peut également intégrer des technologies tierces. Par exemple, il vous sera possible d’enrichir la reconnaissance visuelle de fonctionnalités de détection d’objets et de classification d’images. Vous bénéficiez ainsi d’une solution à la fois personnalisable, et facilement intégrable et hautement performante




Les différentes technologies de reconnaissance visuelle


Découvrir le Ebook

Vous pensez que les technologies de reconnaissance visuelle fonctionnent nécessairement grâce au Deep Learning ? Pas toujours !

Une solution de reconnaissance visuelle consiste à comparer un objet ou une image de référence à un ensemble d’autres objets/images puis à identifier un ou plusieurs « match ». C’est-à-dire à répondre à la question « S’agit-il de la même image ? ».

Une question ?

Livre blanc
Télécharger
Notre équipe
Nous contacter