La reconnaissance visuelle par « Signature Unique »

API Technologie

Vous pensez que les technologies de reconnaissance visuelle (d’objet, faciale) fonctionnent nécessairement grâce au Deep Learning ? Pas toujours !

LTU, éditeur de logiciels spécialisé dans le domaine de la reconnaissance visuelle, a développé une solution innovante permettant de détecter et d’identifier une image ou un objet en lui attribuant une « signature unique ».

Cette technologie brevetée offre des performances notables sur le marché de la Computer Vision. En particulier dans les cas d’usage où entraîner un modèle de Deep Learning s’avérerait trop complexe, coûteux ou chronophage.

Le Deep Learning… pas toujours adapté à la reconnaissance d’image ou d’objet

Une solution de reconnaissance visuelle consiste à comparer un objet ou une image de référence à un ensemble d’autres objets/images puis à identifier un ou plusieurs « match ». C’est-à-dire à répondre à la question « S’agit-il de la même image ? ».

 À date, les solutions de reconnaissance visuelle existantes basées sur le Deep Learning fonctionnent en deux temps :

–      Établissement d’un dataset de référence : collecte du maximum de données disponibles sur l’image ou l’objet qu’on souhaite comparer/identifier

–      Entraînement des algorithmes de Deep Learning sur ce dataset : le réseau de neurones artificiels qui constitue le modèle « apprend par l’exemple» à reconnaître l’image ou l’objet de référence jusqu’à l’obtention d’un score satisfaisant.

 Pour être robuste, une telle solution requiert  :

–      Un très grand nombre de versions de l’image de référence, dans des situations les plus diversifiées possibles, pour enrichir le dataset (ex. un même objet sous des orientations et éclairages différents)

–      Un temps de mise en place d’apprentissage relativement long : bien que les temps d’entraînement des algorithmes se soient réduits ces dernières années, l’ensemble des étapes de récupération des images du dataset, de leur nettoyage, de définition de l’architecture d’entraînement et des paramètres peut prendre plusieurs jours

–      Des ressources en calcul d’autant plus importantes pour les images de grandes tailles

–      Une intervention humaine technique pour affiner le modèle et le rendre fiable. L’expertise d’un développeur est nécessaire pour comprendre les scores obtenus et les améliorer.

 Or, les projets ne disposent pas toujours de tels délais, ressources techniques ou compétences humaines. De plus, certains cas d’usage ne permettent tout simplement pas d’avoir un grand nombre d’images de référence… Si je souhaite identifier des reproductions d’une œuvre d’art, je n’ai par définition, qu’une seule image de référence sur laquelle entraîner mon modèle !

 Ainsi, dans de nombreuses problématiques de reconnaissance visuelle, recourir au Deep Learning ne sera pas optimal, et même, disons-le : pas pertinent !

La signature unique LTU – Comment ça marche ? 

La technologie développée par LTU en revanche, a résolu la question du temps d’apprentissage en amont. Son algorithme est capable d’analyser précisément les caractéristiques d’une image ou d’un objet. Il ne s’agit pas de classifier une image par typologie (paysage, visage, animal, objet inanimé…) mais plutôt par caractéristiques visuelles (courbure, opacité, modèle 3D, texture, couleurs dominantes et autres métadonnées diverses).

Au total, pour chaque image analysée, une quinzaine d’attributs sont étudiés venant définir sa « signature unique ». Cette signature permet d’identifier l’image ou l’objet avec une grande fiabilité à la manière d’une empreinte digitale ou de l’ADN propre à chaque individu.

En pratique, dans un cas de reconnaissance visuelle opérée par LTU, une seule image de référence suffit et cette dernière est analysée une seule fois pour lui attribuer sa signature unique. Pour identifier deux images similaires, ce sont leurs signatures qui sont comparées directement entre elles, ce qui améliore considérablement le temps de réponse de l’outil par rapport au marché: 0,3 seconde pour reconnaître une image en moyenne !

Les avantages

La solution de reconnaissance visuelle de LTU basée sur ce principe de la « signature unique » présente les avantages suivants :

–  Une seule image suffit : plus besoin de centaines de versions d’une image de référence pour l’identifier avec certitude, et plus besoin de les annoter. C’est un gain de temps et d’énergie significatif !

–      Aucun temps d’entraînement et d’apprentissage de modèle requis, car la technologie est développée de manière à extraire les informations d’une image de manière immédiate

–      Le modèle est robuste quelle que soit la typologie de l’image de référence au départ. Il ne réutilise pas les caractéristiques d’un ancien modèle ou d’un jeu de données proche de votre problématique (pas de transfer learning)

–      Confidentialité des données : réciproquement, LTU ne réutilise pas les contenus que vous soumettez dans l’outil pour entraîner et améliorer son algorithme

–   Économies d’énergie : moins gourmande en puissance de calcul que les solutions équivalentes basées sur le Deep Learning, la technologie LTU utilise des composants plus économes pour une empreinte énergétique réduite.

En pratique, une solution intégrée

Concernant la prise en main de l’outil, LTU propose une offre clé-en-main, exploitable par une grande diversité d’interlocuteurs-métiers non techniques : marketing, ventes, communication etc. LTU vous apporte un accompagnement utilisateur et une aide pour configurer la solution.

Nous n’excluons d’ailleurs pas le Deep Learning ! Si cela est adapté à vos besoins, la technologie LTU peut également intégrer des technologies tierces. Par exemple, il vous sera possible d’enrichir la reconnaissance visuelle de fonctionnalités de détection d’objets et de classification d’images. Vous bénéficiez ainsi d’une solution à la fois personnalisable, et facilement intégrable et hautement performante.

Une question ?

Livre blanc
Télécharger
Notre équipe
Nous contacter