IA & reconnaissance d’image : Fujitsu propose une avancée majeure

[ad_1]

Les données vidéo à ultra-haute définition et à volume élevé sont compressées à 1/10 de la taille des données de la technologie de compression conventionnelle pour une analyse rationalisée dans le cloud en utilisant une nouvelle technique

Fujitsu Laboratories Ltd. a développé une technologie pour compresser des données vidéo ultra-haute définition et à volume élevé à la taille minimale requise pour les applications de reconnaissance vidéo AI. Cette technologie peut compresser les données vidéo à seulement un dixième de la taille des données préparées à l’aide de la technologie de compression conventionnelle destinée à la confirmation visuelle par l’homme.

En développant cette nouvelle technologie de compression, Fujitsu s’est concentré sur une divergence importante dans la façon dont l’IA et les humains reconnaissent les images. À savoir, l’IA et les humains ont tendance à différer dans les zones de l’image qui sont soulignées comme importantes pour le jugement lors de la reconnaissance des personnes, des animaux ou des objets dans les données vidéo. Fujitsu a développé une technologie pour analyser automatiquement les zones que l’IA valorise et pour compresser les données à la taille minimale que l’IA peut reconnaître. Cela permet d’analyser une grande quantité de données vidéo sans compromettre la précision de la reconnaissance, tout en réduisant considérablement les coûts d’exploitation et de transmission des données. Il est également prévu que la technologie permettra aux utilisateurs d’analyser des données vidéo plus avancées en combinant plusieurs données vidéo stockées dans le cloud, des données de capteur et des données de performance telles que des données de vente.
Ces dernières années, il y a eu une forte augmentation de la demande pour l’analyse AI des données vidéo dans divers secteurs d’activité. La diffusion du système de communication mobile de 5e génération, en particulier, devrait contribuer à une augmentation explosive du nombre d’images vidéo ultra-haute définition capturées par des caméras, ainsi que de nombreuses images capturées dans la rue et sur lignes de production.

Contexte et défis

Ces dernières années, la technologie d’analyse d’images utilisant l’IA s’est développée rapidement et devrait être l’un des moteurs de la transformation numérique dans de nombreuses entreprises dans divers secteurs. Avec l’avènement des services mobiles 5G sophistiqués en 2020, la demande d’analyse de l’IA devrait encore augmenter, accompagnée par l’utilisation croissante de caméras ultra haute définition 4K et 8K et de grandes quantités de données vidéo pour les applications, y compris l’analyse comportementale dans le industries manufacturières et de détail.

Malgré cela, les demandes de traitement pour les techniques d’apprentissage en profondeur utilisées pour l’analyse d’images présentent des défis considérables. Une technique efficace pour sécuriser la puissance de calcul pour faire face à ces tâches consiste à traiter conjointement avec le cloud, mais comme les données vidéo sont souvent très gourmandes en ressources, il existe un besoin de technologie à haute compression qui peut transmettre toutes les données vidéo au cloud sans compromettre la qualité afin que la bande passante du réseau ne soit pas surchargée.

À propos de la technologie nouvellement développée

La compression vidéo réduit la qualité de l’image en fonction du taux de compression, et si la zone sur laquelle l’IA est concentrée est excessivement compressée, la précision de reconnaissance diminue. Fujitsu a développé une technologie de compression vidéo qui analyse automatiquement la zone d’un objet reconnu par l’IA comme matériau de jugement dans une image de 1 trame de données vidéo, compressant (2) l’image avec la qualité d’image minimale requise pour la reconnaissance de chaque zone (Figure 1). En appliquant cette technologie, la taille des données vidéo peut être considérablement réduite par rapport aux technologies de compression conventionnelles tout en conservant la précision de reconnaissance.

Technologie pour estimer automatiquement le taux de compression sans affecter la précision de reconnaissance de l’IA

L’effet de la dégradation de la qualité d’image spécifique à la compression sur la précision de reconnaissance est analysé pour chaque zone. Le taux de compression qui n’affecte pas la précision de la reconnaissance est automatiquement estimé sur la base des résultats de la reconnaissance de l’IA.

Le degré d’importance des caractéristiques dans le processus de reconnaissance par l’IA est déterminé pour toutes les zones en agrégeant les effets sur les résultats de la reconnaissance lorsque le taux de compression de l’image entière est modifié et la qualité de l’image est modifiée. Le taux de compression immédiatement avant que la précision de reconnaissance se détériore rapidement dans chaque zone est estimé comme un taux de compression qui n’affecte pas la précision de reconnaissance.

Il renvoie également les résultats AI des images successives pour augmenter la compression au maximum que l’IA peut reconnaître. Ce faisant, la technologie atteint une compression d’image élevée tout en conservant la précision de reconnaissance de l’IA.

Effet

La technologie nouvellement développée a été appliquée aux séquences vidéo prises par une caméra 4K de plusieurs travailleurs emballant dans une usine. Il a été confirmé que la taille des données pouvait être réduite à 1/10 de la taille des données de la technologie de compression conventionnelle sans détérioration de la précision de reconnaissance. Cette technologie devrait être utilisée pour les applications qui ne nécessitent pas de performances strictes en temps réel, ainsi que pour l’analyse de données vidéo avancées qui combinent plusieurs données vidéo stockées dans le cloud, des données de capteur et des données de performance telles que les données de vente.

Plans futurs

Fujitsu Laboratories évalue cette technologie dans divers cas et mène des recherches et des développements supplémentaires pour affiner davantage les performances de compression. Fujitsu prévoit de commercialiser cette technologie d’ici la fin de l’exercice 2020 et de l’introduire dans une variété d’applications pour différentes industries, y compris sa plateforme de service COLMINA Fujitsu Manufacturing Industry Solution.

1 – Système de communication mobile de cinquième génération Abréviation du système de 5e génération 3GPP (3rd Generation Partnership Project). Un système de communication mobile à haut débit, grande capacité, retard ultra-faible et plusieurs connexions simultanées.

2 – Compression Cette technologie applique la norme internationale H. 265 / HEVC et les méthodes de compression vidéo existantes.

À propos des laboratoires Fujitsu

Fondée en 1968 en tant que filiale à part entière de Fujitsu Limited, Fujitsu Laboratories Ltd. est l’un des premiers centres de recherche au monde. Avec un réseau mondial de laboratoires au Japon, en Chine, aux États-Unis et en Europe, l’organisation mène un large éventail de recherches fondamentales et appliquées dans les domaines des services de nouvelle génération, des serveurs informatiques, des réseaux, des appareils électroniques et des matériaux avancés.

[ad_2]