in

Qu’est-ce que la vision par ordinateur? | Blog NVIDIA

La vision par ordinateur est devenue si bonne que les jours où les directeurs généraux criaient aux arbitres dans les matchs de baseball lors de différends sur les terrains pourraient devenir une chose du passé.

En effet, les progrès de la classification des images et du traitement parallèle permettent aux ordinateurs de voir une balle de baseball filer à 95 miles par heure. Associez cela à la détection d’image pour aider à géolocaliser les balles, et vous disposez d’un outil d’arbitrage puissant avec lequel il est difficile de discuter.

Mais la vision par ordinateur ne s’arrête pas au baseball.

Qu’est-ce que la vision par ordinateur?

La vision par ordinateur est un terme général désignant le travail effectué avec des réseaux de neurones profonds pour développer des capacités de vision de type humain pour les applications, le plus souvent exécutées sur des GPU NVIDIA. Cela peut inclure un entraînement spécifique des réseaux neuronaux pour la segmentation, la classification et la détection à l’aide d’images et de vidéos pour les données.

La Major League Baseball teste les appels assistés par l’IA à l’assiette en utilisant la vision par ordinateur. Juger des balles et des frappes sur des balles de baseball qui ne prennent que 0,4 seconde pour atteindre la plaque n’est pas facile pour les yeux humains. Cela pourrait être mieux géré par un flux de caméra exécuté sur des réseaux d’images et des GPU NVIDIA capables de traiter des décisions en une fraction de seconde à une vitesse de plus de 60 images par seconde.

Hawk-Eye, basé à Londres, en fait une réalité dans le sport. Le logiciel de suivi de balle et de logiciel SMART basé sur le processeur graphique NVIDIA de Hawk-Eye est déployé dans plus de 20 sports, notamment le baseball, le basket-ball, le tennis, le football, le cricket, le hockey et la NASCAR.

Pourtant, la vision par ordinateur peut faire beaucoup plus que simplement passer des appels sportifs.

Qu’est-ce que la vision par ordinateur au-delà du sport?

La vision par ordinateur peut gérer beaucoup plus de tâches. Développée avec des réseaux de neurones convolutifs, la vision par ordinateur peut effectuer la segmentation, la classification et la détection pour une myriade d’applications.

La vision par ordinateur a des applications infinies. Avec les changements dans l’industrie de la vision par ordinateur couvrant le sport, l’automobile, l’agriculture, la vente au détail, la banque, la construction, l’assurance et au-delà, les enjeux sont nombreux.

3 choses à savoir sur la vision par ordinateur

  • Segmentation: La segmentation d’image consiste à classer les pixels pour appartenir à une certaine catégorie, telle qu’une voiture, une route ou un piéton. Il est largement utilisé dans les applications de véhicules autonomes, y compris la pile logicielle NVIDIA DRIVE, pour afficher les routes, les voitures et les personnes. Considérez-le comme une sorte de technique de visualisation qui rend ce que les ordinateurs font plus facile à comprendre pour les humains.
  • Classification: La classification d’image est utilisée pour déterminer le contenu d’une image. Les réseaux neuronaux peuvent être formés pour identifier les chiens ou les chats, par exemple, ou bien d’autres choses avec un haut degré de précision, compte tenu des données suffisantes.
  • Détection: La détection d’image permet aux ordinateurs de localiser les objets. Il place des cadres de délimitation rectangulaires – comme dans la moitié inférieure de l’image ci-dessous – qui contiennent entièrement l’objet. Un détecteur peut être formé pour voir où se trouvent des voitures ou des personnes dans une image, par exemple, comme dans les cases numérotées ci-dessous.

Ce que vous devez savoir: segmentation, classification et détection

Le Deep Learning Institute de NVIDIA propose des cours tels que Getting Started with Image Segmentation et Fundamentals of Deep Learning for Computer Vision.