Applications of machine learning
Reading time10 minEn bref
Résumé de l’article
Cet article donne une liste non exhaustive des applications de l’intelligence artificielle. Il vise à illustrer la diversité et la prévalence des approches basées sur le machine learning dans le monde actuel.
Principaux enseignements
-
Les avancées les plus impressionnantes en IA ont été réalisées en vision par ordinateur et en compréhension du langage naturel.
-
L’IA est également appliquée à d’autres modalités telles que le son, les données tabulaires, l’imagerie médicale et les séries temporelles.
-
Enfin, l’IA impacte la découverte scientifique, comme cela a déjà été démontré en biologie.
Contenu de l’article
L’IA est généralement appliquée à une modalité particulière (i.e. famille de données), qui définit l’ensemble des tâches étudiées. Ci-dessous, nous présentons certains des domaines les plus réussis.
1 — Vision par ordinateur
La vision par ordinateur est le domaine qui manipule les images pour en tirer des décisions. Les applications les plus courantes en vision par ordinateur sont les suivantes :
-
Classification d’images – Classer la catégorie principale représentée dans l’image (e.g., ViT, ResNet).
Par exemple, pour l’image suivante, un modèle devrait prédire “Duck”.
-
Détection d’objets – Détecter et localiser toutes les instances d’objets connus dans une image. Le résultat est une “bounding box” autour de chaque objet reconnu, avec sa probabilité (e.g., YOLO, DETR).
Par exemple,
-
Segmentation sémantique – Chaque pixel de l’image est associé à une catégorie prédéfinie spécifique (e.g., SAM 2).
Par exemple (source),
-
Estimation de pose humaine – Prédire la pose/action à partir d’une image (e.g., Open Pose).
Par exemple (source),
-
Applications de ces tâches à l’imagerie biomédicale : segmentation des tissus (par ex. tumeur, organes), diagnostic automatique, médecine prédictive
2 — Grands modèles de langage
Les modèles de langage, qui traitent le texte, ont progressé de manière spectaculaire au cours des deux dernières décennies. En particulier, depuis 2019, les Grands Modèles de Langage (LLM) sont développés et sont désormais très performants pour résoudre un large éventail de tâches de compréhension du langage.
Les LLM sont des modèles de deep learning très volumineux capables de modéliser plusieurs langues et de résoudre des tâches telles que :
- Traduction entre langues.
- Reformulation, résumé.
- Réponses à des questions.
- Tâches de raisonnement basique.
- Conversation, jeu de rôle.
- Programmation logicielle.
- …
Notamment, les LLM modernes sont entraînés pour être très bons à répondre aux requêtes, prendre en compte le contexte, et converser avec un humain. Voici quelques exemples célèbres de LLM :
- Série GPT d’OpenAI : GPT3.5, GPT4, GPT4o, … qui permettent ChatGPT.
- Llama 3, de Meta.
- Mistral, de la société du même nom, plusieurs modèles.
- Gemini de Google.
- Copilot de Microsoft.
- Claude, d’Anthropic.
3 — Applications de la parole
Comment traiter la parole orale ? Voici quelques possibilités :
- Speech to text – Transcrire la parole en texte écrit (e.g., Whisper).
- Text to speech – Générer de la parole à partir de texte (e.g., SpeechT5, demo of Edge TTS (Microsoft)).
- Clonage de voix – Cloner votre voix dans une autre langue XTTS.
4 — Applications du traitement du signal
L’audio est aussi une modalité de données très courante. Voici quelques exemples d’utilisation de l’IA sur ce type de données :
- Bioacoustique – Reconnaissance d’espèces d’oiseaux avec BirdNET.
- Audio tagging – Reconnaître tous les sons dans un enregistrement audio (e.g., PANNs, AST).
- Détection d’événements sonores – Détecter le début (onset) et la fin (offset) des sons dans un enregistrement audio.
- Localisation et détection d’événements sonores – Comme la détection, mais avec localisation (direction d’arrivée et distance).
- Transcription automatique de musique – Recréer la transcription d’une chanson.
- Séparation de sources musicales – Séparer une chanson en pistes instrumentales.
- Tagging musical – Faciliter le référencement d’une chanson en apprenant des tags pertinents.
- Identification de mammifères marins – À partir d’enregistrements acoustiques sous-marins, identifier les espèces.
- Interfaces cerveau-ordinateur utilisant l’électroencéphalographie (EEG) – Contrôler automatiquement des dispositifs à partir des signaux cérébraux pour les personnes handicapées.
- Diagnostic automatique utilisant l’électrocardiographie (ECG) – Surveiller la santé.
- Prévision de séries temporelles – Prédire l’avenir d’une série temporelle. Peut être fait dans de nombreux domaines, tels que la finance, l’énergie, les biosignaux, la météo, etc.
5 — Autres applications
Il existe de nombreux autres types de données. Voici quelques succès remarquables de l’IA pour des exemples qui ne rentrent pas dans les catégories ci-dessus :
- Biologie – Prédiction de la structure des protéines à partir de la séquence d’acides aminés. (e.g., AlphaFold, AlphaProteo).
- Jeux – Jouer au go, aux échecs ou aux jeux vidéo (e.g., AlphaGo, AlphaStar, Agent57).
Pour aller plus loin
Il semble que cette section soit vide !
Y a-t-il quelque chose que vous auriez aimé voir ici ? Faites-le nous savoir sur le serveur Discord ! Peut-être pouvons-nous l’ajouter rapidement. Sinon, cela nous aidera à améliorer le cours pour l’année prochaine !
Pour aller au-delà
Il semble que cette section soit vide !
Y a-t-il quelque chose que vous auriez aimé voir ici ? Faites-le nous savoir sur le serveur Discord ! Peut-être pouvons-nous l’ajouter rapidement. Sinon, cela nous aidera à améliorer le cours pour l’année prochaine !