Les modèles pilotables remplaceront ChatGPT d’ici 5 ans, selon Yann Le Cun
Publié le 19 Avril sur Usbek & Rica. Auteur : Blaise Mao
>> Lire l’article sur Usebek & Rica <<
Résumé de l’article
Les modèles de langage autorégressifs seront rapidement obsolètes
D’ici cinq ans, les modèles de langage « autorégressifs » tels que ChatGPT ne seront plus utilisés et seront remplacés par les modèles pilotables. C’est en tout cas l’avis de Yann Le Cun, directeur du laboratoire d’Intelligence Artificielle de Meta (Facebook), professeur d’informatique et de neurosciences à l’université de New York et lauréat du prix Turing en 2018. L’entraînement de ces modèles les destine à prédire le mot suivant dans une phrase donnée. De tels modèles ne savent pas créer des textes longs et cohérents, et les informations contenues dans les textes générés ne sont pas fiables.
La priorité actuelle de la recherche en IA est de trouver des moyens pour rendre ces modèles pilotables, ce qui signifie qu’ils doivent suivre des objectifs et respecter des contraintes. C’est le sens des recherches qu’il mène actuellement avec les équipes de Meta, pour créer des modèles d’IA plus précis et plus fiables, qui remplaceront d’ici peu les modèles tels que ChatGPT.
L’importance de l’alignement
Pour rendre les modèles pilotables, il est crucial d’avoir de s’accorder sur des critères pour garantir l’alignement entre les objectifs fixés et le comportement réel du modèle. Cela permettra de garantir un comportement prévisible et fiable et contribuera à résoudre les problèmes éthiques associés à l’intelligence artificielle.
Un besoin urgent pour l’apprentissage multimodal
Les modèles actuels sont entraînés uniquement sur du texte, ce qui limite considérablement leur vision du monde. Yann Le Cun explique que les modèles pilotables doivent être capables de se développer en utilisant la perception sensorielle pour acquérir une meilleure compréhension de la structure physique du monde. Cependant, réaliser des IA capables d’apprendre à partir de vidéos et d’images en mouvement est un défi technologique majeur.
Le développement d’IA capables de ressentir des émotions est possible
Les machines seront bientôt capables de ressentir des émotions car celles-ci sont souvent liées à la réalisation ou non d’objectifs. Pour développer ces capacités, il faudra mettre au point des modèles augmentés qui hybrident différents outils et de différentes sources de données.
Des exemples concrets de l’amélioration des performances des modèles augmentés
- Les modèles pilotables permettront d’obtenir des textes plus cohérents, précis et fiables grâce à la planification de systèmes d’action.
- Les modèles augmentés pourront résoudre les problèmes d’arithmétique actuels rencontrés par les modèles comme ChatGPT.