Apprendre sans les humains

Apprendre sans les humains

Vous jouez à Assassin’s Creed et tandis que vous vivez de nouvelles aventures entre Damas et Jérusalem, le jeu vous propose soudain des renforts. Il a lu sur votre visage une expression de peur incontrôlable. Accepterez-vous cette aide?

Ce n’est pas encore dans la boîte, pourtant la firme Ubisoft songerait effectivement à intégrer un tel outil capable de « lire » les expressions des joueurs afin d’augmenter le niveau d’interactivité. Pour y parvenir, les ordinateurs devront toutefois apprendre à être intuitifs et à maitriser suffisamment la structure cachée d’un ensemble de données pour se passer de l’intervention humaine.

« L’ordinateur n’est pas encore aussi intelligent, mais il pourrait le devenir un jour », croit Yoshua Bengio, titulaire de la Chaire de recherche du Canada sur les algorithmes d’apprentissage statistique et professeur au département d’informatique et de recherche opérationnelle (DIRO) de l’Université de Montréal.

Ainsi, beaucoup d’images circulent sur internet. Elles ne sont ni annotées, ni expliquées et comportent de nombreuses informations que nous, humains, sommes capables de décoder sans interprète. Un apprentissage que nous apprenons à faire dès notre plus jeune âge. « Nous tentons de faire la même avec les machines de mon laboratoire pour qu’elles prennent la meilleure décision et cela, sans notre aide », explique-t-il.

Prenant appui sur les algorithmes, l’apprentissage automatique, une branche de l’intelligence artificielle, a enfanté dans les années ’70 et ’80 des technologies de reconnaissance vocale, d’écriture ou d’objets. Ces technologies, qui doivent toujours être perfectionnées, ont reposé longtemps sur des algorithmes classiques pour former les bonnes associations images/mots.

Mais devant le nombre croissant de données et la nécessité d’abstraction, les techniques d’encodage classiques ont frappé un mur, explique l’expert. Il a fallu apprendre aux ordinateurs à changer de niveau de représentation et même, à générer leurs réponses propres.

Depuis 2006, de nombreuses équipes d’informaticiens, dont celle du DIRO, ont contribué à bâtir ce qu’on appelle dorénavant le Deeplearning. Il consiste à initier les ordinateurs à un problème à l’aide d’exemples, sans leur donner toutes les étapes du raisonnement pour le résoudre. « C’est une manière d’entraîner les machines, comme les sportifs, à se développer et à devenir plus performantes. Cet apprentissage nous a permis de contourner ce mur et de passer à moins de 50 % d’erreurs dans la reconnaissance vocale. Les téléphones intelligents l’utilisent tous », précise le chercheur.

Et déjà les applications industrielles s’annoncent multiples : traduction automatique, détection des fraudes, fouille de données (pour la finance et les assurances notamment), traitement d’images issues des IRM ou la découverte de nouvelles molécules. Tous des domaines où la gestion d’immenses lots de données d’information (Big Data) doit être simplifiée.

Lorsque l’ordinateur rêve

En laboratoire, le professeur pousse ses superordinateurs – ceux du réseau Calcul Québec – à générer leurs propres images ou leurs propres mélodies. « Après écoute, l’ordinateur peut générer des extraits musicaux inspirés de la première mélodie, mais originaux. »

À l’aide d’exemples, l’équipe de recherche incite les ordinateurs à « imaginer » une réponse similaire aux représentations fournies avec le moins de supervision possible. Ce « rêve » sera alors projeté par la machine sous forme d’image, de musique ou de paroles. Loin de la magie, ces prodigieux calculateurs s’appuient sur les données statistiques apprises pour recréer à leur tour leur propre « vision » de la réalité.

Le chercheur rêve, quant à lui, à un futur proche où les ordinateurs pourront comprendre le monde qui nous entoure. « Je cherche à comprendre les principes mathématiques qui permettront à un ordinateur de développer cette connaissance », indique-t-il. Et cette capacité à créer de l’intelligence pourrait un jour s’écrire simplement sous la forme d’une formule mathématique, à la fois simple et complexe.

Pour en savoir plus

Researcher Dreams Up Machines That Learn Without Humans, un article sur les recherches de Yoshua Bengio (Wired)

Deep Generative Stochastic Networks Trainable by Backprop, par Yoshua Bengio et Éric Thibodeau-Laufer

Une application à la transcription de la musique (de l'acoustique vers la partition) par l’équipe du DIRO

Scientists see Promise in Deep-Learning, dans le New York Times, novembre 2012

Lien vers l’article original