Pour doper sa reconnaissance vocale et visuelle, Google dévore les start-up IA

Pour doper sa reconnaissance vocale et visuelle, Google dévore les start-up IA Le groupe a épinglé 11 jeunes pousses du secteur à son tableau de chasse entre 2011 et 2017, le double d'Apple et Intel. Un record qui en dit long sur ses ambitions dans le domaine.

Alphabet est un véritable Gargantua dans le secteur de l'IA. Le géant a croqué pas moins de onze jeunes pousses du secteur en six ans, selon des données compilées par CB Insights et présentées dans le tableau ci-dessous. Il devance largement les numéros deux ex æquo de cette course au rachat de start-up, Apple et Intel, qui ont chacun mis la main sur cinq entreprises entre 2011 et 2017.

Acquisitions d'Alphabet dans l'IA depuis 2011
Start-up Date Activité
Clever Sense 14/12/2011 Compréhension du langage naturel 
DNNresearch 13/03/2013 Compréhension du langage naturel, reconnaissance visuelle
DeepMind 27/01/2014 Combine les techniques du machine learning et des neurosciences pour construire des algorithmes d'apprentissage généraux
Emu 06/08/2014 Compréhension du langage naturel
Jetpac 16/08/2014 Reconnaissance visuelle
Dark Blue Labs 23/10/2014 Compréhension du langage naturel
Vision Factory  23/10/2014 Reconnaissance visuelle
Granata Decision Systems 23/01/2015 Assistant à la prise de décision en entreprise  
Timeful 04/05/2015 Calendrier intelligent
Moodstocks  06/07/2016 Reconnaissance visuelle
Api.ai  19/09/2016 Crée des API liées à des outils d'IA

"Cette politique d'acquisition frénétique est principalement une stratégie de 'acqui-hire'", souligne Olivier Ezratty, consultant qui fouille régulièrement des thématiques liées à l'IA sur son blog. "Google achète des sociétés pour intégrer des profils de spécialistes de l'intelligence artificielle à ses équipes. Les firmes technologiques se mènent une guerre sans merci pour attirer ces compétences dans leur giron, car elles sont rares sur le marché. Mais elles sont essentielles au développement de plusieurs offres clefs, comme les assistants personnels intelligents ou les logiciels de guidage des véhicules autonomes", complète Grégory Bonnet, chercheur au GREYC (Groupe de recherche en informatique, image, automatique et instrumentation de Caen) à l'Université de Caen Normandie.

Plus de 300 chercheurs travaillent aujourd'hui pour la branche DeepMind du groupe, contre une vingtaine au moment du rachat

Les rachats d'Alphabet marquent également son goût prononcé pour le deep learning, l'une des technologies qui se cache sous le terme générique d'intelligence artificielle. L'apprentissage profond qui fonctionne à partir de réseaux de neurones artificiels est particulièrement adapté à l'analyse du langage oral ou écrit et à la reconnaissance d'images, les deux compétences principales que Google a cherché à développer en s'offrant ces onze start-up.

Le groupe réalise son acquisition phare dans le deep learning en janvier 2014. Il débourse alors 400 millions de dollars pour mettre la main sur la jeune pousse anglaise DeepMind Technologies, qui est devenue SA filiale clef dans l'intelligence artificielle. La pépite a été fondée en 2010 par Demis Hassabis, un ponte de l'apprentissage automatique. Google a massivement investi pour développer les équipes de DeepMind. Plus de 300 chercheurs travaillent aujourd'hui pour cette branche du groupe, contre une vingtaine au moment du rachat. Les nouvelles recrues ont rejoint Alphabet attirées par les salaires élevés proposés, mais également par la renommée de Demis Hassabis.

Mais Google a commencé à s'intéresser au deep learning bien avant cette acquisition. Dès 2011, il recrute le chercheur star de l'apprentissage automatique Andrew Ng. Cet enseignant du département de science informatique de l'université de Stanford est rejoint en 2012 par une autre pointure du secteur, l'ingénieur Ray Kurzweil. L'entreprise complète son pool de talents en rachetant en mars 2013 la start-up canadienne DNN Research. Les algorithmes développés par la jeune pousse ont été intégrés à son assistant vocal intelligent Google Now, sorti en juillet 2012. Ils ont également permis à la société de créer un moteur de recherche de photo basé sur la vision par ordinateur au sein de son réseau social Google+.

Cette politique d'acquisition frénétique de Google est principalement une stratégie de "acqui-hire", Google achète des sociétés pour intégrer des spécialistes de l'IA à ses équipes

Sur les neuf autres acquisitions réalisées par Alphabet dans l'univers de l'IA, six concernent la reconnaissance de l'image ou du langage. Les sociétés américaines Vision Factory, Jetpac et la petite française Moodstock, respectivement entrées dans l'escarcelle de la compagnie en août 2014, octobre 2014 et juillet 2016, font partie de la première catégorie. Elles ont développé des logiciels spécialisés dans l'identification d'objets et de personnes sur des clichés ou des vidéos. Grâce à ces outils, Google peut analyser avec plus de finesse les pages consultées par les internautes sur son moteur de recherche et améliorer son système de recommandation publicitaire. "Ces technologies seront également centrales pour traiter en direct les images des caméras installées sur les futurs véhicules autonomes du groupe et éviter les obstacles qui se présentent sur la route", explique Grégory Bonnet.

Les trois autres start-up appartiennent à la deuxième division : la reconnaissance du langage. En décembre 2011, la firme épingle la jeune pousse américaine Clever Sense à son tableau de chasse. L'entreprise avait développé une application baptisée Alfred, capable de conseiller à son utilisateur des restaurants et des bars dans sa ville, en se basant sur une analyse des recommandations postées sur le net par d'autres internautes. Ce travail de décomposition du sens d'un texte est précieux pour Google, qui l'utilise probablement pour développer des chatbots capables de communiquer de façon fluide et sensée avec leurs utilisateurs (la société refuse de donner des détails sur sa stratégie IA).

Google rachète en mars 2013 la start-up canadienne DNN Research, dont les algorithmes ont été intégrés à son assistant vocal intelligent Google Now

Google a aussi acquis en août 2014 Emu, une entreprise fondée par Gummi Hafsteinsson, un ancien de chez Apple qui a notamment travaillé sur l'assistant vocal Siri. Sa solution de traitement du langage écrit et oral est capable de capter des éléments de contexte et de relier une conversation par mail entre deux de ses utilisateurs avec leur calendrier pour fixer automatiquement un rendez-vous à un endroit donné. "Cette brique de compréhension contextuelle est importante pour développer un assistant virtuel intelligent", pointe Pascal Arbault, PDG de la société Davi, qui conçoit des adjoints virtuels pour les professionnels.

Alphabet s'est également emparé en octobre 2014 de Dark Blue Labs, un spécialiste de la compréhension du langage naturel parlé et écrit. Les solutions technologiques développées par la start-up sont très probablement utilisées par la multinationale dans son assistant vocal Google Assistant, intégré aujourd'hui à son haut-parleur intelligent Google Home et demain peut-être à ses véhicules autonomes.

Le géant du net ne se contente pas de travailler sur des solutions d'IA en tant que tel. Il réfléchit également au meilleur moyen de commercialiser massivement ses nouveaux outils basés sur l'intelligence artificielle – et en particulier Google Home. Pour y parvenir, Alphabet mise notamment sur la création d'applications par des développeurs tiers. Il a créé en décembre 2016 une plateforme de développement pour Google Home. Pas besoin d'être un spécialiste de la reconnaissance du langage pour y concevoir une appli vocale permettant de commander un taxi : Google a racheté en septembre 2016 la jeune pousse API.ai, qui crée des interfaces de programmation connectées à des briques d'IA, comme la compréhension du langage oral. Les développeurs n'ont qu'à y brancher leurs applications pour intégrer ces fonctionnalités d'intelligence artificielle à leurs solutions. De quoi se créer un écosystème pour généraliser l'utilisation de ses services.