Données, cloud : comment les big tech « vampirisent » l'IA générative

L'Autorité de la concurrence s'inquiète de « l'avantage immense » déjà acquis par les géants du numérique comme Microsoft, Nvidia ou Alphabet (Google) dans la course à l'intelligence artificielle générative, et met en garde contre les risques d'abus des big tech pour verrouiller la concurrence. Pour les nouveaux acteurs, les marges de manœuvre pour coexister sont réelles, mais surtout en aval de la chaîne de valeur.

Sylvain Rolland

01 Juill 2024, 16:48

Et à la fin, ce sont les géants américains qui gagnent ? C'est la crainte de l'Autorité de la concurrence, qui a publié le 28 juin un rapport mettant en garde contre le « risque oligopolistique » des big tech dans l'intelligence artificielle générative. Dans cet avis consultatif rendu public, et écrit en seulement quatre mois, le gendarme français décrit par le détail « l'avantage immense » déjà acquis par les champions mondiaux du numérique, et comment les solides barrières à l'entrée qu'ils ont mis en place compliquent la vie des nouveaux entrants.

Notamment en amont de la chaîne de valeur, c'est-à-dire aux étapes d'entraînement et d'inférence (utilisation) des larges modèles de langage (LLM), où une poignée d'acteurs américains - Nvidia pour les processeurs graphiques ainsi que Microsoft et Google pour le cloud et la distribution, pour ne citer qu'eux - sont déjà devenus incontournables.

Des avantages dès la ligne de départ

« Pour la première fois, une innovation de rupture majeure, l'IA générative, est potentiellement contrôlée dès le départ par des acteurs en place », estime Benoît Coeuré, le président de l'Autorité de la Concurrence. De fait, si « personne ne peut se risquer à pronostiquer l'état du marché dans cinq ans », en raison de « l'évolution très rapide des technologies », les big tech américaines partent avec une longueur d'avance, grâce à leur puissance financière et aux positions dominantes déjà acquises dans d'autres marchés du numérique.

Car ce n'est pas un hasard si Microsoft et Alphabet (maison-mère de Google), ont rapidement pris l'ascendant dans l'IA générative. Champions de l'investissement en R&D dans l'intelligence artificielle depuis des années, ils bénéficient pleinement de leur puissance dans le secteur du cloud, qu'ils dominent avec Amazon Web Services, et qui est la pierre angulaire du développement de l'IA générative. Et pour cause, le cloud est à la fois la solution privilégiée pour l'entraînement et la spécialisation des modèles de langage, mais aussi pour le déploiement des solutions d'IA auprès des entreprises.

En outre, les nombreux marchés numériques déjà dominés par les big tech leur permettent de bénéficier d'un « accès privilégié » aux intrants nécessaires pour l'entraînement et le développement des modèles de fondation. Or, ces avantages « ne sont pas aisément réplicables par les développeurs de modèles de fondation concurrents », souligne le rapport.

Par exemple, grâce à son moteur de recherche, aux accords passés avec les éditeurs de contenus comme Le Monde et autres, et à YouTube qui domine le marché mondial de la vidéo en ligne, Alphabet dispose de sources majeures de données d'entraînement pour ses modèles d'IA. Idem pour Meta, la maison-mère de Facebook et Instagram, qui profite des données associées à l'utilisation de ses services par des milliards d'individus. Immensément riches, ces entreprises peuvent conclure des accords avec des propriétaires de données tiers, à l'image des 60 millions de dollars par an dépensés par Google pour accéder aux données du site communautaire Reddit.

Effet pieuvre

Au-delà des données, les big tech bénéficient aussi d'un accès facilité à la puissance de calcul. A la fois partenaires et concurrents des fournisseurs de puces pour l'IA comme Nvidia, ces entreprises « ont la capacité d'acheter en grande quantité et de négocier des accords préférentiels avec les fournisseurs de processeurs graphiques », relève l'avis de l'Autorité. Cette question sensible de la concurrence dans les processeurs graphiques fera même l'objet d'un avis prévu d'ici à la fin de l'année.

Les big tech sont aussi avantagées dans la bataille des talents : ces entreprises peuvent facilement faire grimper les enchères pour recruter les profils les plus rares... et larguer les entreprises plus petites qui n'ont pas les moyens de suivre. « Des accords de non-débauchage sont parfois signés, et des employés stratégiques peuvent être pris d'assaut par les géants du numérique », relève en outre Benoît Coeuré, en faisant référence au recrutement par Microsoft d'une grande partie des 70 employés de la startup Inflection AI.

Enfin, les géants du numérique peuvent réaliser des économies d'échelle importantes grâce aux avantages liés à leur « intégration verticale et conglomérale », qui leur garantit l'accès aux utilisateurs. Traduction ? Ils intègrent l'IA générative dans leurs propres produits et services, à l'image d'Apple et de Google dans leurs smartphones, ou encore Microsoft qui déploie ses propres modèles et ceux de son partenaire OpenAI, dans son outil Copilot, ce qui leur donne un avantage concurrentiel de nature à possiblement fausser la concurrence.

De même, leurs places de marché permettent d'accéder à des modèles d'IA générative, propriétaires ou de tiers, qui sont conçus pour fonctionner dans leur écosystème, ce qui contribue, par effet ricochet, à renforcer la dépendance des acteurs tiers à leurs solutions.

Résultat, sans poches très pleines, il est très difficile aux nouveaux entrants de se faire une place. Le coût faramineux des processeurs graphiques, de l'accès aux données, et celui des talents, sont responsables de l'inflation des levées de fonds dans le secteur de l'IA depuis deux ans.

Pour rivaliser avec OpenAI - dans lequel Microsoft a investi plus de 13 milliards de dollars depuis 2019 -, les startups telles le français Mistral AI n'ont pas d'autre choix que recourir régulièrement aux investisseurs, tout en restant sous-financées face aux capacités quasi-illimitées des big tech.

De nombreux risques d'abus, certains déjà constatés

Pour toutes ces raisons, l'Autorité de la concurrence identifie de nombreux risques d'abus. Au niveau des composants informatiques, des risques de « fixations de prix, de restrictions d'approvisionnement, de conditions contractuelles déloyales ou des comportements discriminatoires » sont à craindre. Ils ont déjà été dénoncés par l'association professionnelle France Digitale, qui fédère plus de 2.000 startups et investisseurs. La dépendance du secteur envers le logiciel de programmation de puces Cuda de Nvidia, seul environnement parfaitement compatible avec les processeurs de calcul accéléré, est aussi à craindre.

Benoît Coeuré s'inquiète également du « risque de verrouillage par les grands fournisseurs de cloud ». Ceux-ci pourraient abuser des crédits cloud - ces offres de cloud gratuites pour aider les entreprises à leur lancement -, qui les enferment dans leurs écosystèmes en compliquant la migration vers un autre service. « Des pratiques de verrouillage techniques ont déjà été identifiées », pointe le rapport.

Concernant l'accès aux données, les accords entre les big tech et les fournisseurs de contenus pour nourrir l'entraînement des modèles de fondation, sont dans le viseur des régulateurs. L'Autorité de la concurrence a déjà sifflé la fin de la récréation pour Google, condamné à une amende de 250 millions d'euros en avril dernier pour avoir entraîné illégalement son IA Bard, devenue Gemini, sur les contenus des éditeurs de presse, sans leur accord.

Enfin, la superpuissance financière des big tech inquiète, car elle peut permettre à quelques entreprises, notamment Microsoft, Alphabet, Amazon, Intel, Salesforce ou encore Nvidia, de tenter de verrouiller le marché autour d'elles, ou de se mettre en position d'être des interlocuteurs et partenaires obligatoires de tout nouvel acteur sérieux. L'exemple de Mistral AI, qui a signé des accords de distribution avec Microsoft Azure et Amazon Web Services et qui a accepté un petit financement du premier, est révélateur du fait qu'il existe peu de voies alternatives aux big tech pour devenir un acteur de rang mondial.

Financement Ia générative

Des marges de manœuvre existent, mais...

Que faire face au constat que le secteur de l'IA générative est déjà dominé de la tête et des épaules par les big tech, et que ces entreprises disposent de tous les atouts pour s'adapter à toute évolution du secteur ? Benoît Coeuré préfère relativiser :

« Pour éviter une situation oligopolistique, qui reste une vraie menace malgré les incertitudes sur qui dominera le secteur dans cinq ans, les régulateurs doivent comprendre les enjeux, réagir vite en cas d'abus ou de manquement, et ne pas hésiter à activer pleinement ce que le droit constant leur permet déjà de faire », estime le président de l'autorité administrative indépendante.

L'Autorité propose ainsi plusieurs pistes très concrètes, à commencer par développer l'accès à la puissance de calcul pour les startups, via la poursuite des investissements dans les supercalculateurs au niveau européen. « Donner aux entreprises privées l'accès aux supercalculateurs publics, contre rémunération bien sûr, serait un levier intéressant pour réduire les inégalités d'accès aux données entre les startups et les géants du numérique, tout en développant l'écosystème des logiciels d'IA spécialisés de bout de chaîne », précise le président de l'Autorité de la concurrence.

Dans la même veine, faciliter l'accès aux données de la sphère publique, et notamment les données francophones, pourrait aider au développement d'une filière française de l'IA générative. Enfin, le régulateur encourage les différentes autorités (CNIL, futur Bureau de l'IA qui sera mis en place suite à l'entrée en application du règlement IA...) à appliquer pleinement ce que permet déjà le droit et à veiller à ne pas créer des effets négatifs sur les petits acteurs. L'objectif : éviter ce que le secteur surnomme « l'effet RGPD », le règlement européen sur les données personnelles, qui s'est révélé plus contraignant pour les petits acteurs que pour les gros dans sa mise en place.

L'Autorité suggère aussi quelques pistes à l'Union européenne. Notamment de « porter une attention particulière », dans le cadre du règlement sur les marchés numériques (DMA), aux acteurs de l'IA générative. Autrement dit, intégrer dans la liste des contrôleurs d'accès au titre du DMA, des acteurs de l'IA générative dominants et incontournables tels que OpenAI.

Reste le plus important : cette domination des big tech peut-elle être évitée ? L'Autorité de la concurrence botte en touche, tout en admettant que les géants du numérique sont aujourd'hui déjà incontournables sur l'amont de la chaîne de valeur, c'est-à-dire les infrastructures d'IA et la modélisation-entraînement des modèles de fondation. Reste donc l'aval, c'est-à-dire les nombreux acteurs créant des services d'IA générative à destination du grand public, des entreprises et des acteurs publics. Les big tech s'y positionnent aussi, mais il y a de la place pour des acteurs plus petits et plus spécialisés, qui peuvent exploiter d'autres types de données, notamment publiques, que celles détenues par les géants du Net.

Sujets les + lus

Sujets les + commentés

Eumetsat : l'Allemagne met KO la France en imposant SpaceX au détriment d'Ariane 6

Législatives : un « nouveau front républicain » tente de se mettre en place face au RN

Guerre en Ukraine : les munitions européennes arrivent enfin en grand nombre

Électricité : comment un bug de découplage avec l'Allemagne a fait plonger les prix français

Si le RN était au pouvoir : les scénarios du chaos

Commentaires 4

Asimon à écrit le 02/07/2024 à 14:30

Signaler

L'IA générative est un simulacre de l'intelligence humaine qui consomme une quantité extraordinaire d'électricité. Tout ça pour ça ?

Dossier 51 à écrit le 02/07/2024 à 8:25

Signaler

Et cette autorité de la concurrence ne s'est jamais inquiété par contre de la nocivité de tout ces vieux lobbys qui pourrissent la planète et son humanité ? Ben tiens le danger ce sont les GAFAM si si c'est sûr... mais quelle hypocrisie !

churchill à écrit le 01/07/2024 à 19:20

Signaler

wow, les modeles de langage, c'est bien!! avant il y avait les backpropagation trough time bpnn,, les reseau de jordan, la generalisation des reseaux recurrents puis lstm et consors.......apres on a travaille sur les traductions y compris avec bert d...

Réponse de Orel le 02/07/2024 à 0:33

Signaler

L'Europe dépense beaucoup trop d'énergie à essayer d'utiliser les réglementations pour écraser la concurrence étrangère et beaucoup trop peu d'énergie à essayer d'innover ou simplement de créer un environnement et une culture propices à l'innovation....

Merci pour votre commentaire. Il sera visible prochainement sous réserve de validation.

Informatique

Données, cloud : comment les big tech « vampirisent » l'IA générative

Des avantages dès la ligne de départ

Effet pieuvre

De nombreux risques d'abus, certains déjà constatés

Des marges de manœuvre existent, mais...

Newsletter - Tech & Médias