L'intelligence artificielle générative désigne les algorithmes utilisés pour créer de nouveaux contenus à partir de données brutes massives: audio, code, images, texte, simulations et vidéos. Le plus connu est ChatGPT qui répond de manière plausible aux requêtes des utilisateurs. Il s’agit d’un saut technologique important du traitement du langage naturel pour la création de contenu textuel ou multimédia.

L’IA générative est capable de répondre à des requêtes formulées par un être humain en langage naturel, avec un excellent niveau grammatical et syntaxique. De nombreux modèles génératifs d’IA, surtout GPT-4 (Generative Pre-trained Transformer) le plus connu mais aussi Stable Diffusion ou encore GitHub Copilot, connaissent les feux de la rampe depuis peu pour les professionnels et le grand public. Plus précisément, ce sont des « transformeurs » à savoir une architecture spécifique de réseau neuronal auto-apprenant, basée sur le machine learning. Ce dernier est capable d’interpoler des informations en créant une situation nouvelle proche de cas d’usages observés pendant l’entrainement du modèle.

Reste à relever le grand défi des problèmes éthiques, de sécurité, de propriété intellectuelle ou encore d’amélioration des algorithmes.

L’IA générative, comment ça marche ?

Bien meilleure que les chatbots interrogés via des mots-clés et qui donnent un résultat décevant, les IA génératives permettent une continuité dans l’échange avec un modèle de traitement entrainé sur un énorme volume de données issue de plusieurs sources telles l’exploration du web, la Wikipedia en anglais etc., chacune ayant un poids différent. En bref, GPT, par exemple, cherche à deviner le prochain mot d’un texte en complétant les mots d’une requête. C’est une tâche qui ne correspond pas au comportement humain mais elle est adaptée aux algorithmes de traitement. Pour cela, GPT utilise un modèle de tokens (jetons) qui intègrent une partie des mots, la version 3 de GPT en comportait 32.000. Des dizaines de milliards de paramètres sont nécessaires pour couvrir tous le champ des questions posées dans tous les domaines. Pour éviter des réponses impolies, racistes, irrespectueuses ou hors sujet, un filtrage manuel qui pondère les réponses est effectué par de nombreux assistants dans le monde entier pour corriger l’algorithme. Les résultats obtenus sont très plausibles et ne reprennent pas des phrases existantes comme les moteurs de recherche, ce qui fait la nouveauté de ce type d’IA.

En revanche, la qualité des sources citées à la fin des réponses est à ce jour médiocre. Les IA génératives produisent des références crédibles mais qui sont erronées. Ceci est du au mode d’auto-complétion qui leur est propre.

De même, les réponses font souvent appel à des informations anciennes.

Quels sont les usages de l’IA générative ?

Outre les réponses à des questions en mode chat évolué comme ChatGPT, les IA génératives telles DALL-E, et Midjourney peuvent créer des images à partir de requêtes textuelles comme celle que nous avons crée ci-dessous avec MidJourney. Il est aussi possible de créer plusieurs variantes à partir d’une image originale.



Côté vidéo, une requête textuelle peut générer une séquence animée avec des outils comme Fliki qui est gratuit, Synthesia et Creative Reality Studio (basé sur GPT 3) ou encore Stable diffusion, un modèle public d'apprentissage automatique mais qui ne répond pas aux règles du logiciel libre.

Concernant la création de code informatique, des modèles de langage savent créer du code source pour produire de nouveaux programmes informatiques, par exemple, OpenAI Codex.

De nombreux autres domaines sont investis par les outils d’IA générative, tels la recherche sur de nouvelles molécules avec AlphaFold, la musique avec MusicLM et bien d’autres usages.

Les 3 meilleurs articles sur l’IA générative

1- L’IA générative est un investissement stratégique pour les entreprises

L'IA générative et d'autres modèles de fondation (foundation models) changent la donne en matière de numérique, apportant la cognition aux systèmes informatique, qui vont reléguer les anciens modèles au rang de solution à peine plus évoluées que des machines automatiques… (suite)

2 - OpenAi lance GPT-4, le modèle de langage multimodal est à présent intégré dans ChatGPT et Bing

Un peu moins de deux ans après la sortie de la version trois du modèle de langage à la base de ChatGPT, OpenAI annonce la sortie de la version quatre, GPT-4… (suite)

3 - L’IA générative et ChatGPT : une aubaine pour le phishing

L'ingénierie sociale, et plus particulièrement les cybercampagnes malveillantes diffusées par e-mail, reste la principale source de vulnérabilité d'une organisation… (suite)