Oracle vient de lancer le service Oracle Cloud Infrastructure (OCI) Generative AI, marquant une étape clé dans le virage vers l’IA effectué par les grands fournisseurs mondiaux. OCI Generative AI est un service entièrement géré qui fournit un ensemble de grands modèles de langage personnalisables. La solution permet aux clients d’essayer des modèles prêts à l’emploi ou de créer et d’héberger leurs propres modèles personnalisés, basés sur leurs données, et hébergés sur des grappes d’IA dédiées.

Dans le contexte actuel du boom de l’IA générative, et face à la concurrence disruptive des startups qui se lancent dans l’aventure, les fournisseurs mondiaux consolident leurs offres avec des approches légèrement différentes, tantôt ciblant les développeurs, tantôt les utilisateurs finaux, ou les deux. OCI Generative AI est conçu pour intégrer les modèles de langage de grande taille de Cohere et Meta Llama 2, offrant une solution complète pour un large éventail d’applications professionnelles. Il cible principalement les développeurs et les entreprises cherchant à intégrer des fonctionnalités d’intelligence artificielle générative dans leurs applications et processus métier.  

Disponible aussi bien dans le cloud d’Oracle que sur site

Les fonctionnalités proposées, telles que la personnalisation des modèles d’IA générative, l’ajustement fin des modèles avec des données spécifiques à l’entreprise, et l’accès facilité aux LLMs via des appels d’API, sont particulièrement pertinentes pour les développeurs. Ces outils leur permettent de créer des solutions personnalisées qui répondent aux besoins spécifiques de leur entreprise ou de leurs clients, en intégrant l’IA générative pour automatiser la génération de texte, la synthèse, ou accomplir des tâches de similarité sémantique. Supportant plus de 100 langues, ce service se distingue par une gestion améliorée des grappes de GPU et des options avancées pour la personnalisation et le réglage fin des modèles. Disponible aussi bien dans le cloud d’Oracle que sur site grâce à OCI Dedicated Region, cette offre permet à OCI de couvrir un large éventail de cas d’usage et de besoins diversifiés de ses clients.

L’éditeur a mis l’accent sur l’intégration de technologies pour renforcer son portefeuille de solutions cloud et de bases de données, proposant aux entreprises les outils nécessaires pour faciliter la personnalisation des modèles d’IA générative pour résoudre des problèmes spécifiques tels que la génération de texte, la synthèse et les tâches de similarité sémantique, grâce à l’utilisation de techniques de génération augmentée de récupération (RAG). Un agent RAG, ou Retrieval-Augmented Generation (Génération Augmentée par Recherche) est une approche dans le domaine de l’intelligence artificielle générative qui combine la capacité de récupération d’informations avec la génération de texte pour améliorer la qualité et la pertinence des réponses générées par les modèles de langage.  

La solution combine des LLM et OCI Open Search

La version bêta d’OCI Generative AI Agents, intégrant un agent RAG, combine la puissance des LLM et d’OCI Open Search pour fournir des résultats contextualisés enrichis par les données d’entreprise. Cette approche permet une interaction naturelle avec les données d’entreprise sans nécessiter de compétences spécialisées, rendant l’information accessible et à jour. Oracle prévoit d’élargir le support à un plus large éventail d’outils de recherche et d’agrégation de données dans les futures versions, intégrant des technologies comme Oracle Database 23c AI Vector Search et MySQL HeatWave Vector Store.

Cette stratégie permet à Oracle de combiner ses solutions de bases de données avec l’IA générative pour proposer des outils intégrés de développement d’applications. Avec le lancement de fonctionnalités telles que OCI Data Science AI Quick Actions, Oracle simplifie également l’accès aux LLMs open source, facilitant la création, l’entraînement, le déploiement et la gestion des modèles d’IA.