MongoDB ajoute de nouvelles capacités, des améliorations de performance et une intégration de flux de données pour MongoDB Atlas VectorSearch, afin de faciliter et accélérer la création d’applications d’IA générative. Annoncé en preview en juin dernier, MongoDB Atlas VectorSearch permet aux développeurs d’agréger et de filtrer les données, ce qui améliore la recherche sémantique d’informations et réduit les hallucinations (c’est-à-dire générer des informations inexactes) dans les applications alimentées par l’IA.

Une base de données vectorielle est un type de base de données qui stocke les données sous forme de vecteurs, qui sont des représentations mathématiques de caractéristiques ou d’attributs. Chaque vecteur possède un certain nombre de dimensions, qui peuvent aller de dizaines à des milliers, en fonction de la complexité et de la granularité des données.  

Comprendre les données de manière contextuelle

Les bases de données vectorielles permettent aux modèles d’apprentissage automatique de se souvenir plus facilement des entrées précédentes, ce qui permet d’utiliser l’apprentissage automatique pour la recherche, les recommandations et la génération de textes. Les données peuvent être identifiées sur la base de métriques de similarité plutôt que de correspondances exactes, ce qui permet à un modèle linguistique de comprendre les données de manière contextuelle.

Chaque vecteur d’une base de données vectorielle correspond à un objet ou à un élément, qu’il s’agisse d’un mot, d’une image, d’une vidéo, d’un film, d’un document ou de tout autre élément de données. Ces vecteurs sont souvent longs et complexes, exprimant l’emplacement de chaque objet selon des dizaines, voire des centaines de dimensions. Elles permettent de stocker et d’extraire des vecteurs, lesquels sont représentés comme des points dans un espace à haute dimension.

Elles ajoutent des capacités supplémentaires pour une recherche efficace et rapide des plus proches voisins dans un espace à n dimensions. Les bases de données vectorielles sont généralement utilisées pour alimenter les cas d’utilisation de la recherche vectorielle tels que la recherche visuelle, sémantique et multimodale. Plus récemment, elles ont été associées à des modèles textuels d’intelligence artificielle générative pour créer des agents intelligents qui proposent des expériences de recherche conversationnelle.  

Une plateforme de données flexible, unifiée et multicloud

Travailler avec des données vectorielles est une nouveauté pour de nombreuses organisations, et les bases de données vectorielles à usage unique sont apparues comme une solution à court terme pour le stockage et le traitement des données pour les LLM. Cependant, l’ajout d’une base de données à usage unique à leur pile technologique pose un défi : les développeurs doivent consacrer du temps et des efforts pour maîtriser les subtilités du développement et de la maintenance de chaque solution spécifique.

Par exemple, les développeurs doivent synchroniser les données entre les magasins de données pour s’assurer que les applications peuvent répondre en temps réel aux demandes des utilisateurs finaux, ce qui est difficile à mettre en œuvre et peut augmenter considérablement la complexité, le coût et les risques pour la sécurité. De nombreuses bases de données à usage unique n’ont pas non plus la flexibilité nécessaire pour fonctionner en tant que service géré sur n’importe quel grand fournisseur de cloud afin d’obtenir des performances et une résilience élevées, ce qui limite considérablement les options d’infrastructure à long terme.

En raison de ces défis, les organisations, qu’il s’agisse de startups en phase de démarrage ou d’entreprises bien établies, cherchent à stocker des vecteurs, ainsi que toutes leurs données, dans une plateforme de développement de données flexible, unifiée et multicloud. Ceci dans le but de déployer rapidement des applications et d’améliorer l’efficacité opérationnelle. MongoDB Atlas VectorSearch relève ces défis en fournissant les capacités nécessaires pour créer des applications d’IA générative sur n’importe quel fournisseur de cloud majeur, assurant ainsi une haute disponibilité et une résilience avec nettement moins de temps et d’efforts.