Alors que les LLM dépassent largement la centaine de milliards de paramètres, les SLM (Small Langage model) se contentent d’un corpus de données beaucoup plus réduit. Selon le cabinet d'études américain Gartner, ces petits modèles de langage adaptés aux besoins métiers et aux tâches spécialisées, séduisent les organisations. Gartner avance que d'ici à 2027, les usages des SLM seront au moins trois fois supérieurs à ceux des LLM.
De fait, les petits modèles de langage sont plus précis dans les tâches spécifiques, nécessitent moins de puissance de calcul et fonctionnent sur des infrastructures plutôt simples. Les entreprises peuvent rentabiliser leurs investissements en commercialisant les petits modèles propriétaires.
Sur le plan technique, les entreprises adaptent les grands modèles linguistiques généraux, notamment via le Retrieval-Augmented-Generation (RAG). Ce modèle de langage associe en temps réel la récupération d’informations sémantiques à la génération de texte pour améliorer la vitesse et la précision des réponses.
Les SLM sont issus des LLM de grands acteurs tels LLaMA 3.2 de Meta, GPT-4o Mini d’Open AI ou DistilBERT de Google. Mais aussi de solutions moins connues comme Gemme, Granit 3.0 ou encore Phi-2, ce spécialisé dans les mathématiques et le codage.
Des cas d’usages pour les différents métiers
Les applications des SLM sont multiples et variés, depuis les assistants vocaux pour le support client et les chatbots légers jusqu’aux usages en environnements sensibles tels la Défense, l’aviation et l’industrie. L’analyse de données spécialisées dans le juridique, la banque, l’assurance ou la finance convient parfaitement aux SLM qui sont entraînés sur des données spécifiques.Par exemple, dans la recherche médicale, ils analysent un corpus limité à la littérature scientifique et aux données cliniques pour apporter des réponses très précises. Autre cas d’usage, dans le domaine de l'assurance, les SLM peuvent être utilisés pour des tâches de classification des sinistres ou d'analyse de documents pour réduire le temps de traitement des réclamations.
Les banques utilisent les petites modèles de langage pour traquer plus efficacement les fraudes. L’analyse et le traitement des documents sensibles fait également des applications des SLM. Ils sont adaptés aux secteurs de la défense, de l’aviation et de l’industrie pour éviter de rendre publiques les informations confidentielles.
Une solution qui évite les inconvénients des LLM
Les petites PME et ETI qui ne disposent pas d’un infrastructure minimale pour faire tourner les grands modèles de langage peuvent se tourner vers les SML. Il en va de même pour les applications sur les smartphones.Gartner recommande aux entreprises qui font les choix d’un SLM de cibler les déploiements aux domaines où les connaissances spécialisées sont décisives. Ceux où les LLM généraux ne sont pas pertinents ou trop lents.
D’autre part, le cabinet américain préconise la collaboration entre plusieurs modèles de SLM pour certains cas d’usage. Bien entendu, comme pour les LLM, il est essentiel de préparer et trier les données qui alimenteront les SLM.
Enfin, cela va de soi, il faut des équipes d’experts confirmés de l’IA et du traitement des données pour mettre en place les projets. Et les réussir.