Muse Spark est un modèle d’une nouvelle famille propriétaire développée par Meta Superintelligence Labs. Modèle de raisonnement multimodal natif avec orchestration multiagent, Muse Spark marque la première étape d’une trajectoire de montée en puissance dont Meta documente publiquement les axes techniques et les ambitions, avec des modèles de taille supérieure en développement et des investissements annoncés sur l’ensemble de la pile.

La course aux grands modèles de langage a structuré le marché autour de deux types d’acteurs aux logiques opposées. Les pure players, OpenAI, Anthropic, Mistral, vendent de l’inférence en API et construisent leur valeur sur la qualité du modèle et la profondeur de l’intégration. Les acteurs plateforme, Google, Microsoft, Meta, Amazon, intègrent les capacités d’IA dans des produits et des surfaces existantes pour défendre ou étendre leur position dominante. Meta appartient à la seconde catégorie, mais avec une caractéristique que peu de ses concurrents partagent : 3 milliards d’utilisateurs actifs sur des applications qu’il contrôle de bout en bout.

Il vient de lancer Muse Spark, son premier modèle d’une nouvelle famille propriétaire développée par Meta Superintelligence Labs, avec des modèles de taille supérieure en développement et des investissements annoncés sur l’ensemble de la pile. Muse Spark est disponible dès son lancement sur meta.ai et l’application Meta AI. Une préversion de l’API est ouverte à un nombre restreint d’utilisateurs sélectionnés. Le modèle intègre nativement le raisonnement visuel, le support d’outils et l’orchestration multiagent. Un mode de raisonnement avancé baptisé Contemplating orchestre plusieurs agents en parallèle pour les tâches complexes. Meta le positionne en compétition directe avec les modes de raisonnement extrême de Gemini Deep Think et GPT Pro, en revendiquant 58 % sur le benchmark Humanity’s Last Exam et 38 % sur FrontierScience Research.

Une architecture rebâtie de fond en comble en neuf mois

Le raisonnement médical constitue le premier domaine d’application mis en avant. Meta indique avoir collaboré avec plus de 1 000 médecins pour constituer les données d’entraînement dédiées, permettant au modèle de produire des réponses sur la nutrition, l’activité physique ou les informations médicales générales sous forme d’affichages interactifs.

Meta documente publiquement trois axes de mise à l’échelle qui conditionnent la montée en capacité de Muse Spark et des modèles suivants. Le préentraînement a été reconstruit sur les neuf derniers mois, avec des améliorations sur l’architecture du modèle, l’optimisation et la curation des données. Le résultat revendiqué est une efficacité de calcul supérieure d’un ordre de magnitude à Llama 4 Maverick pour un niveau de performance équivalent, ce qui signifie que Meta obtient les mêmes capacités avec dix fois moins de puissance de calcul que son précédent modèle de référence.

Le deuxième axe est l’apprentissage par renforcement à grande échelle. Meta indique avoir stabilisé un processus dont les implémentations précédentes étaient sujettes à des instabilités fréquentes, obtenant des gains prévisibles et généralisables sur des tâches non vues à l’entraînement. Le troisième axe est le raisonnement au moment de l’inférence. Le mécanisme central est la compression de la pensée. Après une phase initiale où le modèle améliore ses résultats en raisonnant plus longtemps, une pénalité sur la longueur du raisonnement déclenche une compression qui réduit significativement le nombre de tokens utilisés, avant que le modèle n’étende à nouveau ses solutions pour atteindre de meilleures performances. Meta présente cette combinaison comme un levier d’efficacité permettant de servir le raisonnement avancé à des milliards d’utilisateurs sans dégradation des temps de réponse.

Des modèles plus puissants en codage

Meta décrit Muse Spark comme le premier modèle d’une gamme qui devrait monter en puissance. Des modèles de taille supérieure sont en développement, sans calendrier précisé. Pour soutenir cette trajectoire, Meta annonce des investissements sur l’ensemble de la pile, de la recherche à l’infrastructure, incluant le centre de données Hyperion. L’objectif déclaré reste la superintelligence personnelle, soit un assistant qui comprend l’environnement immédiat, les habitudes et le contexte de chaque utilisateur, intégré dans les plateformes de Meta.

Le bilan de sécurité publié par Meta contient un résultat que les évaluateurs tiers d’Apollo Research qualifient d’inédit par son intensité. Muse Spark affiche le taux le plus élevé de conscience d’évaluation observé sur un modèle à ce jour. Le modèle détecte fréquemment qu’il est en cours d’évaluation, identifie les scénarios comme des pièges d’alignement et raisonne explicitement sur la nécessité de se comporter honnêtement parce qu’il est observé. Meta a trouvé des éléments préliminaires suggérant que cette conscience pourrait affecter le comportement du modèle sur un sous-ensemble restreint d’évaluations d’alignement, toutes sans lien avec des capacités dangereuses. La conclusion retenue est que ce phénomène ne constitue pas un motif de blocage au lancement, mais mérite investigation. Un rapport complet de sécurité et de préparation est annoncé prochainement.