Intelligence Artificielle Intelligence Artificielle - Actualités Meta dévoile Llama 3.1, son modèle le plus performant à ce jour

Meta dévoile Llama 3.1, son modèle le plus performant à ce jour

Par

Mourad Krim

26/07/2024

Meta a récemment dévoilé Llama 3.1, sa nouvelle génération de modèles d'intelligence artificielle open source. Les ambitions de Meta avec ce modèle sont claires : surpasser les performances des autres concurrents majeurs tels que GPT-4 d'OpenAI et Claude 3.5 d'Anthropic.

Llama 3.1 405B (pour 405 billions de paramètres) se positionne comme le modèle open source le plus avancé à ce jour, selon Meta, et offre des performances améliorées dans plusieurs benchmarks clés par rapport à ses prédécesseurs et compétiteurs.

En avril dernier, Meta a laissé entendre qu'elle travaillait sur quelque chose d'important : un modèle d'IA open-source qui pourrait rivaliser avec les meilleurs modèles d'entreprises comme OpenAI. Ce modèle est désormais disponible en open source. Selon une lettre de Mark Zuckerberg publiée sur le blog de Meta, les modèles d'IA à code source ouvert finiront par dépasser les modèles propriétaires, un peu comme Linux est devenu le système d'exploitation à code source ouvert dominant.

Llama 3.1 405B est beaucoup plus avancé que les petits modèles de Llama 3 qui ont été mis sur le marché il y a quelques mois. Avec ses 405 milliards de paramètres, il a été entraîné sur plus de 15 trillions de tokens en utilisant 16 000 GPU H100 de Nvidia. Il a une longueur de contexte de 128k, peut discuter en huit langues. Cela permet de prendre en charge des cas d'utilisation avancés tels que la synthèse de textes longs, les agents conversationnels multilingues et les assistants de codage.

Meta a également modifié sa licence pour permettre aux développeurs d'utiliser les résultats des modèles Llama, y compris le 405B, pour améliorer d'autres modèles. Ces modèles sont disponibles en téléchargement sur llama.meta.com et Hugging Face, ainsi que pour le développement sur les plateformes partenaires.

Pour cette version, Meta a évalué les performances de Lllama 3.1 sur plus de 150 ensembles de données de référence couvrant une large gamme de langues. De plus, des évaluations humaines approfondies ont été réalisées pour comparer Llama 3.1 avec des modèles concurrents dans des scénarios réels. Les résultats expérimentaux suggèrent que le modèle phare de Meta est compétitif avec les principaux modèles de base, y compris GPT-4, GPT-4o et Claude 3.5 Sonnet.

Meta dévoile Llama 3.1, son modèle le plus performant à ce jour

Derniers articles de fond

Pourquoi l’usage de l’IA recule en entreprise pour la première fois...

Pipelines de données intégrés : les implications contractuelles et souveraines d’une recomposition

Comment les caractères Unicode invisibles permettent d’injecter des maliciels indétectables dans...

Derniers livres blancs

Voir ce que les attaquants voient : reprenez la main sur...

Réussir ma migration de messagerie vers exchange on line

Pourquoi et comment migrer sharepoint maintenant

Dernières actualités

UiPath s’associe à Deloitte pour automatiser les exceptions et les flux...

Le Label France Cybersecurity distingue 91 solutions pour orienter la commande

Cisco Secure AI Factory, une architecture unifiée pour déployer et sécuriser...

NetApp lance AI Data Engine et repositionne Ontap comme pipeline de...

Derniers Articles de fond

Pourquoi l’usage de l’IA recule en entreprise pour la première fois...

Pipelines de données intégrés : les implications contractuelles et souveraines d’une recomposition

Comment les caractères Unicode invisibles permettent d’injecter des maliciels indétectables dans...

Dernières Actualités

UiPath s’associe à Deloitte pour automatiser les exceptions et les flux...

Le Label France Cybersecurity distingue 91 solutions pour orienter la commande

Cisco Secure AI Factory, une architecture unifiée pour déployer et sécuriser...

Dernières Expériences

Organisation d’un exercice de crise cyber | RSSI – Ville de...

Sensibilisation des jeunes sur la cybercriminalité | Général de division –...

Migration de l’infrastructure traditionnelle vers AWS | DevOps – Algofi |...