Hermes 3 70B
Hermes 3 70B est un LLM open-weights de Nous Research, publié le 15 août 2024 sous licence Apache 2.0, avec usage commercial autorisé. À près de deux ans, c'est un modèle ancien à l'échelle de l'IA: sa lecture vaut surtout comme photographie d'un 70 milliards de paramètres compétitif…
Hermes 3 70B est un LLM open-weights de Nous Research, publié le 15 août 2024 sous licence Apache 2.0, avec usage commercial autorisé. À près de deux ans, c'est un modèle ancien à l'échelle de l'IA: sa lecture vaut surtout comme photographie d'un 70 milliards de paramètres compétitif dans sa génération, plutôt que comme référence de pointe actuelle.
Son profil combine une fenêtre de contexte de 131 072 tokens, une base de connaissances arrêtée au 31 décembre 2023 et un prix très bas: 0,7 $ par million de tokens en entrée comme en sortie. Ce positionnement tarifaire le place 64% sous la moyenne des LLM similaires et environ 6,9 fois moins cher que les modèles frontière.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Nous Research |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 15 août 2024 |
| Connaissances jusqu'à | 2023-12-31 |
| Multimodal | non |
| Paramètres | 70 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MT-Bench | 89,9 % | 4ᵉ / 12 | llm-stats | Auto-déclaré |
| HellaSwag | 88,2 % | 7ᵉ / 27 | llm-stats | Auto-déclaré |
| BoolQ | 88,0 % | 1ᵉ / 10 | llm-stats | Auto-déclaré |
| PIQA | 84,4 % | 2ᵉ / 11 | llm-stats | Auto-déclaré |
| Winogrande | 83,2 % | 7ᵉ / 22 | llm-stats | Auto-déclaré |
| ARC-E | 83,0 % | 3ᵉ / 8 | llm-stats | Auto-déclaré |
| IFBench | 81,2 % | 2ᵉ / 27 | llm-stats | Auto-déclaré |
| MMLU | 79,1 % | 64ᵉ / 98 | llm-stats | Auto-déclaré |
| BBH | 67,8 % | 11ᵉ / 12 | llm-stats | Auto-déclaré |
| GPQA | 66,1 % | 127ᵉ / 213 | llm-stats | Auto-déclaré |
| ARC-C | 65,5 % | 27ᵉ / 34 | llm-stats | Auto-déclaré |
| TruthfulQA | 63,3 % | 6ᵉ / 18 | llm-stats | Auto-déclaré |
| AGIEval | 56,2 % | 4ᵉ / 10 | llm-stats | Auto-déclaré |
| OpenBookQA | 49,4 % | 5ᵉ / 5 | llm-stats | Auto-déclaré |
| MMLU-Pro | 47,2 % | 114ᵉ / 125 | llm-stats | Auto-déclaré |
| MATH | 20,8 % | 69ᵉ / 70 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| DeepInfra | 0,7 $ | 0,7 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 64 % en dessous de la moyenne des LLM similaires, et 6,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. À sa sortie, Hermes 3 70B se situait dans le haut du panier de sa génération: sur GPQA (questions scientifiques difficiles), il figurait dans le top 10% des 31 LLM comparables sortis dans les 18 mois précédents. Sa licence Apache 2.0 et ses poids ouverts constituaient un atout concret pour l'auto-hébergement, l'audit et les usages commerciaux, sans dépendance obligatoire à une API propriétaire. Sa fenêtre de contexte de 131 072 tokens était un autre point fort, adaptée aux longs dossiers, aux bases documentaires volumineuses et aux prompts nécessitant beaucoup de contexte. Son prix très économique renforçait l'intérêt expérimental et industriel, surtout pour des volumes élevés de tokens.
Limites et points d'attention. Malgré son bon positionnement initial, Hermes 3 70B appartient désormais à une génération largement dépassée par les modèles actuels. Son ancienneté est importante dans un secteur où deux ans représentent un cycle très long, et ce type de modèle est souvent retiré des catalogues d'éditeurs. Ses connaissances s'arrêtent au 31 décembre 2023, ce qui limite la fiabilité sur les faits récents. La couverture par 2 sources concordantes stabilise les données principales, mais ne remplace pas des tests actuels sur des cas d'usage réels.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).