Nous Research

Hermes 3 70B

Hermes 3 70B est un LLM open-weights de Nous Research, publié le 15 août 2024 sous licence Apache 2.0, avec usage commercial autorisé. À près de deux ans, c'est un modèle ancien à l'échelle de l'IA: sa lecture vaut surtout comme photographie d'un 70 milliards de paramètres compétitif…

Son profil combine une fenêtre de contexte de 131 072 tokens, une base de connaissances arrêtée au 31 décembre 2023 et un prix très bas: 0,7 $ par million de tokens en entrée comme en sortie. Ce positionnement tarifaire le place 64% sous la moyenne des LLM similaires et environ 6,9 fois moins cher que les modèles frontière.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Nous Research
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	15 août 2024
Connaissances jusqu'à	2023-12-31
Multimodal	non
Paramètres	70 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MT-Bench	89,9 %	4ᵉ / 12	llm-stats	Auto-déclaré
HellaSwag	88,2 %	7ᵉ / 27	llm-stats	Auto-déclaré
BoolQ	88,0 %	1ᵉ / 10	llm-stats	Auto-déclaré
PIQA	84,4 %	2ᵉ / 11	llm-stats	Auto-déclaré
Winogrande	83,2 %	7ᵉ / 22	llm-stats	Auto-déclaré
ARC-E	83,0 %	3ᵉ / 8	llm-stats	Auto-déclaré
IFBench	81,2 %	2ᵉ / 27	llm-stats	Auto-déclaré
MMLU	79,1 %	64ᵉ / 98	llm-stats	Auto-déclaré
BBH	67,8 %	11ᵉ / 12	llm-stats	Auto-déclaré
GPQA	66,1 %	127ᵉ / 213	llm-stats	Auto-déclaré
ARC-C	65,5 %	27ᵉ / 34	llm-stats	Auto-déclaré
TruthfulQA	63,3 %	6ᵉ / 18	llm-stats	Auto-déclaré
AGIEval	56,2 %	4ᵉ / 10	llm-stats	Auto-déclaré
OpenBookQA	49,4 %	5ᵉ / 5	llm-stats	Auto-déclaré
MMLU-Pro	47,2 %	114ᵉ / 125	llm-stats	Auto-déclaré
MATH	20,8 %	69ᵉ / 70	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
DeepInfra	0,7 $	0,7 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 64 % en dessous de la moyenne des LLM similaires, et 6,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. À sa sortie, Hermes 3 70B se situait dans le haut du panier de sa génération: sur GPQA (questions scientifiques difficiles), il figurait dans le top 10% des 31 LLM comparables sortis dans les 18 mois précédents. Sa licence Apache 2.0 et ses poids ouverts constituaient un atout concret pour l'auto-hébergement, l'audit et les usages commerciaux, sans dépendance obligatoire à une API propriétaire. Sa fenêtre de contexte de 131 072 tokens était un autre point fort, adaptée aux longs dossiers, aux bases documentaires volumineuses et aux prompts nécessitant beaucoup de contexte. Son prix très économique renforçait l'intérêt expérimental et industriel, surtout pour des volumes élevés de tokens.

Limites et points d'attention. Malgré son bon positionnement initial, Hermes 3 70B appartient désormais à une génération largement dépassée par les modèles actuels. Son ancienneté est importante dans un secteur où deux ans représentent un cycle très long, et ce type de modèle est souvent retiré des catalogues d'éditeurs. Ses connaissances s'arrêtent au 31 décembre 2023, ce qui limite la fiabilité sur les faits récents. La couverture par 2 sources concordantes stabilise les données principales, mais ne remplace pas des tests actuels sur des cas d'usage réels.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Hermes 3 70B

Caractéristiques

Performances (benchmarks)

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast