perceptron

Perceptron: Perceptron Mk1

Perceptron Mk1 est le premier modèle phare de Perceptron AI, un laboratoire de « physical AI » fondé fin 2024 dans l'État de Washington par d'anciens chercheurs de Meta/FAIR, et lancé le 12 mai 2026. C'est un modèle vision-langage spécialisé dans la vidéo et le raisonnement spatial : il accepte texte, image et vidéo (jusqu'à 2 images par seconde, avec suivi d'identité d'objets à travers les occlusions) et produit du texte, avec des annotations spatiales structurées (points, boîtes, polygones).

Fermé et accessible par API, il vise la robotique, l'industrie, la vidéosurveillance et le géospatial.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	perceptron
Date de sortie	12 mai 2026
Multimodal	oui
Fenêtre de contexte	32 768 tokens
Modalités (entrée → sortie)	text,image,video → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Email Classification (Baseline)	97,8 %	160ᵉ / 254	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	96,8 %	201ᵉ / 248	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	91,4 %	11ᵉ / 252	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	88,4 %	157ᵉ / 229	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	83,8 %	213ᵉ / 250	benchable	✅ Mesuré
Benchable : Coding (Baseline)	77,8 %	188ᵉ / 248	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	55,1 %	177ᵉ / 239	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Email Classification (Baseline)

DeepSeek-R1100 %

Gemini 2.5 Flash-Lite100 %

GPT-4 Turbo100 %

nova-premier-v199 %

▶ Perceptron …98 %

WizardLM-2 8x22B95 %

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ Perceptron …97 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Perceptron	0,15 $	1,5 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,01 $
Latence moyenne par benchmark — Benchable	8 min 06 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Le raisonnement spatial et la compréhension vidéo sont son domaine d'excellence : il se classe en tête sur les bancs dédiés (VSI-Bench, RefSpatialBench), très loin devant des modèles généralistes comme GPT-5 ou Claude Sonnet sur ces tâches précises selon les chiffres de l'éditeur. Il gère le grounding par l'exemple, la détection à vocabulaire ouvert, l'OCR de documents bruités, à un tarif très bas (jusqu'à 80 à 90 % moins cher que les généralistes frontière).

Limites et points d'attention. Malgré son positionnement « physical AI », sa latence mesurée est lourde, un frein pour le temps réel. Il ne produit que du texte, sa fenêtre de contexte est modeste (32K) face aux modèles à un million de tokens, et son architecture, sa taille et ses données sont opaques. Les comparaisons proviennent de l'éditeur, avec une sélection assumée des benchmarks. Il vise les applications de perception du monde réel, pas les usages généralistes.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

Perceptron: Perceptron Mk1

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast