Perceptron: Perceptron Mk1

Perceptron Mk1 est le premier modèle phare de Perceptron AI, un laboratoire de « physical AI » fondé fin 2024 dans l'État de Washington par d'anciens chercheurs de Meta/FAIR, et lancé le 12 mai 2026. C'est un modèle vision-langage spécialisé dans la vidéo et le raisonnement spatial : il…

Perceptron Mk1 est le premier modèle phare de Perceptron AI, un laboratoire de « physical AI » fondé fin 2024 dans l'État de Washington par d'anciens chercheurs de Meta/FAIR, et lancé le 12 mai 2026. C'est un modèle vision-langage spécialisé dans la vidéo et le raisonnement spatial : il accepte texte, image et vidéo (jusqu'à 2 images par seconde, avec suivi d'identité d'objets à travers les occlusions) et produit du texte, avec des annotations spatiales structurées (points, boîtes, polygones).

Fermé et accessible par API, il vise la robotique, l'industrie, la vidéosurveillance et le géospatial.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeurperceptron
Date de sortie12 mai 2026
Multimodaloui
Fenêtre de contexte32 768 tokens
Modalités (entrée → sortie)text,image,video → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Email Classification (Baseline)97,8 %160ᵉ / 254benchable✅ Mesuré
Benchable : Ethics (Baseline)96,8 %201ᵉ / 248benchable✅ Mesuré
Benchable : Instruction Following (Baseline)91,4 %11ᵉ / 252benchable✅ Mesuré
Benchable : Hallucinations (Baseline)88,4 %157ᵉ / 229benchable✅ Mesuré
Benchable : General Knowledge (Baseline)83,8 %213ᵉ / 250benchable✅ Mesuré
Benchable : Coding (Baseline)77,8 %188ᵉ / 248benchable✅ Mesuré
Benchable : Reasoning (Baseline)55,1 %177ᵉ / 239benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Email Classification (Baseline)

▶ Perceptron …98 %
WizardLM-2 8x22B95 %

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ Perceptron …97 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Perceptron0,15 $1,5 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,01 $
Latence moyenne par benchmark — Benchable8 min 06 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Le raisonnement spatial et la compréhension vidéo sont son domaine d'excellence : il se classe en tête sur les bancs dédiés (VSI-Bench, RefSpatialBench), très loin devant des modèles généralistes comme GPT-5 ou Claude Sonnet sur ces tâches précises selon les chiffres de l'éditeur. Il gère le grounding par l'exemple, la détection à vocabulaire ouvert, l'OCR de documents bruités, à un tarif très bas (jusqu'à 80 à 90 % moins cher que les généralistes frontière).

Limites et points d'attention. Malgré son positionnement « physical AI », sa latence mesurée est lourde, un frein pour le temps réel. Il ne produit que du texte, sa fenêtre de contexte est modeste (32K) face aux modèles à un million de tokens, et son architecture, sa taille et ses données sont opaques. Les comparaisons proviennent de l'éditeur, avec une sélection assumée des benchmarks. Il vise les applications de perception du monde réel, pas les usages généralistes.


Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).