🔬 Méthodologie
Tout ce que nous comparons, comment nous classons, et d'où viennent nos données. Transparence totale : aucun chiffre que nous ne puissions justifier par une source officielle.
📋 Ce que nous comparons
Chaque modèle est documenté sur une quinzaine de dimensions, regroupées en cinq familles. Toutes sont visibles dans le comparateur côte à côte.
Performance
Technique
Économique
Souveraineté & conformité
Qualité perçue
🧮 Comment nous classons (Podium)
Le podium est un sous-ensemble : un score pondéré par catégorie. Les poids ci-dessous sont ceux réellement utilisés par l'algorithme. Ils diffèrent selon ce qui compte dans chaque domaine.
Généralistes
Code
Vision
Multilingue
Open Source
Comment les valeurs sont normalisées
Prix — inversé : moins cher = meilleur score. Gratuit = 100, <1$/M = 95, <5$ = 85, <20$ = 70, <50$ = 50, <100$ = 30, au-delà = 15.
Contexte — par paliers : ≥1M = 100, ≥500k = 90, ≥200k = 80, ≥128k = 70, ≥32k = 50.
Fraîcheur — <1 mois = 100, <3 mois = 90, <6 mois = 75, <1 an = 55, au-delà décroît.
Licence — Apache/MIT = 100, BSD = 95, GPL = 85, Llama (restrictions) = 60.
Self-host — selon la taille : ≤8B = 100 (tourne sur Mac), ≤30B = 85, ≤70B = 70, au-delà nécessite un cluster.
✅ Fiabilité & sources
C'est ce qui distingue ce comparateur d'un simple tableau. Notre engagement sur la donnée :
⚖️ Limites assumées
Le prix entre dans le score : un modèle peut être bien classé surtout parce qu'il est économique. Notre classement reflète un rapport qualité/prix, pas seulement la puissance brute.
La fraîcheur est valorisée : un modèle récent gagne quelques points. C'est un choix, car le domaine évolue vite — mais cela peut surpondérer la nouveauté.
Les benchmarks ne disent pas tout : un modèle peut bien scorer et décevoir à l'usage. C'est pourquoi chaque classement est revu par un humain avant publication.