Comparaison de modèles LLM

Découvrez quel assistant IA correspond vraiment à vos besoins en comparant leurs réponses en aveugle.

Démarrer une évaluation

Configurez votre évaluation ci-dessous

Vous répondrez à 25 questions.

Sélectionnez votre groupe pour filtrer les résultats

Comment ça fonctionne ?

Le processus d'évaluation en 3 étapes simples

1

Lisez le prompt

Chaque question ou instruction est affichée en haut de l'écran. Prenez le temps de bien la comprendre avant de comparer les réponses.

2

Comparez les réponses

Deux réponses anonymes (A et B) sont présentées côte à côte. Évaluez leur qualité, pertinence et exactitude sans savoir quel modèle les a générées.

3

Votez pour la meilleure

Cliquez sur le bouton correspondant à votre choix, ou utilisez les raccourcis clavier (1, 2 ou 0 pour égalité) pour aller plus vite.

Raccourcis clavier

Utilisez 1 pour choisir A, 2 pour B, et 0 pour égalité.

Dataset actuel

6 modèles en compétition et 120 prompts variés sélectionnés pour cette évaluation.