Diseña jueces que sobrevivan los sesgos CALM, se calibren contra humanos y ganen un lugar en tu gate de CI.
Parte de: Evaluación de LLMs