Crée, exécute et visualise des suites d'évaluation de niveau frontier avec le framework open-source de UK AISI.
Fait partie de : Évaluation des LLM