Scrivi, esegui e visualizza suite di eval di livello frontiera con il framework open-source di UK AISI.
Parte di: Valutazione degli LLM