Crie suítes de avaliação, pegue regressões de prompt e pare de lançar no feeling. Padrões práticos de avaliação para engenheiros de IA.
Parte de: IA em Produção