Pós-Treinamento: DPO, GRPO e RL para LLMs0%
0%
2 novos percursos
Curso de Domínio

Pós-Treinamento: DPO, GRPO e RL para LLMs

0%

Escolha o algoritmo certo de pós-treinamento -- otimização de preferência, RL de raciocínio e RL de agentes -- sem se perder em papers de pesquisa.

Parte de: Fundamentos de Engenharia de IA

6 módulos·~17 min