Prompt Caching & Otimização de Inferência0%
0%
2 novos percursos
Curso de Domínio

Prompt Caching & Otimização de Inferência

0%

Engenharia de inferência LLM mais rápida, barata e eficiente — da mecânica de KV-cache a estratégias de serving em produção.

Parte de: Fundamentos de Engenharia de IA

7 módulos·~18 min