Prompt caching e ottimizzazione dell'inferenza0%
0%
2 nuovi percorsi
Mastery chapter

Prompt caching e ottimizzazione dell'inferenza

0%

Progetta inferenza LLM più veloce, economica ed efficiente — dalla meccanica della KV cache alle strategie di serving in produzione.

Parte di: AI engineering: le fondamenta

7 moduli·~18 min