Prompt caching et optimisation de l'inférence0%
0%
2 nouveaux parcours
Cours de maîtrise

Prompt caching et optimisation de l'inférence

0%

Conçois une inférence LLM plus rapide, moins chère et plus efficace — de la mécanique du KV-cache aux stratégies de serving en production.

Fait partie de : Fondations de l'ingénierie IA

7 modules·~18 min