Self-host d’agents IA : open weights, vLLM et TGIGuide 2026 pour décider et réussir le self-host : modèles open-weight (Llama/Mistral), moteurs d’inférence (vLLM, TGI, Ollama), sécurité et MLOps.5 mars 20269 min