Multimodal inbound mailbot : OCR/VLM + audio (STT) à l’échellePièces jointes 2026 : choisir OCR vs VLM, traiter audio (STT), sécuriser uploads, extraire tables/champs et escalader quand c’est flou.5 mars 20269 min