Définition complète
Une base de données vectorielle est une base de données spécialisée dans le stockage et la recherche de vecteurs (embeddings). Elle permet de trouver rapidement les vecteurs les plus similaires à un vecteur de requête, opération essentielle pour la recherche sémantique et le RAG. Contrairement aux bases relationnelles (qui matchent des valeurs exactes), les bases vectorielles trouvent des similarités sémantiques. Les leaders incluent Pinecone, Weaviate, Milvus, Qdrant, et pgvector (extension PostgreSQL).
Questions fréquentes
Pourquoi les bases vectorielles sont-elles essentielles pour le RAG ?
Le RAG nécessite de trouver les passages de documents les plus pertinents pour une question. Les bases vectorielles permettent cette recherche sémantique à l'échelle : elles stockent des millions de vecteurs (embeddings de documents) et trouvent les plus proches d'un vecteur requête en millisecondes. Sans base vectorielle performante, le RAG serait trop lent pour une utilisation en temps réel.
Comment choisir une base de données vectorielle ?
Le choix dépend de : la volumétrie (millions vs milliards de vecteurs), le déploiement (cloud managé vs self-hosted), l'intégration (SDK, compatibilité LangChain), le coût, et les fonctionnalités (filtrage hybride, multitenancy). Pour démarrer : Pinecone (cloud simple), Qdrant (open source performant), pgvector (si vous utilisez déjà PostgreSQL). Pour les gros volumes : Milvus, Weaviate.
Les bases vectorielles remplacent-elles les bases traditionnelles ?
Non, les bases vectorielles complètent les bases traditionnelles. Elles excellent pour la recherche sémantique ("trouve des documents similaires") mais ne remplacent pas les requêtes structurées ("tous les clients de Paris créés en 2023"). Une architecture typique utilise une base relationnelle pour les données métier, une base vectorielle pour la recherche IA, et les lie via des IDs communs.