—tools/weaviate.json
Weaviate
Vector DB open-source avec features hybrides (vector + keyword + GraphQL). Pour les RAGs avancés où le filtering compte.
01—à savoir
L'option pour les RAGs où tu veux mixer recherche vectorielle ET recherche keyword classique (BM25) — utile quand certains queries doivent matcher des termes exacts (codes produits, références juridiques). Schema-first avec GraphQL natif, modules d'embedding intégrés (tu n'as pas à embedder côté client). Plus complexe à mettre en place que Qdrant ou Pinecone, mais plus puissant sur les cas d'usage hybrides.
02—pros
- Hybrid search natif (vector + keyword BM25) — gros plus pour certains RAGs
- Modules d'embedding intégrés (OpenAI, Cohere, HuggingFace) : tu uploads du texte, ça embed et stocke
- GraphQL API expressif pour les queries complexes
- Open-source BSD-3 — self-host illimité
- Hébergement EU disponible
03—cons
- Setup plus complexe que Pinecone ou Qdrant (schema, modules)
- GraphQL ajoute une couche d'apprentissage si tu n'es pas familier
- Performance pure légèrement derrière Qdrant sur certains benchmarks
—alternatives
—paire bien avec
// à explorer ensuite
À explorer ensuite
Suggestions calculées sémantiquement — proches de ce que tu lis, pas seulement par catégorie.
- outil
Exa
Search engine pensé pour les LLMs. Embeddings sémantiques au lieu du keyword matching, content extraction native.
- outil
Pinecone
Vector DB managée. Le « Stripe » des bases vectorielles : payée, mais sans setup ni opération.
- outil
Qdrant
Vector DB open-source en Rust. Self-host gratuit, performance brutale, ou cloud managé pour 0 ops.
- outil
Groq
Inference LLM ultra-rapide (~500 tok/s). Free tier généreux, idéal pour latence critique et prototyping.