—tools/exa.json
Exa
Search engine pensé pour les LLMs. Embeddings sémantiques au lieu du keyword matching, content extraction native.
01—à savoir
Google search est optimisé pour des humains qui cliquent sur des liens. Exa est optimisé pour des LLMs qui veulent du contenu structuré. Tu envoies un prompt naturel ('articles récents sur les agents IA pour PME français'), Exa retourne les top résultats embedded sémantiquement avec le contenu déjà extrait et nettoyé. Excellent pour les agents qui font de la veille, des recherches journalistiques, ou du sourcing.
02—pros
- Recherche sémantique (vs keyword matching de Google) — meilleurs résultats
- Content extraction native : tu reçois le markdown du contenu, pas juste l'URL
- API simple : 1 endpoint, embeddings calculés serveur-side
- Filtres avancés (date, domaine, type de contenu) pour les agents de veille
- Free tier 1K req/mois pour POC
03—cons
- Coverage web moins large que Google (~indexe les sites de qualité)
- Pricing peut grimper sur volume (>50K req/mois)
- Pas un remplacement complet de Google, plutôt complémentaire
—alternatives
—paire bien avec
- LangChainLe framework Python/JS qui a popularisé les chaînes LLM et les agents. Toujours pertinent en 2026 pour les workflows complexes.
- Anthropic APIL'API derrière Claude. Modèles Sonnet/Opus/Haiku, prompt caching, tool use, files, agents managés.
- OpenAI APIL'API GPT-5/4o/o3. Référence concurrente d'Anthropic, ecosystème historique, image gen + voice + audio natifs.
// à explorer ensuite
À explorer ensuite
Suggestions calculées sémantiquement — proches de ce que tu lis, pas seulement par catégorie.
- outil
Firecrawl
Scraping web optimisé pour les LLMs. Crawl + clean → markdown structuré. La couche RAG du web public.
- outil
Weaviate
Vector DB open-source avec features hybrides (vector + keyword + GraphQL). Pour les RAGs avancés où le filtering compte.
- outil
Anthropic API
L'API derrière Claude. Modèles Sonnet/Opus/Haiku, prompt caching, tool use, files, agents managés.
- outil
Helicone
Observabilité LLM par proxy : tu changes 1 ligne, tu vois tous tes calls. Cache LLM intégré pour réduire la facture.