—tools/openwebui.json
OpenWebUI
L'interface ChatGPT-like que tu self-host. Branche Ollama, Claude, GPT — RAG, plugins, multi-user, tout en local.
01—à savoir
Interface chat web qui ressemble à ChatGPT mais que tu héberges chez toi. Compatible Ollama (local), API OpenAI, API Anthropic, Mistral, et bien d'autres. Features : multi-user avec auth, RAG (upload de docs et chat dessus), plugins (web search, code interpreter, images), Pipelines (workflows custom). C'est THE option pour une PME qui veut un ChatGPT interne souverain ou pour un dev qui veut une UI chat sur ses LLMs locaux.
02—pros
- Self-hostable sur Docker en 5 min — ton entreprise a un ChatGPT interne
- Multi-LLM : switch Claude / GPT / Llama local à la volée
- RAG intégré : upload docs, chat dessus avec sources citées
- Multi-user avec auth, permissions, audit log
- 100% open-source MIT, aucun cloud officiel = aucun lock-in
03—cons
- Maintenance : c'est self-host, donc upgrades + monitoring à ta charge
- UX moins polish que ChatGPT officiel (mais OK pour usage interne)
- Plugins / extensibilité demandent un peu de tech
—paire bien avec
- OllamaRun LLM en local sur ta machine, zéro friction. Llama, Mistral, Qwen — un seul `ollama run` et tu chats.
- Anthropic APIL'API derrière Claude. Modèles Sonnet/Opus/Haiku, prompt caching, tool use, files, agents managés.
- OpenAI APIL'API GPT-5/4o/o3. Référence concurrente d'Anthropic, ecosystème historique, image gen + voice + audio natifs.
- Mistral AIL'API LLM française. Souveraineté UE, modèles open-weight + closed, prix imbattables sur les modèles small.
// à explorer ensuite
À explorer ensuite
Suggestions calculées sémantiquement — proches de ce que tu lis, pas seulement par catégorie.
- outil
OpenClaw
Assistant IA personnel open-source local-first. Tu choisis le LLM, ton ordi tourne, tes données restent chez toi.
- outil
Dify
Plateforme open-source pour construire des apps LLM sans coder. Workflows visuels, RAG, agents, déploiement en 1 click.
- outil
Ollama
Run LLM en local sur ta machine, zéro friction. Llama, Mistral, Qwen — un seul `ollama run` et tu chats.
- outil
Helicone
Observabilité LLM par proxy : tu changes 1 ligne, tu vois tous tes calls. Cache LLM intégré pour réduire la facture.