Pier
R&DArchitecte, Développeur, AI Solutions
Studio virtuel multi-agents conçu comme un environnement de travail unifié : un shell desktop en Godot 4.6 .NET pilote en parallèle un registre de 31 personas (chefs de département, exécutants, utilitaires) backés par modèles Ollama locaux et orchestrés par Claude Agent SDK. Brief humain → plan JSON → exécution parallèle avec retry → synthèse arbitrée Claude → rapport. Inclut un pipeline de tournoi d'évaluation (charte versionnée v1.7, multi-itérations, judge LLM local, hall of fame, reports JSON) qui sert à benchmarker, calibrer et faire évoluer chaque persona contre la charte. Stack : Python + Claude Agent SDK + Godot 4.6 .NET + Ollama + PowerShell. Repo privé.
Ce que le projet prouve
R&D 7Sail · Pipeline orchestrator + tournoi Ollama actif
État actuel
R&D • 2026
Focus design
Contexte
Pari de production interne 7Sail : remplacer les scripts CLI hétéroclites par un studio virtuel unifié, avec une UI Godot lisible, un orchestrateur natif et un système d'évaluation continue des personas. Cible : enchaîner les chantiers (audits, productions, jam pipelines) à plusieurs personas en parallèle sans sortir du shell.
Défis & contraintes
Orchestrer en parallèle 31 personas avec garanties de cohérence (mapping persona ↔ modèle Ollama pertinent), retry, monitoring tokens, et rendre le tout opérable depuis une UI Godot plutôt qu'un terminal. Construire en parallèle un pipeline de tournoi d'évaluation rigoureux (charte écrite, juges LLM locaux, métriques MAE / champion match, hall of fame) qui rende les promotions de personas mesurables. Tenir un coût d'inférence soutenable sur hardware contraint (8 GB VRAM avant upgrade).
Résultats & apprentissages
Charte tournoi v1.7 active depuis 2026-04-19, 8 itérations livrées, 0 hang sur runner v8+, judge LLM local validé (MAE 0.59, champion match 90 %), hall of fame versionné. Orchestrator core et UI shell Godot en place, panel Brief en cours de finalisation. Stack Python + Claude Agent SDK + Godot + Ollama opérationnelle pour la R&D du studio. Reboot tuning modèles 14B+ planifié post-upgrade hardware.
Stack technique
Fonctionnalités
- ▸Shell Godot 4.6 .NET (room studio + rooms personas)
- ▸Orchestrateur Brief → plan JSON → exécution parallèle → synthèse
- ▸Registre 31 personas avec mapping Ollama
- ▸Pipeline tournoi multi-itérations + charte v1.7
- ▸Judge LLM local + benchmark health
- ▸Hall of Fame versionné + reports JSON
- ▸Architecture trunk-based (feature branches < 3j)
Note de production
L'arbitrage produit le plus structurant a été d'écrire d'abord la charte du tournoi et le judge LLM local, avant l'orchestrateur. C'est la charte qui rend les promotions de personas mesurables : sans elle, on ajoute des modèles à l'aveugle, on ne progresse jamais. L'UI Godot vient ensuite capitaliser sur ces fondations, pas l'inverse.