Chef de produit IA senior chez Google : 6 agents prennent en charge mon quotidien, moins de 400 dollars par mois, fonctionnement 24/7

Auteur : Shubham Saboo

Traduction : Shen Chao TechFlow

Lecture de Shen Chao : Six agents, chacun avec leur rôle, qui terminent la recherche, la création de contenu, la revue de code et la production de newsletter pendant que l’auteur dort.

L’auteur dévoile entièrement la structure des fichiers, les coûts réels, les pièges rencontrés et les recommandations hebdomadaires, constituant ainsi l’un des comptes rendus pratiques les plus opérationnels sur les agents IA personnels.

Voici l’intégralité du texte :

Six agents IA gèrent tout mon travail pendant que je dors.

Ce n’est pas une démo. Ce n’est pas un projet de week-end.

Une équipe véritablement opérationnelle 24/7, qui garantit que je ne prends jamais de retard. La recherche est faite, le contenu rédigé, le code revu, la newsletter prête. Chaque matin, en ouvrant Telegram, ils ont déjà effectué toute une série de tâches.

Hier, j’ai publié un article sur mon équipe d’agents. La question numéro un était : « Comment ai-je construit tout ça ? »

Voici la réponse. Pas de théorie, pas de diagrammes d’architecture. La structure des fichiers que j’utilise concrètement, les coûts réels, les échecs rencontrés. Tout est là.

Après avoir lu cet article, vous comprendrez comment monter une équipe d’agents IA autonome pendant votre sommeil.

Pourquoi une équipe et non un seul outil

Gérer simultanément Unwind AI et le dépôt Awesome LLM Apps signifie faire six choses chaque jour : suivre les tendances du domaine IA, rédiger des tweets, publier sur LinkedIn, préparer la newsletter, revoir les contributions sur GitHub, traiter les questions de la communauté.

Chaque tâche prend entre 30 et 60 minutes. Six tâches. Ma journée s’évapore ainsi, sans que je fasse encore de vrai travail.

J’ai essayé de tout faire avec un seul agent. Un prompt énorme pour la recherche, la rédaction et la revue, tout en un. Résultat : tout reste médiocre. Le contexte s’accumule, la qualité baisse. Un seul agent ne peut pas gérer six tâches en même temps.

J’ai donc recruté six agents IA.

Connaître cette équipe

Chaque agent est nommé d’après un personnage de série télévisée. Ce n’est pas un gimmick. Quand je dis à Claude « Tu as l’énergie de Dwight Schrute », il sait déjà ce que cela signifie dans ses données d’entraînement : être exhaustif, concentré, prendre le travail comme une mission. Cela résulte de 30 saisons de personnages, que j’utilise gratuitement.

  1. Monica (Chef de cabinet) : nommée d’après Monica Geller. Elle est l’agent principal, celle avec laquelle j’interagis le plus sur Telegram. Elle coordonne les autres, prend des décisions stratégiques, délègue aux experts appropriés. Dans son fichier SOUL.md, elle écrit : « Tu es celui qui s’assure que tout est fait correctement. »

  2. Dwight (Recherche) : d’après Dwight Schrute. Il effectue trois fois par jour une veille de recherche, vérifie X, Hacker News, GitHub trending, le blog Google AI et les papiers de recherche, rédige un rapport structuré pour tous les autres agents.

  3. Kelly (X/Twitter) : d’après Kelly Kapoor. Elle lit la recherche de Dwight, rédige des brouillons de tweets dans mon ton, incluant tweets simples, threads et citations. Dans SOUL.md, elle écrit : « Tu sais que quelque chose va devenir populaire avant qu’il ne le soit. »

  4. Rachel (LinkedIn) : d’après Rachel Green. Même source d’informations que Kelly, plateforme différente, ton différent, orienté leadership d’opinion plutôt que commentaires piquants.

  5. Ross (Ingénierie) : d’après Ross Geller. Gère la revue de code, la correction de bugs et la mise en œuvre technique. Dans SOUL.md, il écrit : « Avant de traiter un problème, comprends-le parfaitement. Ne te contente pas de traiter les symptômes. »

  6. Pam (Newsletter) : d’après Pam Beesly. Organise les synthèses quotidiennes de Dwight en newsletter.

Six agents, chacun avec sa tâche, division claire.

Passons à la mise en place

Je fais tourner tout cela sur un Mac Mini M4. Mais je précise : ce n’est pas indispensable. OpenClaw supporte macOS, Linux et Windows (via WSL). Un portable, un PC de jeu, un VPS à 5 dollars par mois, tout fonctionne. La différence avec le Mac Mini, c’est qu’il reste allumé, silencieux, très peu énergivore, mais ce n’est pas une nécessité.

Ma configuration : Mac Mini M4 de base. Toujours branché à l’alimentation et au réseau, sans écran, uniquement via Telegram sur mon téléphone.

Installation d’OpenClaw

Deux lignes de commandes dans le terminal, moins de cinq minutes.

En cas de problème, consultez la documentation d’OpenClaw.

Cela lance le gateway, c’est-à-dire le processus en arrière-plan qui maintient tout en marche. Il gère vos agents, exécute les tâches cron, traite les messages Telegram. Fermez le terminal, ils continuent de fonctionner.

Structure de l’espace de travail

Une instance d’OpenClaw, plusieurs agents. Pas six installations séparées.

Voici ma structure de répertoires réelle :

Monica vit à la racine. C’est l’agent principal avec lequel j’interagis directement. Les autres agents sont ses sous-agents délégués ou fonctionnent indépendamment selon leur propre planification cron.

Il n’est pas nécessaire de créer six agents dès le départ. Je commence avec Monica seule, puis, au fil de la clarification du workflow, j’ajoute progressivement les autres en quelques semaines.

Qu’est-ce que SOUL.md ?

Chaque agent est défini par un fichier : SOUL.md. C’est l’identité, le rôle et les instructions opérationnelles de l’agent, le document le plus important du système.

Par exemple, le SOUL.md de Dwight ressemble à peu près à ceci :

Faites attention à ce que ce fichier fait. Il ne suffit pas de dire « tu es un agent de recherche ». Il donne à l’agent une personnalité, des principes clairs, une relation précise avec les autres agents, ainsi qu’un cadre décisionnel.

Le SOUL.md de Monica est similaire.

Tous les agents suivent le même modèle : identité, rôle, principes, relations, style. Chaque SOUL.md fait environ 40 à 60 lignes, suffisamment court pour être chargé en contexte à chaque session, et suffisamment détaillé pour produire un comportement cohérent et stable.

Coordination entre agents

Il n’y a pas d’API, pas de message queue, pas de framework d’orchestration.

Juste des fichiers.

Dwight termine sa recherche et écrit le résultat dans intel/DAILY-INTEL.md. Kelly, à son réveil, lit ce fichier pour rédiger ses tweets. Rachel lit le même fichier pour préparer ses posts LinkedIn. Pam le lit pour synthétiser la newsletter.

Le mécanisme de coordination, c’est le système de fichiers.

Le SOUL.md de Dwight indique précisément où il doit écrire :

Le fichier AGENTS.md de Kelly indique précisément où elle doit lire :

Pas de middleware, pas d’intégration. Dwight écrit un fichier, Kelly le lit, la transmission se fait via un document markdown sur disque.

Cela paraît trop simple. En effet, c’est simple. Et c’est pour cela que ça fonctionne. Les fichiers ne plantent pas, ils n’ont pas de problème d’authentification, ils ne nécessitent pas de gérer des limites d’API, ils sont juste là.

Les données structurées en JSON, les résumés lisibles par l’humain en markdown. L’agent lit en markdown, le JSON étant la source de vérité pour la déduplication et le suivi à long terme.

Système de mémoire

Chaque fois qu’un agent se réveille, il n’a pas de mémoire de la session précédente. Chaque conversation repart de zéro. C’est une caractéristique, pas un défaut. Mais cela implique que la mémoire doit être explicite.

Deux niveaux.

Le journal quotidien (memory/YYYY-MM-DD.md) : enregistrements bruts de chaque session, ce qui s’est dit, ce qui a été rédigé, les retours reçus. L’agent écrit en continu dans la journée.

La mémoire à long terme (MEMORY.md) : synthèse des insights clés extraits des journaux quotidiens, incluant les leçons apprises, les préférences découvertes, les régularités observées.

Chaque agent, au début de chaque session, suit cette procédure dans le fichier AGENTS.md : lire SOUL.md, puis USER.md, puis les fichiers mémoire du jour et d’hier, et si c’est la session principale, lire aussi MEMORY.md.

Ces agents évoluent avec le temps. Pas parce que le modèle s’améliore, mais parce que leur contexte s’enrichit.

Kelly apprend à ne pas utiliser d’émojis ni de hashtags dans mon style d’écriture. Cela devient une partie de sa mémoire, et chaque brouillon qu’elle produit par la suite en tiendra compte, sans que j’aie besoin de le rappeler. Dwight apprend à filtrer les stories importantes de celles à ignorer, selon le « filtre Alex » (notre profil de public cible). Tout cela est stocké dans sa mémoire.

Pendant chaque cycle, l’agent relit régulièrement les journaux quotidiens, en extrait l’essentiel dans MEMORY.md. Les fichiers journaux sont la trace brute, MEMORY.md est la synthèse intelligente.

Planification

Les agents doivent s’éveiller de façon autonome. OpenClaw gère cela via une planification cron intégrée.

Voici ma planification réelle :

L’ordre est crucial. Dwight doit s’exécuter en premier, car les autres dépendent de ses résultats. Kelly et Rachel suivent, car elles ont besoin des fichiers de Dwight pour rédiger.

Mécanisme d’auto-correction

Les tâches cron échouent parfois. Redémarrage de la machine, tâche suspendue, problème réseau ou limite API. C’est la faille de l’infrastructure.

Le fichier HEARTBEAT.md offre une sécurité. À chaque cycle, l’agent principal vérifie si la tâche cron a bien été exécutée :

Si une tâche échoue ou est manquée, le heartbeat la détecte et la relance. Auto-correction, sans intervention humaine.

Ce mécanisme est adapté pour vérifier plusieurs choses en batch ou pour des tâches avec une tolérance à un léger décalage horaire. Cron est plus précis pour des tâches critiques ou isolées.

Telegram comme interface d’interaction

Pas de tableau de bord, pas d’interface web, pas de backend de gestion. Je communique avec mes agents via Telegram.

C’est un choix délibéré. Je ne veux pas me connecter à un tableau de bord, ni ouvrir une application web. Mon téléphone est toujours à portée, Telegram est toujours ouvert, et l’agent me trouve là où je suis.

OpenClaw supporte Telegram comme canal. Après configuration, votre agent apparaît sous forme de bot Telegram. Vous envoyez un message, il répond, il vous envoie des brouillons pour validation. Comme un collègue dans votre messagerie.

Monica est mon contact principal, elle gère la majorité des échanges, délègue aux autres. Quand un agent produit un contenu digne d’être revu, il me contacte directement.

Ma routine matinale : je me réveille, j’ouvre Telegram, Dwight m’a déjà envoyé un résumé de recherche, Kelly a trois brouillons de tweets en attente, Rachel a une publication LinkedIn prête. Je les examine, donne mon feedback, approuve si c’est bon. Tout cela en dix minutes autour d’un café.

Construction de la personnalité

On ne construit pas une personnalité parfaite dès le départ. On commence avec une esquisse dans SOUL.md, on observe le comportement, on ajuste avec le temps. Comme on gère une vraie personne.

J’appelle cela une « prompt engineering corrective ».

Les brouillons initiaux de Kelly sont pleins d’émojis et d’exclamations, ce n’est pas mon style. Je donne un feedback : « pas d’émojis, pas de hashtags, des phrases courtes et percutantes. » Elle met à jour sa mémoire, et en une semaine, elle fait le bon choix. Dwight, au début, capte trop de bruit, enregistre chaque mise à jour de dépôt ou petite nouveauté. Je lui dis : « Toutes les tendances ne sont pas importantes, je veux des signaux, pas du bruit. » Il ajuste ses principes, et ses rapports deviennent plus ciblés et exploitables.

Tout agent, même le meilleur, commence médiocre. Le dixième version est correcte, la trentaine est excellente. Il faut du temps et de la répétition pour affiner. Nommer par un personnage télé donne une ligne de base instantanée — « énergie Dwight Schrute » signifie exhaustif, concentré, sans bavardage. Mais la vraie personnalité émerge des corrections sur plusieurs semaines, stockées dans la mémoire.

Un conseil que je partage : donner à chaque agent un seul titre de poste simple et une condition d’arrêt. La contrainte améliore la performance. Plus le rôle est précis, meilleur sera le résultat.

Sécurité

La sécurité est entre vos mains. Ma méthode est simple : chaque agent possède son propre environnement, sans accès à mon univers personnel.

Mac Mini est leur ordinateur. Ils ont leurs comptes email, leurs clés API, leurs accès limités. Tout ce qui est sur cette machine n’est pas connecté à mes comptes personnels.

Les clés API de services comme Gemini, Eleven Labs sont spécifiques à cette instance OpenClaw. Je peux surveiller leur usage, couper l’accès en quelques secondes en cas d’anomalie.

Je ne donne jamais à un agent l’accès à mes comptes personnels. Si je veux qu’il voie un email, je le lui transfère. Si je veux qu’il révise un document, je le partage via Telegram. Ils ne voient que ce que je veux leur montrer, rien de plus.

C’est la même philosophie que pour un nouveau collaborateur. On ne leur donne pas toutes les clés dès le premier jour. On leur fournit un espace de travail, des identifiants propres, et on partage l’information au besoin.

Où ça peut casser, comment réparer

Ce n’est pas de la magie, c’est l’infrastructure. Et l’infrastructure peut tomber en panne.

Gateway peut planter. C’est rare, mais ça arrive. La solution : exécuter « openclaw gateway restart ». Le système de heartbeat détecte les tâches cron obsolètes et les relance, évitant de perdre une journée entière.

Une tâche cron peut manquer son créneau. La machine se met en veille, le réseau coupe, l’API limite les appels. La solution : HEARTBEAT.md en mode auto-correction. Lors de chaque heartbeat, Monica vérifie si la tâche a été réellement exécutée. Si une tâche n’a pas été mise à jour depuis plus de 26 heures, elle la relance.

Le débordement de la fenêtre de contexte. L’agent lit trop de fichiers au début de la session, il n’a pas de place pour travailler efficacement. La solution : garder SOUL.md court (40-60 lignes), concentrer AGENTS.md, ne charger que les fichiers mémoire d’hier et d’aujourd’hui. L’agent n’a pas besoin de tout relire à chaque fois.

Une baisse de qualité de sortie. Survient quand la mémoire devient désordonnée ou contradictoire. La solution : entretien régulier de la mémoire. Pendant chaque heartbeat, l’agent relit les journaux quotidiens, extrait l’essentiel dans MEMORY.md, archive ou supprime les anciens fichiers journaux.

Conflits de coordination. Deux agents tentent de modifier le même fichier. La solution : concevoir le flux de fichiers en mode « un écrivain, plusieurs lecteurs ». Dwight écrit dans DAILY-INTEL.md, tous les autres lisent, personne n’écrit ailleurs.

La plus grande leçon de fiabilité : commencer simple. Un agent, une tâche, une planification. Faire fonctionner tout ça une semaine, puis ajouter un second. Ceux qui déploient six agents dès le premier jour sans surveillance font la même erreur que dans tout système distribué : ne pas prévoir de monitoring.

Coût réel

Matériel : Mac Mini M4 neuf à partir de 499 dollars, mais tout ordinateur toujours allumé fonctionne : vieux portable, VPS à 5 dollars par mois, ce que vous avez sous la main.

Coût des modèles IA : j’utilise plusieurs modèles en parallèle dans toute l’équipe. La plupart des tâches avec Claude Opus et Sonnet, certains workflows avec Gemini, et je teste aussi des modèles locaux via Ollama pour réduire encore les coûts.

Détail des coûts :

Claude (Max plan) : 200 dollars par mois

API Gemini : 50 à 70 dollars par mois

TinyFish (agent web) : environ 50 dollars par mois

Eleven Labs (voix) : environ 50 dollars par mois

Telegram : gratuit

OpenClaw : open source, gratuit

Total : moins de 400 dollars par mois, pour une équipe qui ne dort jamais.

Ce qui a vraiment changé

Dwight me fait gagner chaque jour 2 à 3 heures de recherche. Avant, chaque matin, je passais du temps à vérifier X, Hacker News, GitHub trending, les blogs IA. Maintenant, je me réveille avec un résumé priorisé, avec liens et actions.

Kelly, Pam et Rachel m’épargnent 1 à 2 heures de rédaction de contenu. Ross s’occupe des tâches d’ingénierie que je faisais le soir.

Total : environ 4 à 5 heures d’économie par jour.

Mais la vraie valeur ne se mesure pas à une journée, mais à la continuité sur plusieurs semaines ou mois. Un agent qui fait de la recherche tous les jours pendant 30 jours construit un signal, une tendance, une régularité, une trajectoire — quelque chose qu’aucune session unique ne peut produire. J’ai augmenté ma fréquence de publication sur X, amélioré la qualité, stabilisé le timing. Le dépôt Awesome LLM Apps grandit, la newsletter bénéficie d’un flux constant de recherches.

Ces agents ne peuvent pas faire de réflexion originale, de stratégie de transformation ou de percée créative. Ils traitent des tâches répétitives, structurées, qui me prenaient des heures auparavant, me libérant pour des activités nécessitant la créativité humaine.

Comment commencer

Ne tentez pas de construire six agents dès le premier jour.

Première semaine : un agent, une tâche. Installez OpenClaw, rédigez votre premier SOUL.md en dialoguant avec l’agent, choisissez une tâche répétitive (recherche ou rédaction), configurez Telegram, créez une tâche cron, observez une semaine, corrigez si besoin.

Deuxième semaine : intégrez la mémoire, peaufinez. Les premières productions seront médiocres, c’est normal. Donnez du feedback, faites évoluer la mémoire, ajustez SOUL.md. À la fin de la deuxième semaine, votre agent doit produire des résultats réellement utiles.

Troisième semaine : ajoutez un second agent. Vous avez compris le besoin : un agent de recherche pour l’intelligence, mais vous rédigez encore manuellement les tweets. Il est temps d’ajouter un agent de contenu. Mode de partage : le premier écrit, le second lit, la coordination via fichiers.

Quatrième semaine et suivantes : construisez par étapes. Ajoutez de nouveaux agents quand vous en ressentez le besoin, pas quand vous pensez qu’il faut. Chaque agent doit répondre à un vrai besoin, pas une démo ou une validation conceptuelle, mais une lacune réelle dans votre workflow.

Considérez cela comme un processus de recrutement. Vous ne déployez pas six employés dès le premier jour. Vous en embauchez un, le faites fonctionner efficacement, puis, selon la charge, vous en ajoutez un autre.

Changement d’état d’esprit

Après un mois de fonctionnement stable, quelque chose change. Vous ne voyez plus l’IA comme un outil à utiliser ponctuellement, mais comme une équipe qui travaille en continu.

Je commence ma journée en disant bonjour à Monica sur Telegram, et je lui souhaite bonne nuit avant de fermer mon téléphone. Cela peut sembler absurde, mais après un mois d’interactions quotidiennes, de feedbacks et de progrès, la frontière entre agent et humain devient floue.

Le modèle est la configuration de base, accessible à tous : Claude, GPT, Gemini. La « system » vient de l’ensemble du système construit autour du modèle — SOUL.md, mémoire, planification, coordination, stockage de feedbacks sur plusieurs semaines.

Ce système est le vôtre, personne ne possède votre agent, votre mémoire, votre personnalité affinée.

Et il croît chaque jour en puissance composée.

Chaque recherche de Dwight enrichit sa mémoire, chaque feedback de Kelly la rend plus incisive, chaque bug corrigé par Ross approfondit votre code. C’est la véritable barrière protectrice. Pas le modèle, mais le système qui apprend.

Commencez dès aujourd’hui. Un agent, une tâche, une planification.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)