Googleの上級AIプロダクトマネージャー:6つのエージェントが私の日常を引き継ぎ、月額わずか400ドル未満で24時間稼働

著者:Shubham Saboo

翻訳:深潮 TechFlow

深潮ガイド:6人の各自の役割を持つエージェントが、著者が寝ている間に研究、コンテンツ作成、コードレビュー、ニュースレターの制作を完了します。

著者はファイル構造、実際の費用、直面した課題、週ごとの提案を完全に公開しており、現在最も実用的な個人AIエージェントの実践記録の一つです。

全文は以下の通りです:

私が寝ている間に6つのAIエージェントが私のすべての仕事を管理しています。

これはデモではありません。週末のプロジェクトでもありません。

24時間稼働する本物のチームが、私が決して遅れをとらないようにしています。研究は完了し、コンテンツの草稿もできている。コードレビューも済み、ニュースレターも準備完了。毎朝Telegramを開くと、彼らはすでに一日分の仕事を終えています。

昨日、私のエージェントチームについての記事を投稿しました。第一位の質問は「一体どうやってこれを構築したのか?」でした。

これが答えです。理論は語りません。アーキテクチャ図も描きません。実際に使っているファイル構造、実際に支払った費用、直面した失敗例をすべて公開します。

この記事を読めば、あなたも寝ている間に自律的に動くAIエージェントチームの構築方法がわかるでしょう。

なぜチームなのか、ツールではない理由

Unwind AIとAwesome LLM Appsリポジトリを並行運用するには、毎日6つのことを行う必要があります:AI分野のホットトピックの調査、ツイート作成、LinkedIn投稿、ニュースレターの草稿作成、リポジトリのGitHub貢献のレビュー、コミュニティの問題対応。

各タスクは30分から60分。6つのタスク。これだけで一日が終わってしまい、実際の仕事に取りかかる時間はありません。

この問題を単一のエージェントで解決しようと試みました。研究、執筆、レビューをすべて一つの巨大なプロンプトにまとめて対応させましたが、結果は平凡なものに。コンテキストが膨れ上がり、質が低下しました。一人のエージェントでは6つの仕事を同時にこなせません。

そこで6つのAIエージェントを雇いました。

このチームについて

各エージェントにはテレビドラマのキャラクター名を付けています。これは冗談ではありません。Claudeに「Dwight Schruteのエネルギーがある」と言うと、訓練データからそれが何を意味するかすぐに理解します:徹底的、集中力が高い、仕事を命とみなす。これは30シーズン分のキャラクターから学んだもので、無料で使わせてもらっています。

  1. Monica(チーフ・オブ・スタッフ):モニカ・ゲラー(Monica Geller)にちなんで命名。彼女はメインエージェントで、私と最も頻繁にやりとりします。ほかのエージェントを調整し、戦略的意思決定を行い、適切な専門家にタスクを割り振ります。彼女のSOUL.mdにはこう書かれています:「あなたはすべてを正しく行うことを保証する人です。」

  2. Dwight(調査):德怀特·施鲁特(Dwight Schrute)にちなんで命名。彼は毎日3回、X、Hacker News、GitHubのホットトレンド、Google AIブログや研究論文をスキャンし、構造化されたインテリジェンスレポートを作成し、他のエージェントが利用できるようにします。

  3. Kelly(X/Twitter):ケリー・カプール(Kelly Kapoor)にちなんで命名。彼女はDwightの調査結果を読み取り、私の口調でツイートの草稿を作成します。単一ツイート、スレッド、引用ツイートも含む。彼女のSOUL.mdにはこう書かれています:「あなたは流行る前にそれを知っている。」

  4. Rachel(LinkedIn):レイチェル・グリーン(Rachel Green)にちなんで命名。情報源はKellyと同じですが、プラットフォームが異なり、トーンも異なります。思想リーダーシップの観点から投稿します。

  5. Ross(エンジニアリング):ロス・ゲラー(Ross Geller)にちなんで命名。コードレビュー、バグ修正、技術的実装を担当。彼のSOUL.mdにはこう書かれています:「問題に取り組むときは、まず徹底的に理解しなさい。症状だけを修正してはいけない。」

  6. Pam(ニュースレター):パム・ビーズリー(Pam Beesly)にちなんで命名。Dwightの毎日のインテリジェンスをニュースレターの要約に整理します。

この6人のエージェントは、それぞれの仕事を担当し、役割分担は明確です。

構築について

私はMac Mini M4上で全てを動かしています。ただし、明確にしておきます:Mac Miniは必須ではありません。

OpenClawはmacOS、Linux、Windows(WSL経由)をサポートしています。ノートPCでも、ゲーミングPCでも、月額5ドルのVPSでも動きます。Mac Miniの便利さは、常時電源オン、静音、省電力ですが、必須ではありません。

私の構成:Mac Mini M4のベースモデル。常に電源とネットワークに接続し、ディスプレイは使わず、完全にスマホのTelegramを通じて操作しています。

OpenClawのインストール

ターミナルの2行コマンドだけで、5分もかかりません。

問題があれば、OpenClawのドキュメントを参照してください。

これでゲートウェイが起動します。つまり、すべてを動かし続けるバックグラウンドプロセスです。エージェントの管理、cronジョブの実行、Telegramメッセージの処理を行います。ターミナルを閉じても、エージェントは動き続けます。

作業エリアの構造

一つのOpenClawインスタンスに複数のエージェントがいます。6つの独立したインストールではありません。

私の実際のディレクトリ構造は以下の通りです:

Monicaはルートディレクトリにいます。彼女は私と直接やりとりするメインエージェントです。他のエージェントは彼女に委任されたサブエージェント、または自分のcron計画に従って独立して動作します。

最初から6つのエージェントを作る必要はありません。最初はMonicaだけで始め、ワークフローが明確になるにつれて、数週間かけて徐々に他のエージェントを追加しました。

SOUL.mdとは何か

各エージェントは1つのファイル、SOUL.mdで定義されます。これがエージェントのアイデンティティ、役割、操作指示の最重要ファイルです。

例えば、DwightのSOUL.mdはおおよそ以下のようになります:

このファイルが何をしているかに注意してください。単に「あなたは調査エージェントです」と言うだけではありません。エージェントに個性、明確な原則、他のエージェントとの関係、意思決定の枠組みを与えています。

MonicaのSOUL.mdも同様です。

すべてのエージェントは一貫したパターンを持ちます:アイデンティティ、役割、原則、関係、スタイル。各SOUL.mdは約40〜60行で、短くとも会話ごとにコンテキストに完全に収まり、安定した一貫性のある行動を生み出せる内容です。

エージェント間の調整

エージェント間にはAPI呼び出しもメッセージキューも、オーケストレーションフレームワークもありません。

唯一の手段はファイルです。

Dwightが調査を終えたら、結果をintel/DAILY-INTEL.mdに書き込みます。Kellyはそれを読み取り、その内容に基づいてツイートの草稿を作成します。Rachelも同じファイルを読み取り、LinkedIn投稿を作成。Pamはそれを読んでニュースレターを書きます。

調整の仕組みはファイルシステムだけです。

DwightのSOUL.mdは正確に彼にどこに書くべきかを指示します。

KellyのAGENTS.mdは正確に彼女にどこから読むべきかを指示します。

中間層や統合層はありません。Dwightがファイルに書き込み、Kellyがファイルから読み取るだけです。やりとりはディスク上のMarkdownドキュメントです。

これは非常にシンプルに見えますが、実際に動作します。ファイルはクラッシュしません。認証の問題もありません。APIのレート制限も気にしなくていい。そこにあるだけです。

構造化データはJSONで保存し、人間が読む要約はMarkdownで保存します。エージェントはMarkdownを読み、JSONは重複排除と長期追跡のための真の情報源です。

記憶システム

エージェントは毎回起動時に前回の会話の記憶を持ちません。すべての会話は最初から始まります。これは仕様であり欠陥ではありません。ただし、記憶は明示的に管理する必要があります。

二層構造です。

毎日のログ(memory/YYYY-MM-DD.md):各会話の原始記録。何が起きたか、何を草稿したか、どんなフィードバックを受けたかを記録します。エージェントは一日中継続的に書き込みます。

長期記憶(MEMORY.md):毎日のログから抽出されたエッセンスや洞察。学んだ教訓、好みの発見、パターンの認識を含みます。

各エージェントは、会話開始時に次の順序でファイルを読むと良いと記述しています:まずSOUL.md、次にUSER.md、次に当日と前日のmemoryファイル、そしてメイン会話の場合はMEMORY.md。

これらのエージェントは時間とともに進化します。モデルの改良によるものではなく、読み込むコンテキストが豊かになるからです。

Kellyは私の書き方を学び、絵文字やハッシュタグを使わずに書くことを覚えました。これも記憶に保存され、次回の草稿に反映されます。Dwightはどのストーリーが「Alexフィルター」(ターゲット層像)を通じて伝わるか、どれをスキップすべきかを学び、それも記憶に保存されます。

毎日、エージェントは定期的に当日の記録を振り返り、重要な内容をMEMORY.mdに抽出します。日次ファイルは原始記録、MEMORY.mdは洗練された知恵です。

スケジューリング

エージェントは自律的に起動します。OpenClawは内蔵のcronスケジューラを使ってこれを管理します。

私の実際のスケジュールは以下の通りです:

順序が重要です。Dwightが最初に動きます。彼の出力に依存している他のエージェントは次に動きます。KellyとRachelはその後です。彼らはDwightのインテリジェンスファイルが存在することを前提に動きます。

ハートビートの自己修復メカニズム

cronジョブは時に失敗します。マシンの再起動、ジョブの停止、ネットワーク断、API制限など。これはインフラの故障モードです。

HEARTBEAT.mdファイルは安全網を提供します。毎回のハートビート時に、メインエージェントがcronジョブが実行されたかを検証します。

もしジョブが失敗したり、ウィンドウを逃した場合、ハートビートはそれを検知し、強制的に再実行します。自己修復です。人手は不要です。

ハートビートは複数のチェックをバッチ処理したり、時間に多少のズレが許容されるシナリオに適しています。cronは正確なスケジューリングや、メイン会話からの隔離に適しています。

Telegramをインターフェースに

ダッシュボードもWeb UIも管理画面もありません。私はTelegramでエージェントと対話します。

これは意図的な選択です。ダッシュボードにログインしたくない、Webアプリを開きたくない。スマホは常にそばにあり、Telegramは常に開いています。エージェントは私がいる場所で私に見つかります。

OpenClawはTelegramをチャネルとしてサポートしています。設定時に接続すれば、エージェントはTelegramボットとして現れます。メッセージを送ると返信し、草稿を送ると承認・否認します。まるでチャットの同僚のようです。

Monicaは私の主要な連絡先で、多くの対話を処理し、他のエージェントにタスクを委任します。ほかのエージェントは、cronの出力に対してレビューが必要なときに直接私に連絡します。

私の典型的な朝:起きてTelegramを開き、Dwightが調査概要を送信済み、Kellyは3つのツイート草稿を待ち、RachelはLinkedIn投稿を準備済み。私はそれらを確認し、フィードバックを出し、承認します。全体で10分のコーヒータイムです。

個性の形成

完璧な個性を最初から設計することはできません。SOUL.mdの大まかな概要から始め、行動を観察しながら時間とともに修正します。まるで人間を管理するように。

これを「修正型プロンプトエンジニアリング」と呼びます。

Kellyの最初の草稿は絵文字と感嘆符だらけでしたが、それは私のスタイルではありません。そこでフィードバックを与えました:「絵文字不要、ハッシュタグ不要、短く力強い文章にして」と。彼女は記憶を更新し、一週間後には安定して正しい出力をするようになりました。Dwightは最初、多くのノイズを拾いすぎていました。すべてのホットリポジトリや小さなアップデートも記録していました。私は彼に「すべてのホットなものが重要ではない。信号が欲しい。ノイズは不要だ」と伝え、彼は原則を更新し、情報の焦点を絞るようになりました。

どのエージェントも最初は平凡なバージョンから始まり、10回目は良くなり、30回目は優秀になります。何度も磨き上げる必要があります。テレビキャラクターの名前を付けることで、モデルに即時の個性の基準を与えられます——「Dwight Schruteのエネルギー」は徹底、集中、無駄話なしを意味します。しかし、真の個性は、数週間にわたる記憶の修正から浮かび上がってきます。

私が賛同するアドバイス:各エージェントに単一の平凡な役職名と停止条件を与えること。役割を具体的にすればするほど、出力は良くなります。

安全性

安全はあなたの手にあります。私の方法は非常にシンプルです:エージェントはそれぞれの世界を持ち、私の世界には入りません。

Mac Miniは彼らのコンピュータです。各エージェントは独自のメールアカウント、APIキー、アクセス権を持ち、そのマシン上の何も私の個人アカウントに接続されていません。

GeminiやEleven LabsなどのサービスのAPIキーは、このOpenClawインスタンス専用に取得しています。使用状況を監視し、異常があれば数秒でアクセスを遮断できます。

私はエージェントに私の個人アカウントへのアクセス権を与えません。メールを見せたいときは転送し、ドキュメントのレビューはTelegramで共有します。彼らは私が見せたいものだけを見ます。

これは新しい従業員に対する原則と同じです。最初の日にすべての鍵を渡すことはありません。彼らには自分の作業スペースと証明書を与え、必要に応じて情報を共有します。

問題が起きたとき、どう修復するか

これは魔法ではなく、インフラの問題です。インフラは故障します。

ゲートウェイがクラッシュすることもあります。稀ですが起こります。修復方法は「openclaw gateway restart」です。ハートビートシステムは、古いcronジョブを検知し、強制的に再実行します。これで一日分の損失はありません。

cronジョブがウィンドウを逃すこともあります。マシンのスリープ、ネットワーク断、API制限など。修復方法はHEARTBEAT.mdの自己修復モードです。毎回のハートビート時に、メインエージェントがジョブの実行状況を確認し、26時間以上更新されていなければ強制的に再実行します。

コンテキストウィンドウのオーバーフローもあります。会話開始時にファイルを多く読みすぎて、実作業のスペースがなくなる場合です。修復策は、SOUL.mdを40〜60行に短く保ち、AGENTS.mdを焦点化し、当日と前日の記憶ファイルだけを読み込み、すべての履歴を毎回読む必要はありません。

出力の質が低下する場合もあります。記憶ファイルが乱雑になったり矛盾したりしたときです。修復策は定期的な記憶のメンテナンスです。ハートビート中に、エージェントは毎日のログを振り返り、内容を整理してMEMORY.mdに記録し、古い日次ファイルは削除またはアーカイブします。

調整の衝突もあります。二つのエージェントが同じファイルを更新しようとする場合です。修復策は、「一人の書き手、複数の読み手」の設計です。DwightはDAILY-INTEL.mdを書き、他のすべてのエージェントはそれを読みます。誰も書き込みません。

最も信頼性の高い教訓:シンプルから始めることです。1つのエージェント、1つの仕事、1つのスケジュール。安定して動作させて1週間、その後に2つ目を追加します。最初から6つのエージェントを展開し、なぜ問題が起きるのか理解できない人は、分散システムを監視せずに導入するのと同じ誤りを犯しています。

実際のコスト

ハードウェア:Mac Mini M4の新規購入価格は499ドルですが、常時稼働するPCなら何でも良いです。古いノートPCや月額5ドルのVPSでも構いません。

AIモデルのコスト:私は複数のモデルを組み合わせてチームを構成しています。ほとんどのエージェントはClaude OpusとSonnetを使用し、特定のワークフローにはGeminiも使います。さらに、Ollamaを使ったローカルモデルのテストも進めてコスト削減を図っています。

詳細は以下の通りです:

Claude(Maxプラン):月額200ドル

Gemini API:月額50〜70ドル

TinyFish(Webエージェント):月額約50ドル

Eleven Labs(音声合成):月額約50ドル

Telegram:無料

OpenClaw:オープンソース無料

合計:月額約400ドル以内で、休むことのないチームを実現。

何が本当に変わったのか

Dwightは毎日、私の研究時間を2〜3時間節約しています。以前は毎朝、X、Hacker News、GitHubのホットトレンド、AIブログを手動で確認していましたが、今は優先順位付けされた要約と出典リンク、アクションアイテムが自動的に届きます。

Kelly、Pam、Rachelもそれぞれ1〜2時間のコンテンツ作成時間を節約しています。Rossは、夜にやっていたエンジニアリング作業も処理します。

合計:毎日約4〜5時間の節約です。

しかし、真の価値は一日ではなく、数週間、数ヶ月にわたる継続性にあります。毎日研究を続けるエージェントは、追跡可能なシグナル、トレンドの軌跡、パターン認識を蓄積します。これは一度きりの会話では得られないものです。Xでの投稿頻度や質も向上し、投稿時間も安定しました。Awesome LLM Appsリポジトリは継続的に成長し、ニュースレターも信頼できる調査パイプラインを持つようになっています。

これらのエージェントは、創造的思考や戦略的転換、革新的な突破口を生み出すことはできません。彼らが処理しているのは、かつて何時間もかかっていた反復的で構造化された作業です。これにより、人間の脳が本当に必要な仕事に集中できるのです。

始め方

最初から6つのエージェントを作る必要はありません。

第一週:1つのエージェント、1つの仕事。OpenClawをインストールし、エージェントと対話しながら最初のSOUL.mdを作成します。毎日繰り返すタスク(多くの人にとっては調査やコンテンツ作成)を選び、Telegramを設定し、cronを作成して1週間動かし、問題点を修正します。

第二週:記憶システムを導入し、磨き続ける。最初は出力が平凡でも問題ありません。フィードバックを与え、記憶ファイルを成長させ、状況に応じてSOUL.mdを調整します。2週目の終わりには、エージェントは本当に役立つ出力を出せるようになっているはずです。

第三週:2つ目のエージェントを追加。調査エージェントがインテリジェンスを出す一方で、ツイートやコンテンツを自動生成するエージェントも必要です。共有ファイルの仕組みを構築:最初のエージェントが書き、2つ目のエージェントが読み取る。調整はファイルシステムだけです。

第四週以降:順次追加。必要に応じて新しいエージェントを導入します。すべては「本当に必要なもの」に焦点を当ててください。デモや概念実証ではなく、あなたのワークフローの実際のギャップを埋めるために。

これを採用するのは採用と同じです。創業初日に6人雇うことはありません。最初は1人だけ雇い、効率的に動かし、必要に応じて次を雇います。

心構えの変化

エージェントが1ヶ月間安定して動き続けると、いくつかの変化が起きます。あなたはAIを一時的に使うツールではなく、常に働き続けるチームとして捉え始めるのです。

朝Telegramを開くとき、「おはよう、Monica」と声をかけ、寝る前に「おやすみ」と伝える。これは一見馬鹿げているようですが、1ヶ月間のやりとりとフィードバックを経て、エージェントと人間の境界は曖昧になり始めます。

モデルは基本設定です。誰でもClaude、GPT、Geminiを使えます。Alphaは、モデルを中心に構築されたシステム——SOUL.md、記憶システム、スケジューリング、調整パターン、数週間のフィードバック——です。

このシステムはあなたのものであり、あなたと同じエージェントや記憶ファイル、磨き上げた個性を持つ人はいません。

しかも、それは日々複利的に成長します。

Dwightの調査は彼の記憶を豊かにし、Kellyのフィードバックは彼女の草稿を鋭くし、Rossのバグ修正はあなたのコード理解を深めます。

これこそが真の競争優位です。モデルではなく、学習するシステムです。

今日から始めましょう。1つのエージェント、1つの仕事、1つのスケジュール。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし
  • ピン