著者:Shubham Saboo翻訳:深潮 TechFlow深潮ガイド:6人の各自の役割を持つエージェントが、著者が寝ている間に研究、コンテンツ作成、コードレビュー、ニュースレターの制作を完了します。著者はファイル構造、実際の費用、直面した課題、週ごとの提案を完全に公開しており、現在最も実用的な個人AIエージェントの実践記録の一つです。全文は以下の通りです:私が寝ている間に6つのAIエージェントが私のすべての仕事を管理しています。これはデモではありません。週末のプロジェクトでもありません。24時間稼働する本物のチームが、私が決して遅れをとらないようにしています。研究は完了し、コンテンツの草稿もできている。コードレビューも済み、ニュースレターも準備完了。毎朝Telegramを開くと、彼らはすでに一日分の仕事を終えています。昨日、私のエージェントチームについての記事を投稿しました。第一位の質問は「一体どうやってこれを構築したのか?」でした。これが答えです。理論は語りません。アーキテクチャ図も描きません。実際に使っているファイル構造、実際に支払った費用、直面した失敗例をすべて公開します。この記事を読めば、あなたも寝ている間に自律的に動くAIエージェントチームの構築方法がわかるでしょう。なぜチームなのか、ツールではない理由Unwind AIとAwesome LLM Appsリポジトリを並行運用するには、毎日6つのことを行う必要があります:AI分野のホットトピックの調査、ツイート作成、LinkedIn投稿、ニュースレターの草稿作成、リポジトリのGitHub貢献のレビュー、コミュニティの問題対応。各タスクは30分から60分。6つのタスク。これだけで一日が終わってしまい、実際の仕事に取りかかる時間はありません。この問題を単一のエージェントで解決しようと試みました。研究、執筆、レビューをすべて一つの巨大なプロンプトにまとめて対応させましたが、結果は平凡なものに。コンテキストが膨れ上がり、質が低下しました。一人のエージェントでは6つの仕事を同時にこなせません。そこで6つのAIエージェントを雇いました。このチームについて各エージェントにはテレビドラマのキャラクター名を付けています。これは冗談ではありません。Claudeに「Dwight Schruteのエネルギーがある」と言うと、訓練データからそれが何を意味するかすぐに理解します:徹底的、集中力が高い、仕事を命とみなす。これは30シーズン分のキャラクターから学んだもので、無料で使わせてもらっています。1. Monica(チーフ・オブ・スタッフ):モニカ・ゲラー(Monica Geller)にちなんで命名。彼女はメインエージェントで、私と最も頻繁にやりとりします。ほかのエージェントを調整し、戦略的意思決定を行い、適切な専門家にタスクを割り振ります。彼女のSOUL.mdにはこう書かれています:「あなたはすべてを正しく行うことを保証する人です。」2. Dwight(調査):德怀特·施鲁特(Dwight Schrute)にちなんで命名。彼は毎日3回、X、Hacker News、GitHubのホットトレンド、Google AIブログや研究論文をスキャンし、構造化されたインテリジェンスレポートを作成し、他のエージェントが利用できるようにします。3. Kelly(X/Twitter):ケリー・カプール(Kelly Kapoor)にちなんで命名。彼女はDwightの調査結果を読み取り、私の口調でツイートの草稿を作成します。単一ツイート、スレッド、引用ツイートも含む。彼女のSOUL.mdにはこう書かれています:「あなたは流行る前にそれを知っている。」4. Rachel(LinkedIn):レイチェル・グリーン(Rachel Green)にちなんで命名。情報源はKellyと同じですが、プラットフォームが異なり、トーンも異なります。思想リーダーシップの観点から投稿します。5. Ross(エンジニアリング):ロス・ゲラー(Ross Geller)にちなんで命名。コードレビュー、バグ修正、技術的実装を担当。彼のSOUL.mdにはこう書かれています:「問題に取り組むときは、まず徹底的に理解しなさい。症状だけを修正してはいけない。」6. Pam(ニュースレター):パム・ビーズリー(Pam Beesly)にちなんで命名。Dwightの毎日のインテリジェンスをニュースレターの要約に整理します。この6人のエージェントは、それぞれの仕事を担当し、役割分担は明確です。構築について私はMac Mini M4上で全てを動かしています。ただし、明確にしておきます:Mac Miniは必須ではありません。OpenClawはmacOS、Linux、Windows(WSL経由)をサポートしています。ノートPCでも、ゲーミングPCでも、月額5ドルのVPSでも動きます。Mac Miniの便利さは、常時電源オン、静音、省電力ですが、必須ではありません。私の構成:Mac Mini M4のベースモデル。常に電源とネットワークに接続し、ディスプレイは使わず、完全にスマホのTelegramを通じて操作しています。OpenClawのインストールターミナルの2行コマンドだけで、5分もかかりません。問題があれば、OpenClawのドキュメントを参照してください。これでゲートウェイが起動します。つまり、すべてを動かし続けるバックグラウンドプロセスです。エージェントの管理、cronジョブの実行、Telegramメッセージの処理を行います。ターミナルを閉じても、エージェントは動き続けます。作業エリアの構造一つのOpenClawインスタンスに複数のエージェントがいます。6つの独立したインストールではありません。私の実際のディレクトリ構造は以下の通りです:Monicaはルートディレクトリにいます。彼女は私と直接やりとりするメインエージェントです。他のエージェントは彼女に委任されたサブエージェント、または自分のcron計画に従って独立して動作します。最初から6つのエージェントを作る必要はありません。最初はMonicaだけで始め、ワークフローが明確になるにつれて、数週間かけて徐々に他のエージェントを追加しました。SOUL.mdとは何か各エージェントは1つのファイル、SOUL.mdで定義されます。これがエージェントのアイデンティティ、役割、操作指示の最重要ファイルです。例えば、DwightのSOUL.mdはおおよそ以下のようになります:このファイルが何をしているかに注意してください。単に「あなたは調査エージェントです」と言うだけではありません。エージェントに個性、明確な原則、他のエージェントとの関係、意思決定の枠組みを与えています。MonicaのSOUL.mdも同様です。すべてのエージェントは一貫したパターンを持ちます:アイデンティティ、役割、原則、関係、スタイル。各SOUL.mdは約40〜60行で、短くとも会話ごとにコンテキストに完全に収まり、安定した一貫性のある行動を生み出せる内容です。エージェント間の調整エージェント間にはAPI呼び出しもメッセージキューも、オーケストレーションフレームワークもありません。唯一の手段はファイルです。Dwightが調査を終えたら、結果をintel/DAILY-INTEL.mdに書き込みます。Kellyはそれを読み取り、その内容に基づいてツイートの草稿を作成します。Rachelも同じファイルを読み取り、LinkedIn投稿を作成。Pamはそれを読んでニュースレターを書きます。調整の仕組みはファイルシステムだけです。DwightのSOUL.mdは正確に彼にどこに書くべきかを指示します。KellyのAGENTS.mdは正確に彼女にどこから読むべきかを指示します。中間層や統合層はありません。Dwightがファイルに書き込み、Kellyがファイルから読み取るだけです。やりとりはディスク上のMarkdownドキュメントです。これは非常にシンプルに見えますが、実際に動作します。ファイルはクラッシュしません。認証の問題もありません。APIのレート制限も気にしなくていい。そこにあるだけです。構造化データはJSONで保存し、人間が読む要約はMarkdownで保存します。エージェントはMarkdownを読み、JSONは重複排除と長期追跡のための真の情報源です。記憶システムエージェントは毎回起動時に前回の会話の記憶を持ちません。すべての会話は最初から始まります。これは仕様であり欠陥ではありません。ただし、記憶は明示的に管理する必要があります。二層構造です。毎日のログ(memory/YYYY-MM-DD.md):各会話の原始記録。何が起きたか、何を草稿したか、どんなフィードバックを受けたかを記録します。エージェントは一日中継続的に書き込みます。長期記憶(MEMORY.md):毎日のログから抽出されたエッセンスや洞察。学んだ教訓、好みの発見、パターンの認識を含みます。各エージェントは、会話開始時に次の順序でファイルを読むと良いと記述しています:まずSOUL.md、次にUSER.md、次に当日と前日のmemoryファイル、そしてメイン会話の場合はMEMORY.md。これらのエージェントは時間とともに進化します。モデルの改良によるものではなく、読み込むコンテキストが豊かになるからです。Kellyは私の書き方を学び、絵文字やハッシュタグを使わずに書くことを覚えました。これも記憶に保存され、次回の草稿に反映されます。Dwightはどのストーリーが「Alexフィルター」(ターゲット層像)を通じて伝わるか、どれをスキップすべきかを学び、それも記憶に保存されます。毎日、エージェントは定期的に当日の記録を振り返り、重要な内容をMEMORY.mdに抽出します。日次ファイルは原始記録、MEMORY.mdは洗練された知恵です。スケジューリングエージェントは自律的に起動します。OpenClawは内蔵のcronスケジューラを使ってこれを管理します。私の実際のスケジュールは以下の通りです:順序が重要です。Dwightが最初に動きます。彼の出力に依存している他のエージェントは次に動きます。KellyとRachelはその後です。彼らはDwightのインテリジェンスファイルが存在することを前提に動きます。ハートビートの自己修復メカニズムcronジョブは時に失敗します。マシンの再起動、ジョブの停止、ネットワーク断、API制限など。これはインフラの故障モードです。HEARTBEAT.mdファイルは安全網を提供します。毎回のハートビート時に、メインエージェントがcronジョブが実行されたかを検証します。もしジョブが失敗したり、ウィンドウを逃した場合、ハートビートはそれを検知し、強制的に再実行します。自己修復です。人手は不要です。ハートビートは複数のチェックをバッチ処理したり、時間に多少のズレが許容されるシナリオに適しています。cronは正確なスケジューリングや、メイン会話からの隔離に適しています。TelegramをインターフェースにダッシュボードもWeb UIも管理画面もありません。私はTelegramでエージェントと対話します。これは意図的な選択です。ダッシュボードにログインしたくない、Webアプリを開きたくない。スマホは常にそばにあり、Telegramは常に開いています。エージェントは私がいる場所で私に見つかります。OpenClawはTelegramをチャネルとしてサポートしています。設定時に接続すれば、エージェントはTelegramボットとして現れます。メッセージを送ると返信し、草稿を送ると承認・否認します。まるでチャットの同僚のようです。Monicaは私の主要な連絡先で、多くの対話を処理し、他のエージェントにタスクを委任します。ほかのエージェントは、cronの出力に対してレビューが必要なときに直接私に連絡します。私の典型的な朝:起きてTelegramを開き、Dwightが調査概要を送信済み、Kellyは3つのツイート草稿を待ち、RachelはLinkedIn投稿を準備済み。私はそれらを確認し、フィードバックを出し、承認します。全体で10分のコーヒータイムです。個性の形成完璧な個性を最初から設計することはできません。SOUL.mdの大まかな概要から始め、行動を観察しながら時間とともに修正します。まるで人間を管理するように。これを「修正型プロンプトエンジニアリング」と呼びます。Kellyの最初の草稿は絵文字と感嘆符だらけでしたが、それは私のスタイルではありません。そこでフィードバックを与えました:「絵文字不要、ハッシュタグ不要、短く力強い文章にして」と。彼女は記憶を更新し、一週間後には安定して正しい出力をするようになりました。Dwightは最初、多くのノイズを拾いすぎていました。すべてのホットリポジトリや小さなアップデートも記録していました。私は彼に「すべてのホットなものが重要ではない。信号が欲しい。ノイズは不要だ」と伝え、彼は原則を更新し、情報の焦点を絞るようになりました。どのエージェントも最初は平凡なバージョンから始まり、10回目は良くなり、30回目は優秀になります。何度も磨き上げる必要があります。テレビキャラクターの名前を付けることで、モデルに即時の個性の基準を与えられます——「Dwight Schruteのエネルギー」は徹底、集中、無駄話なしを意味します。しかし、真の個性は、数週間にわたる記憶の修正から浮かび上がってきます。私が賛同するアドバイス:各エージェントに単一の平凡な役職名と停止条件を与えること。役割を具体的にすればするほど、出力は良くなります。安全性安全はあなたの手にあります。私の方法は非常にシンプルです:エージェントはそれぞれの世界を持ち、私の世界には入りません。Mac Miniは彼らのコンピュータです。各エージェントは独自のメールアカウント、APIキー、アクセス権を持ち、そのマシン上の何も私の個人アカウントに接続されていません。GeminiやEleven LabsなどのサービスのAPIキーは、このOpenClawインスタンス専用に取得しています。使用状況を監視し、異常があれば数秒でアクセスを遮断できます。私はエージェントに私の個人アカウントへのアクセス権を与えません。メールを見せたいときは転送し、ドキュメントのレビューはTelegramで共有します。彼らは私が見せたいものだけを見ます。これは新しい従業員に対する原則と同じです。最初の日にすべての鍵を渡すことはありません。彼らには自分の作業スペースと証明書を与え、必要に応じて情報を共有します。問題が起きたとき、どう修復するかこれは魔法ではなく、インフラの問題です。インフラは故障します。ゲートウェイがクラッシュすることもあります。稀ですが起こります。修復方法は「openclaw gateway restart」です。ハートビートシステムは、古いcronジョブを検知し、強制的に再実行します。これで一日分の損失はありません。cronジョブがウィンドウを逃すこともあります。マシンのスリープ、ネットワーク断、API制限など。修復方法はHEARTBEAT.mdの自己修復モードです。毎回のハートビート時に、メインエージェントがジョブの実行状況を確認し、26時間以上更新されていなければ強制的に再実行します。コンテキストウィンドウのオーバーフローもあります。会話開始時にファイルを多く読みすぎて、実作業のスペースがなくなる場合です。修復策は、SOUL.mdを40〜60行に短く保ち、AGENTS.mdを焦点化し、当日と前日の記憶ファイルだけを読み込み、すべての履歴を毎回読む必要はありません。出力の質が低下する場合もあります。記憶ファイルが乱雑になったり矛盾したりしたときです。修復策は定期的な記憶のメンテナンスです。ハートビート中に、エージェントは毎日のログを振り返り、内容を整理してMEMORY.mdに記録し、古い日次ファイルは削除またはアーカイブします。調整の衝突もあります。二つのエージェントが同じファイルを更新しようとする場合です。修復策は、「一人の書き手、複数の読み手」の設計です。DwightはDAILY-INTEL.mdを書き、他のすべてのエージェントはそれを読みます。誰も書き込みません。最も信頼性の高い教訓:シンプルから始めることです。1つのエージェント、1つの仕事、1つのスケジュール。安定して動作させて1週間、その後に2つ目を追加します。最初から6つのエージェントを展開し、なぜ問題が起きるのか理解できない人は、分散システムを監視せずに導入するのと同じ誤りを犯しています。実際のコストハードウェア:Mac Mini M4の新規購入価格は499ドルですが、常時稼働するPCなら何でも良いです。古いノートPCや月額5ドルのVPSでも構いません。AIモデルのコスト:私は複数のモデルを組み合わせてチームを構成しています。ほとんどのエージェントはClaude OpusとSonnetを使用し、特定のワークフローにはGeminiも使います。さらに、Ollamaを使ったローカルモデルのテストも進めてコスト削減を図っています。詳細は以下の通りです:Claude(Maxプラン):月額200ドルGemini API:月額50〜70ドルTinyFish(Webエージェント):月額約50ドルEleven Labs(音声合成):月額約50ドルTelegram:無料OpenClaw:オープンソース無料合計:月額約400ドル以内で、休むことのないチームを実現。何が本当に変わったのかDwightは毎日、私の研究時間を2〜3時間節約しています。以前は毎朝、X、Hacker News、GitHubのホットトレンド、AIブログを手動で確認していましたが、今は優先順位付けされた要約と出典リンク、アクションアイテムが自動的に届きます。Kelly、Pam、Rachelもそれぞれ1〜2時間のコンテンツ作成時間を節約しています。Rossは、夜にやっていたエンジニアリング作業も処理します。合計:毎日約4〜5時間の節約です。しかし、真の価値は一日ではなく、数週間、数ヶ月にわたる継続性にあります。毎日研究を続けるエージェントは、追跡可能なシグナル、トレンドの軌跡、パターン認識を蓄積します。これは一度きりの会話では得られないものです。Xでの投稿頻度や質も向上し、投稿時間も安定しました。Awesome LLM Appsリポジトリは継続的に成長し、ニュースレターも信頼できる調査パイプラインを持つようになっています。これらのエージェントは、創造的思考や戦略的転換、革新的な突破口を生み出すことはできません。彼らが処理しているのは、かつて何時間もかかっていた反復的で構造化された作業です。これにより、人間の脳が本当に必要な仕事に集中できるのです。始め方最初から6つのエージェントを作る必要はありません。第一週:1つのエージェント、1つの仕事。OpenClawをインストールし、エージェントと対話しながら最初のSOUL.mdを作成します。毎日繰り返すタスク(多くの人にとっては調査やコンテンツ作成)を選び、Telegramを設定し、cronを作成して1週間動かし、問題点を修正します。第二週:記憶システムを導入し、磨き続ける。最初は出力が平凡でも問題ありません。フィードバックを与え、記憶ファイルを成長させ、状況に応じてSOUL.mdを調整します。2週目の終わりには、エージェントは本当に役立つ出力を出せるようになっているはずです。第三週:2つ目のエージェントを追加。調査エージェントがインテリジェンスを出す一方で、ツイートやコンテンツを自動生成するエージェントも必要です。共有ファイルの仕組みを構築:最初のエージェントが書き、2つ目のエージェントが読み取る。調整はファイルシステムだけです。第四週以降:順次追加。必要に応じて新しいエージェントを導入します。すべては「本当に必要なもの」に焦点を当ててください。デモや概念実証ではなく、あなたのワークフローの実際のギャップを埋めるために。これを採用するのは採用と同じです。創業初日に6人雇うことはありません。最初は1人だけ雇い、効率的に動かし、必要に応じて次を雇います。心構えの変化エージェントが1ヶ月間安定して動き続けると、いくつかの変化が起きます。あなたはAIを一時的に使うツールではなく、常に働き続けるチームとして捉え始めるのです。朝Telegramを開くとき、「おはよう、Monica」と声をかけ、寝る前に「おやすみ」と伝える。これは一見馬鹿げているようですが、1ヶ月間のやりとりとフィードバックを経て、エージェントと人間の境界は曖昧になり始めます。モデルは基本設定です。誰でもClaude、GPT、Geminiを使えます。Alphaは、モデルを中心に構築されたシステム——SOUL.md、記憶システム、スケジューリング、調整パターン、数週間のフィードバック——です。このシステムはあなたのものであり、あなたと同じエージェントや記憶ファイル、磨き上げた個性を持つ人はいません。しかも、それは日々複利的に成長します。Dwightの調査は彼の記憶を豊かにし、Kellyのフィードバックは彼女の草稿を鋭くし、Rossのバグ修正はあなたのコード理解を深めます。これこそが真の競争優位です。モデルではなく、学習するシステムです。今日から始めましょう。1つのエージェント、1つの仕事、1つのスケジュール。
Googleの上級AIプロダクトマネージャー:6つのエージェントが私の日常を引き継ぎ、月額わずか400ドル未満で24時間稼働
著者:Shubham Saboo
翻訳:深潮 TechFlow
深潮ガイド:6人の各自の役割を持つエージェントが、著者が寝ている間に研究、コンテンツ作成、コードレビュー、ニュースレターの制作を完了します。
著者はファイル構造、実際の費用、直面した課題、週ごとの提案を完全に公開しており、現在最も実用的な個人AIエージェントの実践記録の一つです。
全文は以下の通りです:
私が寝ている間に6つのAIエージェントが私のすべての仕事を管理しています。
これはデモではありません。週末のプロジェクトでもありません。
24時間稼働する本物のチームが、私が決して遅れをとらないようにしています。研究は完了し、コンテンツの草稿もできている。コードレビューも済み、ニュースレターも準備完了。毎朝Telegramを開くと、彼らはすでに一日分の仕事を終えています。
昨日、私のエージェントチームについての記事を投稿しました。第一位の質問は「一体どうやってこれを構築したのか?」でした。
これが答えです。理論は語りません。アーキテクチャ図も描きません。実際に使っているファイル構造、実際に支払った費用、直面した失敗例をすべて公開します。
この記事を読めば、あなたも寝ている間に自律的に動くAIエージェントチームの構築方法がわかるでしょう。
なぜチームなのか、ツールではない理由
Unwind AIとAwesome LLM Appsリポジトリを並行運用するには、毎日6つのことを行う必要があります:AI分野のホットトピックの調査、ツイート作成、LinkedIn投稿、ニュースレターの草稿作成、リポジトリのGitHub貢献のレビュー、コミュニティの問題対応。
各タスクは30分から60分。6つのタスク。これだけで一日が終わってしまい、実際の仕事に取りかかる時間はありません。
この問題を単一のエージェントで解決しようと試みました。研究、執筆、レビューをすべて一つの巨大なプロンプトにまとめて対応させましたが、結果は平凡なものに。コンテキストが膨れ上がり、質が低下しました。一人のエージェントでは6つの仕事を同時にこなせません。
そこで6つのAIエージェントを雇いました。
このチームについて
各エージェントにはテレビドラマのキャラクター名を付けています。これは冗談ではありません。Claudeに「Dwight Schruteのエネルギーがある」と言うと、訓練データからそれが何を意味するかすぐに理解します:徹底的、集中力が高い、仕事を命とみなす。これは30シーズン分のキャラクターから学んだもので、無料で使わせてもらっています。
Monica(チーフ・オブ・スタッフ):モニカ・ゲラー(Monica Geller)にちなんで命名。彼女はメインエージェントで、私と最も頻繁にやりとりします。ほかのエージェントを調整し、戦略的意思決定を行い、適切な専門家にタスクを割り振ります。彼女のSOUL.mdにはこう書かれています:「あなたはすべてを正しく行うことを保証する人です。」
Dwight(調査):德怀特·施鲁特(Dwight Schrute)にちなんで命名。彼は毎日3回、X、Hacker News、GitHubのホットトレンド、Google AIブログや研究論文をスキャンし、構造化されたインテリジェンスレポートを作成し、他のエージェントが利用できるようにします。
Kelly(X/Twitter):ケリー・カプール(Kelly Kapoor)にちなんで命名。彼女はDwightの調査結果を読み取り、私の口調でツイートの草稿を作成します。単一ツイート、スレッド、引用ツイートも含む。彼女のSOUL.mdにはこう書かれています:「あなたは流行る前にそれを知っている。」
Rachel(LinkedIn):レイチェル・グリーン(Rachel Green)にちなんで命名。情報源はKellyと同じですが、プラットフォームが異なり、トーンも異なります。思想リーダーシップの観点から投稿します。
Ross(エンジニアリング):ロス・ゲラー(Ross Geller)にちなんで命名。コードレビュー、バグ修正、技術的実装を担当。彼のSOUL.mdにはこう書かれています:「問題に取り組むときは、まず徹底的に理解しなさい。症状だけを修正してはいけない。」
Pam(ニュースレター):パム・ビーズリー(Pam Beesly)にちなんで命名。Dwightの毎日のインテリジェンスをニュースレターの要約に整理します。
この6人のエージェントは、それぞれの仕事を担当し、役割分担は明確です。
構築について
私はMac Mini M4上で全てを動かしています。ただし、明確にしておきます:Mac Miniは必須ではありません。
OpenClawはmacOS、Linux、Windows(WSL経由)をサポートしています。ノートPCでも、ゲーミングPCでも、月額5ドルのVPSでも動きます。Mac Miniの便利さは、常時電源オン、静音、省電力ですが、必須ではありません。
私の構成:Mac Mini M4のベースモデル。常に電源とネットワークに接続し、ディスプレイは使わず、完全にスマホのTelegramを通じて操作しています。
OpenClawのインストール
ターミナルの2行コマンドだけで、5分もかかりません。
問題があれば、OpenClawのドキュメントを参照してください。
これでゲートウェイが起動します。つまり、すべてを動かし続けるバックグラウンドプロセスです。エージェントの管理、cronジョブの実行、Telegramメッセージの処理を行います。ターミナルを閉じても、エージェントは動き続けます。
作業エリアの構造
一つのOpenClawインスタンスに複数のエージェントがいます。6つの独立したインストールではありません。
私の実際のディレクトリ構造は以下の通りです:
Monicaはルートディレクトリにいます。彼女は私と直接やりとりするメインエージェントです。他のエージェントは彼女に委任されたサブエージェント、または自分のcron計画に従って独立して動作します。
最初から6つのエージェントを作る必要はありません。最初はMonicaだけで始め、ワークフローが明確になるにつれて、数週間かけて徐々に他のエージェントを追加しました。
SOUL.mdとは何か
各エージェントは1つのファイル、SOUL.mdで定義されます。これがエージェントのアイデンティティ、役割、操作指示の最重要ファイルです。
例えば、DwightのSOUL.mdはおおよそ以下のようになります:
このファイルが何をしているかに注意してください。単に「あなたは調査エージェントです」と言うだけではありません。エージェントに個性、明確な原則、他のエージェントとの関係、意思決定の枠組みを与えています。
MonicaのSOUL.mdも同様です。
すべてのエージェントは一貫したパターンを持ちます:アイデンティティ、役割、原則、関係、スタイル。各SOUL.mdは約40〜60行で、短くとも会話ごとにコンテキストに完全に収まり、安定した一貫性のある行動を生み出せる内容です。
エージェント間の調整
エージェント間にはAPI呼び出しもメッセージキューも、オーケストレーションフレームワークもありません。
唯一の手段はファイルです。
Dwightが調査を終えたら、結果をintel/DAILY-INTEL.mdに書き込みます。Kellyはそれを読み取り、その内容に基づいてツイートの草稿を作成します。Rachelも同じファイルを読み取り、LinkedIn投稿を作成。Pamはそれを読んでニュースレターを書きます。
調整の仕組みはファイルシステムだけです。
DwightのSOUL.mdは正確に彼にどこに書くべきかを指示します。
KellyのAGENTS.mdは正確に彼女にどこから読むべきかを指示します。
中間層や統合層はありません。Dwightがファイルに書き込み、Kellyがファイルから読み取るだけです。やりとりはディスク上のMarkdownドキュメントです。
これは非常にシンプルに見えますが、実際に動作します。ファイルはクラッシュしません。認証の問題もありません。APIのレート制限も気にしなくていい。そこにあるだけです。
構造化データはJSONで保存し、人間が読む要約はMarkdownで保存します。エージェントはMarkdownを読み、JSONは重複排除と長期追跡のための真の情報源です。
記憶システム
エージェントは毎回起動時に前回の会話の記憶を持ちません。すべての会話は最初から始まります。これは仕様であり欠陥ではありません。ただし、記憶は明示的に管理する必要があります。
二層構造です。
毎日のログ(memory/YYYY-MM-DD.md):各会話の原始記録。何が起きたか、何を草稿したか、どんなフィードバックを受けたかを記録します。エージェントは一日中継続的に書き込みます。
長期記憶(MEMORY.md):毎日のログから抽出されたエッセンスや洞察。学んだ教訓、好みの発見、パターンの認識を含みます。
各エージェントは、会話開始時に次の順序でファイルを読むと良いと記述しています:まずSOUL.md、次にUSER.md、次に当日と前日のmemoryファイル、そしてメイン会話の場合はMEMORY.md。
これらのエージェントは時間とともに進化します。モデルの改良によるものではなく、読み込むコンテキストが豊かになるからです。
Kellyは私の書き方を学び、絵文字やハッシュタグを使わずに書くことを覚えました。これも記憶に保存され、次回の草稿に反映されます。Dwightはどのストーリーが「Alexフィルター」(ターゲット層像)を通じて伝わるか、どれをスキップすべきかを学び、それも記憶に保存されます。
毎日、エージェントは定期的に当日の記録を振り返り、重要な内容をMEMORY.mdに抽出します。日次ファイルは原始記録、MEMORY.mdは洗練された知恵です。
スケジューリング
エージェントは自律的に起動します。OpenClawは内蔵のcronスケジューラを使ってこれを管理します。
私の実際のスケジュールは以下の通りです:
順序が重要です。Dwightが最初に動きます。彼の出力に依存している他のエージェントは次に動きます。KellyとRachelはその後です。彼らはDwightのインテリジェンスファイルが存在することを前提に動きます。
ハートビートの自己修復メカニズム
cronジョブは時に失敗します。マシンの再起動、ジョブの停止、ネットワーク断、API制限など。これはインフラの故障モードです。
HEARTBEAT.mdファイルは安全網を提供します。毎回のハートビート時に、メインエージェントがcronジョブが実行されたかを検証します。
もしジョブが失敗したり、ウィンドウを逃した場合、ハートビートはそれを検知し、強制的に再実行します。自己修復です。人手は不要です。
ハートビートは複数のチェックをバッチ処理したり、時間に多少のズレが許容されるシナリオに適しています。cronは正確なスケジューリングや、メイン会話からの隔離に適しています。
Telegramをインターフェースに
ダッシュボードもWeb UIも管理画面もありません。私はTelegramでエージェントと対話します。
これは意図的な選択です。ダッシュボードにログインしたくない、Webアプリを開きたくない。スマホは常にそばにあり、Telegramは常に開いています。エージェントは私がいる場所で私に見つかります。
OpenClawはTelegramをチャネルとしてサポートしています。設定時に接続すれば、エージェントはTelegramボットとして現れます。メッセージを送ると返信し、草稿を送ると承認・否認します。まるでチャットの同僚のようです。
Monicaは私の主要な連絡先で、多くの対話を処理し、他のエージェントにタスクを委任します。ほかのエージェントは、cronの出力に対してレビューが必要なときに直接私に連絡します。
私の典型的な朝:起きてTelegramを開き、Dwightが調査概要を送信済み、Kellyは3つのツイート草稿を待ち、RachelはLinkedIn投稿を準備済み。私はそれらを確認し、フィードバックを出し、承認します。全体で10分のコーヒータイムです。
個性の形成
完璧な個性を最初から設計することはできません。SOUL.mdの大まかな概要から始め、行動を観察しながら時間とともに修正します。まるで人間を管理するように。
これを「修正型プロンプトエンジニアリング」と呼びます。
Kellyの最初の草稿は絵文字と感嘆符だらけでしたが、それは私のスタイルではありません。そこでフィードバックを与えました:「絵文字不要、ハッシュタグ不要、短く力強い文章にして」と。彼女は記憶を更新し、一週間後には安定して正しい出力をするようになりました。Dwightは最初、多くのノイズを拾いすぎていました。すべてのホットリポジトリや小さなアップデートも記録していました。私は彼に「すべてのホットなものが重要ではない。信号が欲しい。ノイズは不要だ」と伝え、彼は原則を更新し、情報の焦点を絞るようになりました。
どのエージェントも最初は平凡なバージョンから始まり、10回目は良くなり、30回目は優秀になります。何度も磨き上げる必要があります。テレビキャラクターの名前を付けることで、モデルに即時の個性の基準を与えられます——「Dwight Schruteのエネルギー」は徹底、集中、無駄話なしを意味します。しかし、真の個性は、数週間にわたる記憶の修正から浮かび上がってきます。
私が賛同するアドバイス:各エージェントに単一の平凡な役職名と停止条件を与えること。役割を具体的にすればするほど、出力は良くなります。
安全性
安全はあなたの手にあります。私の方法は非常にシンプルです:エージェントはそれぞれの世界を持ち、私の世界には入りません。
Mac Miniは彼らのコンピュータです。各エージェントは独自のメールアカウント、APIキー、アクセス権を持ち、そのマシン上の何も私の個人アカウントに接続されていません。
GeminiやEleven LabsなどのサービスのAPIキーは、このOpenClawインスタンス専用に取得しています。使用状況を監視し、異常があれば数秒でアクセスを遮断できます。
私はエージェントに私の個人アカウントへのアクセス権を与えません。メールを見せたいときは転送し、ドキュメントのレビューはTelegramで共有します。彼らは私が見せたいものだけを見ます。
これは新しい従業員に対する原則と同じです。最初の日にすべての鍵を渡すことはありません。彼らには自分の作業スペースと証明書を与え、必要に応じて情報を共有します。
問題が起きたとき、どう修復するか
これは魔法ではなく、インフラの問題です。インフラは故障します。
ゲートウェイがクラッシュすることもあります。稀ですが起こります。修復方法は「openclaw gateway restart」です。ハートビートシステムは、古いcronジョブを検知し、強制的に再実行します。これで一日分の損失はありません。
cronジョブがウィンドウを逃すこともあります。マシンのスリープ、ネットワーク断、API制限など。修復方法はHEARTBEAT.mdの自己修復モードです。毎回のハートビート時に、メインエージェントがジョブの実行状況を確認し、26時間以上更新されていなければ強制的に再実行します。
コンテキストウィンドウのオーバーフローもあります。会話開始時にファイルを多く読みすぎて、実作業のスペースがなくなる場合です。修復策は、SOUL.mdを40〜60行に短く保ち、AGENTS.mdを焦点化し、当日と前日の記憶ファイルだけを読み込み、すべての履歴を毎回読む必要はありません。
出力の質が低下する場合もあります。記憶ファイルが乱雑になったり矛盾したりしたときです。修復策は定期的な記憶のメンテナンスです。ハートビート中に、エージェントは毎日のログを振り返り、内容を整理してMEMORY.mdに記録し、古い日次ファイルは削除またはアーカイブします。
調整の衝突もあります。二つのエージェントが同じファイルを更新しようとする場合です。修復策は、「一人の書き手、複数の読み手」の設計です。DwightはDAILY-INTEL.mdを書き、他のすべてのエージェントはそれを読みます。誰も書き込みません。
最も信頼性の高い教訓:シンプルから始めることです。1つのエージェント、1つの仕事、1つのスケジュール。安定して動作させて1週間、その後に2つ目を追加します。最初から6つのエージェントを展開し、なぜ問題が起きるのか理解できない人は、分散システムを監視せずに導入するのと同じ誤りを犯しています。
実際のコスト
ハードウェア:Mac Mini M4の新規購入価格は499ドルですが、常時稼働するPCなら何でも良いです。古いノートPCや月額5ドルのVPSでも構いません。
AIモデルのコスト:私は複数のモデルを組み合わせてチームを構成しています。ほとんどのエージェントはClaude OpusとSonnetを使用し、特定のワークフローにはGeminiも使います。さらに、Ollamaを使ったローカルモデルのテストも進めてコスト削減を図っています。
詳細は以下の通りです:
Claude(Maxプラン):月額200ドル
Gemini API:月額50〜70ドル
TinyFish(Webエージェント):月額約50ドル
Eleven Labs(音声合成):月額約50ドル
Telegram:無料
OpenClaw:オープンソース無料
合計:月額約400ドル以内で、休むことのないチームを実現。
何が本当に変わったのか
Dwightは毎日、私の研究時間を2〜3時間節約しています。以前は毎朝、X、Hacker News、GitHubのホットトレンド、AIブログを手動で確認していましたが、今は優先順位付けされた要約と出典リンク、アクションアイテムが自動的に届きます。
Kelly、Pam、Rachelもそれぞれ1〜2時間のコンテンツ作成時間を節約しています。Rossは、夜にやっていたエンジニアリング作業も処理します。
合計:毎日約4〜5時間の節約です。
しかし、真の価値は一日ではなく、数週間、数ヶ月にわたる継続性にあります。毎日研究を続けるエージェントは、追跡可能なシグナル、トレンドの軌跡、パターン認識を蓄積します。これは一度きりの会話では得られないものです。Xでの投稿頻度や質も向上し、投稿時間も安定しました。Awesome LLM Appsリポジトリは継続的に成長し、ニュースレターも信頼できる調査パイプラインを持つようになっています。
これらのエージェントは、創造的思考や戦略的転換、革新的な突破口を生み出すことはできません。彼らが処理しているのは、かつて何時間もかかっていた反復的で構造化された作業です。これにより、人間の脳が本当に必要な仕事に集中できるのです。
始め方
最初から6つのエージェントを作る必要はありません。
第一週:1つのエージェント、1つの仕事。OpenClawをインストールし、エージェントと対話しながら最初のSOUL.mdを作成します。毎日繰り返すタスク(多くの人にとっては調査やコンテンツ作成)を選び、Telegramを設定し、cronを作成して1週間動かし、問題点を修正します。
第二週:記憶システムを導入し、磨き続ける。最初は出力が平凡でも問題ありません。フィードバックを与え、記憶ファイルを成長させ、状況に応じてSOUL.mdを調整します。2週目の終わりには、エージェントは本当に役立つ出力を出せるようになっているはずです。
第三週:2つ目のエージェントを追加。調査エージェントがインテリジェンスを出す一方で、ツイートやコンテンツを自動生成するエージェントも必要です。共有ファイルの仕組みを構築:最初のエージェントが書き、2つ目のエージェントが読み取る。調整はファイルシステムだけです。
第四週以降:順次追加。必要に応じて新しいエージェントを導入します。すべては「本当に必要なもの」に焦点を当ててください。デモや概念実証ではなく、あなたのワークフローの実際のギャップを埋めるために。
これを採用するのは採用と同じです。創業初日に6人雇うことはありません。最初は1人だけ雇い、効率的に動かし、必要に応じて次を雇います。
心構えの変化
エージェントが1ヶ月間安定して動き続けると、いくつかの変化が起きます。あなたはAIを一時的に使うツールではなく、常に働き続けるチームとして捉え始めるのです。
朝Telegramを開くとき、「おはよう、Monica」と声をかけ、寝る前に「おやすみ」と伝える。これは一見馬鹿げているようですが、1ヶ月間のやりとりとフィードバックを経て、エージェントと人間の境界は曖昧になり始めます。
モデルは基本設定です。誰でもClaude、GPT、Geminiを使えます。Alphaは、モデルを中心に構築されたシステム——SOUL.md、記憶システム、スケジューリング、調整パターン、数週間のフィードバック——です。
このシステムはあなたのものであり、あなたと同じエージェントや記憶ファイル、磨き上げた個性を持つ人はいません。
しかも、それは日々複利的に成長します。
Dwightの調査は彼の記憶を豊かにし、Kellyのフィードバックは彼女の草稿を鋭くし、Rossのバグ修正はあなたのコード理解を深めます。
これこそが真の競争優位です。モデルではなく、学習するシステムです。
今日から始めましょう。1つのエージェント、1つの仕事、1つのスケジュール。