ExcelマクロやVBAで業務を自動化してきたエンジニアにとって、「もっと柔軟に、もっとインテリジェントに」という要求は常に存在する。724 Officeは、LangChainやCrewAIといったフレームワークを一切使わず、約10,000行の純粋Pythonコードで36のツールを搭載した自己進化型AIエージェントだ。GitHub上でスター1,000超を獲得し、実際に24時間365日の本番環境で複数ユーザーに利用されている。

本記事では、724 Officeの設計思想、アーキテクチャ、36ツールの全容、MCP連携、そして運用機能まで、コードレベルの具体性を保ちながら公式READMEと設定例に基づき整理する。業務自動化基盤を自前で組む際の設計参考として活用してほしい。

「フレームワークのブラックボックスに頼らず、すべてのコードを自分で読める粒度に保つ」——これが724 Officeの出発点であり、エッジデプロイ・マルチテナント・自己修復を同居させる現実解にもなっている。


この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版 をご覧ください。

724 Officeとは何か:設計思想の7原則

724 Officeが最も特徴的なのは、LangChain・LlamaIndex・CrewAIといった主要フレームワークを一切使わない設計判断だ。公式READMEでは以下の7つの設計原則が明示されている。

  1. Zero framework dependency — すべてのコードが可視的でデバッグ可能。隠れた抽象化なし
  2. Modular tools@toolデコレータを付けた関数を追加するだけで機能拡張
  3. Edge-deployable — Jetson Orin Nano(8GB RAM, ARM64)でも動作する省メモリ設計
  4. Self-evolving — エージェント自身がランタイムで新しいツールを生成・診断・通知
  5. Structural behavior correction — プロンプト修正ではなくNudge・フック・バリデーションで行動を矯正
  6. Build for deletion — モデルが賢くなれば不要になるモジュールをクリーンに削除可能
  7. Context is the scarcest resource — トークン予算を最重要の設計制約として扱う

特に7番目の「コンテキストは最も希少な資源」という発想は、現行のエージェント設計における最も示唆的な原則と言える。OpenHandsのようなAIコーディングエージェントがソフトウェア開発に特化しているのに対し、724 Officeはメッセージング連携・スケジューリング・マルチモーダル処理など、より幅広い業務自動化をカバーする汎用エージェント基盤として位置づけられる。

設計原則の読み解き方
「Build for deletion」は特に興味深い。LLMの性能向上を前提に、ヘルパー関数やハンドメイドのプロンプトパッチを一時的な足場と割り切り、不要になれば即削除する。長期運用で技術的負債を溜めない思想が表れている。
この章のポイント
724 OfficeはLangChain等のフレームワークを一切使わない純粋Python実装のエージェント。7つの設計原則は「可視性」「削除可能性」「コンテキスト節約」を軸に据え、エッジから本番運用まで一つの設計で通す方針を明文化している。

クイックスタート:直接実行とDocker推奨環境

724 Officeのセットアップは、軽量な依存のみでローカル実行でき、本番はDockerを推奨している。

直接実行の場合

git clone https://github.com/wangziqi06/724-office.git
cd 724-office
cp config.example.json config.json
# config.json にAPIキーを設定

pip install croniter lancedb websocket-client pilk \
            numpy httpx beautifulsoup4 pydub jieba fpdf2

mkdir -p workspace/memory workspace/files
python3 xiaowang.py

Docker推奨環境

# Dockerfile.example -> Dockerfile にコピー
# docker-compose.example.yml -> docker-compose.yml にコピー
# .env に認証情報を設定

docker compose build
docker compose up -d

起動後、ポート8080でHTTPサーバーが立ち上がる。メッセージングプラットフォームのWebhookを http://YOUR_SERVER:8080/ に向ければ接続完了だ。

config.example.json にはLLMプロバイダ(OpenAI互換API)、メッセージング認証情報、メモリ設定、ASR設定、MCPサーバー接続などの全設定項目がまとめられている。

セットアップ方式 対象環境 メリット 注意点
直接実行 開発・検証・エッジ 依存最小、起動が速い 永続化は自前で管理
Docker Compose 本番・マルチテナント 再起動自動化、ルーター利用可 コンテナ監視が必要
Jetson Orin Nano エッジ常駐 省メモリで24/7稼働 ARM64用依存の確認必須

フレームワーク依存がないことで、pipインストールで手こずる場面が極めて少ない。これはエッジ運用で効いてくるポイントだ。

この章のポイント
`config.example.json` を書き換え、`pip install` と `python3 xiaowang.py` だけで起動する。本番運用ではDocker Composeを前提にした構成になっており、エッジ(Jetson)まで同じコードで回せるのが強み。

アーキテクチャ全体像:モジュール構成と処理フロー

724 Officeのv2.0ではモノリシックな tools.py を7つのドメインモジュールに分割している。全体のコード構成は以下のとおりだ。

ファイル 行数 責務
xiaowang.py 約1,040行 エントリポイント:HTTP、コールバック、デバウンス、ASR、グループ対応
llm.py 約1,260行 LLM API + ツール使用ループ + 予算管理 + Nudge統合
tools_base.py 約314行 レジストリ + @toolデコレータ + 動的フィルタリング + サーキットブレーカー
tools_messaging.py 約550行 メッセージ/ファイル/スケジュール/位置情報ツール
tools_admin.py 約860行 実行/ファイル操作/診断/プラグイン/MCP管理
tools_mirror.py 約716行 AI Mirror:行動プロファイルレポート + 未来の自分との対話
tools_page.py 約470行 EChartsによるインタラクティブHTML生成
tools_search.py 約293行 マルチエンジンWeb検索 + メモリ検索
tools_video.py 約394行 動画トリム/BGM/AI生成
memory.py 約1,100行 三層メモリ(セッション + 圧縮 + ベクトル)
scheduler.py 約652行 Cron + ワンショット + 非アクティブガード
router.py 約500行超 マルチテナントDockerルーター + 自動プロビジョニング
mcp_client.py 約342行 MCPプロトコルクライアント(JSON-RPC、依存ゼロ)
nudge.py 約190行 Nudgeシステム:ツール不使用の検出と自動ヒント注入
archive.py 約204行 日次セッションアーカイブ(ブラックボックス記録)

処理の流れを図にすると以下のようになる。

graph TD A["メッセージング
プラットフォーム"] --> B["router.py
マルチテナント振り分け
コンテナ自動生成"] B --> C["xiaowang.py
HTTPサーバー
デバウンス・ASR処理"] C --> D["llm.py
ツール使用ループ
予算管理・Nudge統合"] D --> E["tools_messaging
メッセージ・スケジュール"] D --> F["tools_admin
実行・診断・MCP"] D --> G["tools_search
Web検索・メモリ検索"] D --> H["tools_video
動画処理"] D --> I["tools_page
ECharts可視化"] D --> J["tools_mirror
AI Mirror"] F --> K["mcp_client.py
JSON-RPC通信"] D --> L["memory.py
三層メモリ管理"] D --> M["scheduler.py
Cronスケジューリング"] D --> N["nudge.py
行動矯正システム"]

中心にいるのは llm.py のツール使用ループだ。ここで予算管理・Nudge・動的フィルタリングがひとまとまりで回り、各ドメインモジュールをツールとして呼び出す。モジュールはいずれも単一責任で、依存の向きが一方向に揃えられている。

この章のポイント
v2.0では `tools.py` が7つのドメイン別モジュールに分割され、`llm.py` のツール使用ループを中心に据える構成。Mermaid図のとおり、router → xiaowang → llm → tools/memory/scheduler という明快な流れで、依存の方向が一直線に保たれている。

三層メモリシステム:短期・圧縮・ベクトル検索

724 Officeの中核機能の一つが三層構造のメモリシステムだ。LangChainのMemoryモジュールがフレームワーク内での会話履歴管理を提供するのに対し、724 Officeは独自実装でより細やかな制御を実現している。

Layer 1: セッションメモリ(短期)

  • セッションごとに直近40メッセージをJSON形式で保持
  • オーバーフロー時に自動圧縮をトリガー
  • 100KBを超えるセッションは自動アーカイブ

Layer 2: 圧縮メモリ(長期)

  • 退出したメッセージからLLMが構造化された事実を抽出
  • コサイン類似度(閾値0.92)による重複排除
  • LanceDBにベクトルとして保存

Layer 3: 検索メモリ(能動的想起)

  • ユーザーメッセージをEmbedding化してベクトル検索
  • Top-Kの関連記憶をシステムプロンプトに注入
  • トークン予算を追跡しながら注入量を調整

設定は config.example.jsonmemory セクションで管理する。

{
  "memory": {
    "embedding_api": "https://api.openai.com/v1/embeddings",
    "embedding_model": "text-embedding-3-small",
    "similarity_threshold": 0.92,
    "max_session_messages": 40,
    "archive_threshold_kb": 100
  }
}

この三層構造により、短期的な会話の文脈を維持しつつ、過去の重要な情報を効率的に想起できる。特にLayer 3の予算管理機能は、トークンコストを意識した設計として注目に値する。

レイヤ 保持対象 保存形式 呼び出しタイミング
Session 直近40メッセージ JSONファイル 毎ターン
Compressed LLM抽出事実 LanceDBベクトル 圧縮ジョブ後
Retrieval Top-K関連記憶 システムプロンプト注入 ユーザー入力時

圧縮時にコサイン類似度0.92で重複を切り落とすため、同じ趣旨の事実がベクトルDBに蓄積して肥大化する問題を抑えられる。

予算管理の実装
Layer 3の注入はトークン予算を監視しながら行われる。長い会話履歴があっても、Top-Kの関連度スコアで優先順位を付けて必要分だけ注入するため、コンテキストウィンドウの浪費を避けられる設計だ。
この章のポイント
三層メモリはセッション(JSON)→ 圧縮(LanceDB)→ 検索(注入)の順で機能する。閾値0.92の類似度で重複を除き、トークン予算を追跡しながらシステムプロンプトへ注入する。長期運用でのメモリ肥大化とコンテキスト浪費を同時に防ぐ。

36ツールの全容:カテゴリ別整理と動的フィルタリング

724 Officeが搭載する36のビルトインツールは7つのカテゴリに分類される。

カテゴリ モジュール ツール名 用途
Core tools_admin exec, message コマンド実行、メッセージ送信
Files tools_admin read_file, write_file, edit_file, list_files ファイル操作全般
Scheduling tools_messaging schedule, list_schedules, remove_schedule Cronタスク管理
Media Send tools_messaging send_image, send_file, send_video, send_link, send_location, send_namecard メディア送信
Video tools_video trim_video, add_bgm, generate_video 動画の自動編集・AI生成
Search tools_search web_search, search_nearby, search_memory, recall Web検索・記憶検索
Visualization tools_page render_page EChartsグラフ(折れ線/棒/円/レーダー/表/レポート)
AI Mirror tools_mirror soul_report, future_self 行動プロファイル分析・未来の自分との対話
Diagnostics tools_admin self_check, diagnose, task_history, code_audit, asr_check, daily_digest 自己診断・監査
Memory tools_admin compact_memory, compact_guides メモリ圧縮・最適化
Plugins tools_admin create_tool, list_custom_tools, remove_tool ランタイムツール生成
MCP tools_admin reload_mcp MCPサーバー再読み込み

特筆すべきはv2.0で追加された動的ツールフィルタリング機能だ。5つのコンテキストプロファイル(voice / scheduler / group / diagnostic / default)を状況に応じて切り替え、不要なツール定義をLLMに渡さないことでトークン消費を削減する。さらにサーキットブレーカーが実装されており、1セッション内で3回連続失敗したツールは自動的に無効化される。

ツール登録は @tool デコレータで完結する。以下は実装例のイメージだ。

from tools_base import tool

@tool(
    name="send_reminder",
    description="ユーザーに予定のリマインダーを送る",
    profile=["scheduler", "default"]
)
def send_reminder(user_id: str, message: str, at: str) -> dict:
    """指定時刻にリマインドメッセージを送信する"""
    # messaging API 呼び出し
    return {"status": "ok", "scheduled_at": at}

デコレータがレジストリへの登録・プロファイル割り当て・JSON Schema生成までを引き受ける。プラグインAPI経由でランタイムに登録したツールも同じ経路に乗る。

36ツールという数字はスペック自慢ではなく、「メッセージング領域で本当に必要になる操作」を積み上げた結果である点に注目したい。

この章のポイント
36ツールは7カテゴリに整理され、`@tool` デコレータで追加できる。5つのコンテキストプロファイルで動的にフィルタし、サーキットブレーカーが連続失敗ツールを無効化。トークン削減と安定性の両立がツール層の基本設計だ。

v2.0の注目新機能:Nudge・AI Mirror・グループチャット

Nudgeシステム(行動矯正)

v2.0で導入されたNudgeシステムは、LLMがツールを持っているのに使わない場面を自動検出し、ヒントを注入する仕組みだ。これは「プロンプトで行動を修正するのではなく、構造的に矯正する」という設計原則の具体的な実装である。

# nudge.py のイメージ実装
def detect_nudge(user_msg: str, tool_history: list) -> str | None:
    if "画像" in user_msg and "send_image" not in recent_tools(tool_history):
        return "画像の送付が求められているようです。send_image を検討してください。"
    if "毎朝" in user_msg and "schedule" not in recent_tools(tool_history):
        return "繰り返し実行が求められているようです。schedule を使って登録できます。"
    return None

Nudgeはシステムプロンプトを書き換えるのではなく、ツール呼び出しループの前段でヒントとして注入されるため、モデルごとに振る舞いが安定しやすい。

AI Mirror

soul_report ツールは会話履歴から行動プロファイルをHTMLレポートとして生成する。future_self は未来の自分との対話モードを提供し、自己認識をエージェントレベルで実現する実験的機能だ。

グループチャット対応

独立コンテナでグループ会話を管理し、@メンション検出で発言をゲーティングする。直近20メッセージのコンテキストバッファと発言者識別機能を備える。

これらの機能はMCPプロトコルとも組み合わせ可能だ。ForgeCodeのようなAIコーディングツールをMCPサーバーとして接続すれば、724 Officeからコード生成タスクを委任するワークフローも構築できる。

新機能 目的 実装手法
Nudge ツール不使用の検出 ヒント注入(プロンプト修正なし)
AI Mirror 行動プロファイル生成 HTMLレポート + 対話モード
グループチャット マルチユーザー会話 @メンション検出 + 独立コンテナ
この章のポイント
NudgeはLLMの癖をプロンプトではなく構造で直す仕組み、AI Mirrorは会話履歴からHTMLレポートを生成するメタ機能、グループチャットは独立コンテナと@メンション検出で運用する。いずれも「プロンプト依存を減らす」方向に一貫している。

類似ツールとの比較:何が違うのか

AIエージェントフレームワークは多数存在するが、724 Officeの立ち位置を整理しよう。

項目 724 Office LangChain Agent CrewAI OpenHands
フレームワーク依存 なし(純粋Python) LangChain必須 CrewAI必須 独自フレームワーク
コード行数 約10,000行 フレームワーク全体で数万行 フレームワーク全体で数千行 大規模
ツール数 36(ビルトイン) プラグイン方式 ロール定義方式 コーディング特化
メモリ 三層(セッション+圧縮+ベクトル) Memoryモジュール 共有メモリ セッション管理
MCP対応 JSON-RPC(stdio/HTTP) コミュニティ実装 未対応 未対応
エッジ実行 Jetson Orin Nano対応 要大量RAM 要大量RAM クラウド前提
ランタイムツール生成 対応 未対応 未対応 コード実行で代替
自己修復 日次診断+自動通知 なし なし なし
マルチテナント Docker自動プロビジョニング 自前実装要 自前実装要 自前実装要
ライセンス MIT MIT MIT MIT

724 Officeの最大の差別化要因は、フレームワーク依存ゼロでありながら本番運用に必要な機能(マルチテナント、自己修復、スケジューリング)を一体提供している点だ。Browser Useのようなブラウザ自動化エージェントがWeb操作に特化しているのと同様に、724 Officeはメッセージングプラットフォームとの統合に強みを持つ。

選び方の指針

flowchart TD A["ユースケースは?"] --> B{"用途"} B -->|"コーディング自動化"| C["OpenHands
/ ForgeCode"] B -->|"RAG・検索"| D["LangChain
/ LlamaIndex"] B -->|"チーム型タスク"| E["CrewAI"] B -->|"メッセージング
業務自動化
24/7稼働"| F["724 Office"] F --> G{"エッジ必要?"} G -->|"Yes"| H["Jetson向け構成"] G -->|"No"| I["Docker Compose"]

「どのエージェントを選ぶか」ではなく「どのレイヤで何を自前にするか」を決めるための比較として使うとよい。

この章のポイント
724 Officeはメッセージング業務自動化・エッジ運用・マルチテナントに強く、LangChain/CrewAI/OpenHandsとは守備範囲が重ならない。選定はユースケースとエッジ要件の2軸で切ると迷いにくい。

MCP連携とプラグイン拡張:自己進化の仕組み

724 OfficeはMCP(Model Context Protocol)をネイティブサポートしている。mcp_client.py(約342行)がJSON-RPCプロトコルを実装し、stdioとHTTPの両方のトランスポートに対応する。

{
  "mcp_servers": [
    {
      "name": "my-tool-server",
      "transport": "stdio",
      "command": "python3",
      "args": ["mcp_server.py"]
    },
    {
      "name": "remote-server",
      "transport": "http",
      "url": "http://localhost:3000/mcp"
    }
  ]
}

MCPサーバーの追加は設定ファイルを編集して reload_mcp ツールを呼ぶだけで、再起動不要のホットリロードが可能だ。さらに create_tool によるランタイムツール生成では、エージェント自身がPython関数を書いて @tool デコレータ付きで保存・読み込みできる。

# create_tool が生成するコードの骨格
from tools_base import tool

@tool(
    name="fetch_weather",
    description="指定都市の天気を返す"
)
def fetch_weather(city: str) -> dict:
    # httpx で外部APIを呼び出す
    ...

生成されたツールは workspace/custom_tools/ に書き出され、再起動なしでレジストリへ読み込まれる。これは単なるプラグインシステムを超えた「自己進化」の仕組みであり、724 Officeの名前の由来(24時間365日=7/24稼働)に直結する設計だ。

拡張方法 適用範囲 再起動 代表用途
標準ツール追加 開発者による実装 必要 共通機能の恒常追加
create_tool ランタイム自動生成 不要 その場で必要になった操作
MCPサーバー接続 外部プロセス連携 不要(reload_mcp 既存ツール資産の活用
この章のポイント
MCPはstdio/HTTP両対応で、`reload_mcp` によりホットリロードできる。`create_tool` はランタイムでPython関数を書き出して即読み込むため、再起動なしで機能が増える「自己進化」を実現する。

運用面の堅牢性:自己修復とモニタリング

本番環境での24/7稼働を支える運用機能も充実している。

  • 日次自己チェックself_check): エラーログ分析、セッションヘルス診断、障害時の自動通知
  • コード監査code_audit): 11項目の自動チェック
  • セッション自動アーカイブarchive.py): 日次でブラックボックス記録を保存
  • コンテナ再構築router.py): 起動時にルーティングテーブルから欠落コンテナを自動再構築
  • 指数バックオフリトライ: メッセージングAPI呼び出しは2/4/8秒間隔で3回リトライ
  • 非アクティブガード: 3日間操作がないユーザーのCronタスクを自動スキップ

実装イメージとして、指数バックオフリトライは以下のような典型構造を取る。

import time, httpx

def send_with_retry(url: str, payload: dict, attempts: int = 3) -> httpx.Response:
    delay = 2
    for i in range(attempts):
        try:
            return httpx.post(url, json=payload, timeout=10)
        except httpx.HTTPError:
            if i == attempts - 1:
                raise
            time.sleep(delay)
            delay *= 2

このレベルの自己修復機能を持つオープンソースAIエージェントは珍しく、ソロ開発者がAI共開発ツールを活用して構築した点でも注目に値する

運用機能 発動条件 効果
self_check 日次Cron 障害兆候の早期発見
code_audit 手動/スケジュール 11項目で設定ドリフトを検出
非アクティブガード 3日無操作 不要なCron実行を停止
コンテナ再構築 起動時 ルーティングテーブル整合

24/7運用で効いてくるのは派手な機能ではなく、失敗時に自動で姿勢を立て直すこうした小さな仕組みの積み重ねだ。

運用観点のチェックポイント
本番投入時は、`self_check` の通知先設定、コンテナ再構築のルーティングテーブル保存パス、非アクティブガードの閾値(3日)の3点を必ず見直すこと。運用負荷がここで大きく変わる。
この章のポイント
日次自己チェック、コード監査、アーカイブ、コンテナ再構築、指数バックオフ、非アクティブガードといった運用機能が標準装備。自己修復を設計原則として徹底することで、ソロ開発でも24/7運用が現実的になっている。

向いているケースと採用判断のポイント

724 Officeは、フレームワークのブラックボックスに依存せず、すべてのコードを自分で理解・制御したいエンジニアに適している。特に以下のようなユースケースで力を発揮する。

  • メッセージングプラットフォーム(WeChat Work等)と連携した業務自動化
  • エッジデバイス(Jetson Orin Nano等)での省メモリAIエージェント運用
  • MCPプロトコルを活用した外部ツール統合
  • 24/7稼働が必要な本番AIアシスタントの構築

MIT Licenseで公開されており、コードの可読性も高いため、独自のAIエージェントシステムを構築する際のリファレンス実装としても価値がある。

向いているケース 向いていないケース
メッセージング連携を中核に据えた業務自動化 大規模RAGに特化したい
エッジで常駐させたい ノーコードで即運用したい
自前でコードを読み切れる体制がある フレームワークの抽象化に乗って開発速度を上げたい
24/7運用と自己修復を両立したい 一時的な実験用途のみ

「フレームワークを使わない」はコスト高に見えて、長期的にはコードオーナーシップとデバッグ容易性で回収できる。724 Officeはその賭けの一つの答えだ。

この章のポイント
724 Officeはメッセージング×エッジ×24/7の組み合わせに強く、コードを読み切る体制がある開発者向け。ノーコードや即席の実験用途にはオーバースペックで、選定時はこの2軸で判断するとよい。

📌 まとめ

724 Officeは、LangChainやCrewAIといった主要フレームワークに依存せず、約10,000行の純粋Pythonで36ツール・三層メモリ・MCP連携・マルチテナント・自己修復を一体化した自己進化型AIエージェントだ。設計原則の中心には「コンテキストは最も希少な資源」という明確な哲学があり、動的ツールフィルタリング、Nudge、圧縮メモリの類似度閾値といった実装に一貫して反映されている。

  • フレームワーク依存ゼロで全コードが可視化されデバッグ容易
  • 三層メモリ(セッション・圧縮・ベクトル)でトークン予算を守りながら文脈を維持
  • 36ツール+MCP+ランタイム生成で拡張性と自己進化を両立
  • Docker自動プロビジョニングと日次自己チェックで24/7運用を現実的に
  • エッジ(Jetson Orin Nano)対応で省メモリ要件にも適合

独自のAIエージェント基盤を自前で設計・運用したい開発者にとって、724 Officeは設計判断の宝庫であり、コードを読むだけでも得るものが多いプロジェクトだ。

参照ソース