この記事ではAIエージェントに特化して解説します。AIエージェント全般は AIエージェントフレームワーク比較2026年版 をご覧ください。

Hermes Agent:自己改善型AIエージェント完全ガイド

Nous Researchが開発したHermes Agentは、MITライセンスで公開されている自己改善型AIエージェントフレームワーク。エージェント自身が経験から学習し、実行するたびに能力を高める「閉じた学習ループ」を内蔵しており、次世代エージェント設計として注目を集めている。

従来のAIエージェントが毎回ゼロから推論を開始するのに対し、Hermes Agentはタスクを完了するたびにスキルを自動生成し、それを継続的に改善していく。さらに定期的にメモリを永続化し、過去のセッションを横断して知識を検索・要約して活用する。このような自己進化のメカニズムにより、長期利用するほど精度と効率が向上する設計になっている。

本ガイドでは、Hermes Agentの核となる学習ループ機構から、複数のメッセージングプラットフォーム対応、多数の組み込みツール、そして複数のリモート環境での実行方法まで、プロダクション運用に必要なすべての要素を網羅的に解説する。

Hermes Agentの核:自己改善する学習ループの仕組み

Hermes Agentが他のエージェントフレームワークと一線を画す理由は、複数のフィードバック機構が統合された学習ループにある。単なるメモリ管理ではなく、タスク実行そのものを通じてエージェントが賢くなっていく設計になっている。

スキルの自動生成と自己改善

複雑なタスクを完了すると、Hermes Agentは自動的にそのタスクの解法を「スキル」として抽象化・記録する。このスキルはagentskills.ioのオープンスタンダードと互換性があり、他のエージェント実装との相互運用性を保ちながら蓄積される。

重要なのは、スキルがその後の実行で継続的に改善される点。ユーザーからの暗黙的なフィードバック(目的達成の有無、修正指示)をもとに、スキルの手順や条件分岐が自動調整される。したがって同じ類のタスクを何度も繰り返すほど、エージェントの応答精度は向上していく。

セッション横断的な記憶と想起

エージェントが複数のセッションにわたって学習するには、過去の会話を効果的に検索できる仕組みが必須。Hermes AgentはSQLite FTS5(フルテキストサーチ)を搭載し、全会話履歴から関連する過去ターンをキーワードで高速検索する。さらにLLMを用いた要約により、検索結果を圧縮して現在のコンテキストに統合する。

この仕組みにより「3ヶ月前に設定した<プロジェクト構成>を今のタスクに適用したい」といった縦深い参照が可能になる。

Honcho による弁証法的ユーザーモデリング

Honcho統合により、Hermes Agentはユーザーの好み・作業パターン・意思決定基準を段階的に学習していく。これは単なる履歴管理ではなく、対話の中でユーザー像を継続的に更新・洗練していく「弁証法的」プロセス。結果として、利用を重ねるほどエージェントの提案や判断がユーザーの意図に合致しやすくなる。

以下のフローチャートは、このサイクルがどう回転するかを示している:

graph LR A["複雑なタスク
実行"] --> B["タスク完了時に
スキル自動生成"] B --> C["生成スキルを
メモリに記録
agentskills.io
互換性"] C --> D["次回同類タスクで
スキルを呼び出し
+改善フィードバック"] D --> E["ユーザー履歴を
Honcho でモデリング"] E --> F["クロスセッション検索
FTS5 + LLM要約"] F --> G["エージェント精度
段階的向上"] G --> A
学習ループの実践的効果
初回利用時はエージェントが試行錯誤するため応答に時間がかかる場合がある。しかし同じプロジェクト・ユースケースを繰り返すことで、スキルが最適化され、2回目以降は劇的に速度と精度が向上する。定期的なメモリ永続化(nudge)がこの効果を加速させる。

インストールと初期セットアップ:最速2分で会話開始

Hermes Agentはワンラインインストールを実現している。Pythonランタイム、依存パッケージ、CLIツールのセットアップが自動化されており、複雑な設定ファイル編集は不要。

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

このコマンド一つで以下が自動実行される:

  • Pythonバージョン確認(3.11以上推奨)
  • UV(高速パッケージマネージャー)のインストール
  • Hermesコマンドラインツールのセットアップ
  • シェル設定ファイル(.bashrc / .zshrc)への PATH追加
  • 初期設定ディレクトリ(~/.hermes)の作成

インストール後、シェルをリロードして初回実行:

source ~/.bashrc    # bashの場合
# または
source ~/.zshrc     # zshの場合

hermes              # インタラクティブCLI起動

対応環境と制限事項

Hermes Agentは以下のプラットフォームで公式サポートされている:

環境 対応状況 備考
Linux (Ubuntu/Debian) ✅ 完全対応 最も安定した動作環境
macOS (Intel/Apple Silicon) ✅ 完全対応 最新モデルで検証済み
WSL2(Windows Subsystem for Linux) ✅ 完全対応 ネイティブWindowsは未対応のため必須
Android (Termux) ✅ テスト済み 制限された機能(音声系パッケージ除外)
ネイティブWindows ❌ 未対応 WSL2インストール後のご利用をお勧め
ネイティブWindowsユーザーへの注意
Hermesはネイティブ Windows上での直接実行に未対応。代わりにWSL2(Windows Subsystem for Linux)をインストール後、上記ワンラインコマンドを実行してください。セットアップは5分程度で完了します。

開発者向けセットアップ

フレームワークに貢献したい、カスタムツールを開発したい場合は、以下の手順でリポジトリから直接インストール:

git clone https://github.com/NousResearch/hermes-agent.git
cd hermes-agent
curl -LsSf https://astral.sh/uv/install.sh | sh
uv venv venv --python 3.11
source venv/bin/activate
uv pip install -e ".[all,dev]"
python -m pytest tests/ -q

このアプローチにより、最新開発版を試したり、ローカルでテストスイートを実行したりできる。

複数のメッセージングプラットフォーム対応:いつでも、どこからでも会話を続ける

Hermes Agentの大きな特徴は、単一のゲートウェイプロセスで複数のメッセージングプラットフォームを統一的に管理できる点。ノートパソコンの前にいるときはCLIで作業し、外出時はスマートフォンからTelegramやSignalで指示を続ける——このような柔軟なワークスタイルが実現できる。

プラットフォーム一覧と特性

プラットフォーム 主要機能 推奨ユースケース
CLI(ターミナル) マルチライン編集、スラッシュコマンド補完、ストリーミング出力、リアルタイムツール実行表示 開発・深い思考を必要とするタスク
Telegram ボイスメモ自動文字起こし、ファイル送受信、グループチャット対応 モバイルから素早くメッセージ送信、音声メモ活用
Discord サーバー・ダイレクトメッセージ両対応、リッチ埋め込み表示 チーム共有、複数ワークスペース管理
Slack ワークスペース統合、スレッド対応、コマンドパレット連携 企業チーム環境、既存Slack ワークフローとの統合
WhatsApp モバイルファースト、広範な地域対応 非技術者向けのシンプルなUI
Signal エンド・ツー・エンド暗号化、プライバシー重視 機密情報の取り扱い、セキュリティ重視の環境

ゲートウェイセットアップと動作原理

複数プラットフォームを同時に運用する場合、ゲートウェイプロセスを起動:

hermes gateway setup
# このコマンドで対応プラットフォームの認証情報入力を促される
# 例: Telegram Bot Token、Discord Webhook URL など

hermes gateway start
# バックグラウンドでゲートウェイ起動
# 複数プラットフォームからのメッセージを受け取る単一プロセスとして動作

ゲートウェイ運用時のメリット:

  • 会話の統一:どのプラットフォームから送信した会話も同じコンテキスト履歴を共有。Telegramで始めた会話をSlackから継続可能
  • リソース効率:エージェントプロセスは1個のままで、複数プラットフォームのメッセージをハンドル
  • 自動スケーリング:プラットフォーム数を増やしても追加メモリ消費はほぼゼロ
マルチプラットフォーム運用のベストプラクティス
Telegramでは音声メモ送信、Slackではスレッド化による複数案件の並列管理、CLIではコンテキスト圧縮と詳細ログ確認——こうしたプラットフォーム別の使い分けが可能。ゲートウェイはこれらすべてを一つのエージェント状態として管理するため、最適なツール選択の自由度が高い。

LLMプロバイダーの自由な選択:ベンダーロックイン回避

hermes model コマンド一つで、複数のLLMプロバイダーを切り替えられる点は、Hermes Agentのもう一つの大きな利点。コード変更や再起動不要で、プロバイダー間を自由に移行できる。

対応プロバイダーとモデル

プロバイダー 説明 特徴
Nous Portal Nous Research公式プラットフォーム 独自モデル(Nous Hermes系)の最新版、低遅延
OpenRouter 200以上のモデル統一インターフェース 数百のオープンソース・商用モデルを一つのAPIで操作
OpenAI GPT-4o、GPT-4 Turbo など 最新の汎用性能、安定性が高い
Anthropic Claude 3系列 長コンテキスト対応、特に長文理解で優秀
z.ai / GLM GLMシリーズ アジア言語対応、低コスト
Kimi / Moonshot Moonshot AI プラットフォーム ローカルメモリ統合、日本語対応
MiniMax MiniMax AI 高速推論、コスト効率
カスタムエンドポイント 自前のLLMサーバー セルフホスト型、完全プライベート

プロバイダー変更の実際:

hermes model
# 対話的プロンプトで利用可能なプロバイダーとモデル一覧が表示される
# 例:
# 1. Nous Portal - Nous-Hermes-2-Mixtral-8x7B
# 2. OpenRouter - meta-llama/llama-2-70b-chat
# 3. OpenAI - gpt-4o
# 選択番号を入力、または「OpenRouter:meta-llama/hermes-2-pro」の形式で直接指定

モデル切り替えはリアルタイムで反映され、次のターンから新しいモデルが使用される。複数モデルの比較実験も容易。

組み込みツールと拡張の仕組み

Hermes Agentには、ファイルシステム操作から外部API呼び出し、プログラム実行まで、実用的なツールが多数プリインストールされている。不要なツールは無効化でき、外部MCPサーバーで機能を拡張できる。

ツール有効化・管理

hermes tools
# 対話的インターフェースで個別ツールのON/OFF切り替え
# デフォルトでは安全なツールセットのみ有効

組み込みツールの代表例

Hermes Agentに含まれる主要ツール群:

  • ファイル・ディレクトリ操作:ファイル作成・読み込み・更新、フォルダ構造検査、バッチリネーム
  • コマンド実行:シェルコマンド実行(ローカル、SSH、Docker経由)、プロセス管理
  • テキスト処理:ファイル全文検索、正規表現置換、マークダウン解析
  • Web操作:URL取得・スクリーンショット、HTML解析
  • データ処理:JSON/CSV/YAML解析、データ変換パイプライン
  • 開発支援:Git操作(commit, push, branch管理)、diff表示、コード品質チェック
  • 計算・分析:統計計算、グラフ生成、データ可視化
  • 通知・連携:メール送信、Slack通知、Webhook呼び出し
  • システム管理:CPU/メモリ監視、ディスク容量確認

MCP(Model Context Protocol)統合による拡張

Hermes AgentはModel Context Protocolに対応し、外部MCPサーバーを接続してツール機能を大幅に拡張できる。例えば、カスタムデータベースへのアクセス、社内専用API、プロプライエタリソフトウェアとの連携など、無限に拡張可能。

MCPサーバーの接続方法は公式ドキュメント「MCP Integration」セクションで詳述されている。

ツール実行の安全性管理
デフォルトではファイル削除やシステムコマンド実行など危険な操作は無効化されている。本番環境で有効化する場合は、コマンド承認機能を有効にし、実行前にユーザーが確認するワークフローを組む必要がある。詳細は「Security」ドキュメントセクションを参照。

自然言語でのスケジュール自動化:定期タスクをコードなしで定義

cron統合機能により、複雑なスケジュール指示を自然言語で記述でき、指定プラットフォームへの自動配信まで一括処理できる。

cron設定の実例

hermes
# 会話開始後

> /cron "毎朝9時に前日のGitHubイシューと PRをまとめてTelegramに送信"
# Hermes Agentが内部的にスケジュール設定に変換・保存

> /cron "毎週月曜午前10時に前週のコミット統計を集計してSlackに投稿"

> /cron "毎月末日に全プロジェクトのストレージ容量をチェックし、管理者にメール通知"

背後では以下のプロセスが自動実行される:

  1. 自然言語解析:指示を「タイミング」「実行内容」「配信先」に分解
  2. スケジュール生成:cron互換の時刻指定に変換(0 9 * * *など)
  3. ジョブ登録:Hermes Agent内の永続スケジューラに登録
  4. 定期実行:指定時刻に自動実行、結果を指定プラットフォームに配信
  5. 失敗通知:実行に失敗した場合、ユーザーに自動通知

日次レポート、定期監査、定型バックアップなど、無人で継続実行されるタスクが増え、人的作業負荷が大幅に削減される。

サブエージェント委譲と並列化:大規模ワークフロー管理

Hermes Agentは、メインエージェントから孤立したサブエージェントプロセスを生成し、複数のワークストリームを並列実行できる。これにより、大規模ワークフロー全体をより小さな独立したタスク単位に分割し、効率化できる。

サブエージェント生成の利点

  • パイプライン圧縮:複数ステップのタスクをサブエージェントに委譲すれば、メインエージェントはその間に別タスクへ移行可能。コンテキスト圧縮コストを軽減
  • 並列化:同一リソースで複数の独立したタスクを同時実行
  • エラー隔離:サブエージェント側で発生したエラーがメインエージェントに波及しない

Pythonスクリプトから RPC経由でサブエージェントのツール呼び出しが可能で、複雑な自動化パイプラインの構築に対応している。

ターミナルバックエンド:どの環境でも実行可能

Hermes Agentは6種類のターミナルバックエンド(実行環境)に対応し、$5のVPSから高性能GPUクラスタまで、幅広いインフラで動作する。

バックエンド比較表

バックエンド 実行環境 コスト 向いているユースケース
Local ローカルマシン 0円(既存ハードウェア) デスクトップ作業、開発・テスト
Docker Dockerコンテナ ~$5-10/月(VPS利用時) 再現性重視、環境隔離が必要な場合
SSH リモートサーバー ~$5-50/月(VPS) 軽量な計算タスク、既存サーバー活用
Daytona サーバーレス永続化 アイドル時ほぼゼロ 断続的なタスク、長期保存が必要
Singularity HPCコンテナ ~$0.1-1/GPU時間 科学計算、大規模並列処理
Modal サーバーレスGPU ~$0.5/GPU時間(実行時のみ課金) GPU推論、高速バースト処理

Daytona:サーバーレス永続化エージェント環境

Daytonaバックエンドの特筆すべき特徴は、セッション間のアイドル時に仮想環境をハイバネーション状態に遷移し、オンデマンドで復帰させる仕組み。例えば:

  • 朝:エージェントが立ち上がり、各種スケジュールタスクを実行
  • 日中:使用がないため、自動的にスリープ状態へ
  • 午後:メッセージ受信でオンデマンド起動、コンテキスト復帰
  • 夜間:再度スリープ

この過程で継続的なサーバー料金がほぼゼロに削減される一方、セッション間で永続的なメモリ・ファイルシステムを保持できる。小規模チームのラボ環境や個人プロジェクトに最適。

Modal:GPUサーバーレス推論

Modal バックエンドを使用すれば、GPU計算が必要な処理(大規模言語モデルの微調整、画像生成など)を、実行時間分だけ課金される形で利用できる。定常的にGPUを保有する必要がなく、バースト需要への対応に最適。

hermes config set terminal.backend modal
hermes config set modal.gpu_type a100  # A100 GPU指定例

CLIとメッセージングプラットフォームの統一コマンドセット

Hermes Agentの大きな設計上の利点は、CLIとメッセージングプラットフォーム間でコマンドをほぼ統一している点。ユーザーはどのプラットフォームを使用していても、同じスラッシュコマンド文法で操作可能。

共通スラッシュコマンド一覧

コマンド 機能 CLI Telegram Discord Slack
/new / /reset 新規会話開始
/model [provider:model] LLMモデル変更
/personality [name] AIキャラクター設定
/retry / /undo 最後のターン取り消し・再実行
/compress コンテキスト圧縮
/usage トークン使用量表示
/insights [--days N] 利用統計表示
/skills 利用可能スキル一覧
/stop 現在の実行中断 Ctrl+C
/cron "..." スケジュール設定
/platforms / /status プラットフォーム状態確認 N/A

例えば、Telegramで「/retry」と送信すれば、前回のエージェント応答を取り消して再実行させられる。CLIでも Ctrl+Cの後に /retry を実行するのと同じ効果が得られる。

複数プラットフォーム運用時のコマンド活用
CLIで複雑なデバッグを行い、実行結果をSlackにまとめて報告。外出時にTelegramで追加指示を送信——このような柔軟な組み合わせが可能なのは、統一されたコマンド体系があるからこそ。各プラットフォーム独自コマンドを学ぶ手間が削減される。

OpenClawからの移行:スムーズな乗り換え

Nous Researchが以前開発していた「OpenClaw」プロジェクトからの移行を容易にするため、Hermes Agentにはワンコマンド移行ツールが用意されている。

移行コマンド

hermes claw migrate
# インタラクティブ移行ウィザード起動
# 既存OpenClaw設定を自動検出し、段階的に移行内容を確認

hermes claw migrate --dry-run
# 実際には変更しない。移行内容を事前にプレビュー

hermes claw migrate --preset user-data
# APIキーなどシークレット情報は移行しない安全な方法

移行される設定・データ

項目 説明 移行先
SOUL.md ペルソナ・AIキャラクター定義 ~/.hermes/personas/
メモリ MEMORY.md、USER.mdの内容 ~/.hermes/memory/
スキル ユーザー作成スキル ~/.hermes/skills/openclaw-imports/
コマンド許可リスト 承認パターン セキュリティ設定に統合
メッセージング設定 プラットフォーム認証、作業ディレクトリ ゲートウェイ設定に統合
APIキー OpenRouter、OpenAI、Anthropic等の認証情報 ~/.hermes/secrets/(暗号化保存)
TTS素材 テキスト読み上げ用音声ファイル ~/.hermes/audio/

初回 hermes setup ウィザード起動時に、~/.openclaw ディレクトリが自動検出されると、移行を提案するダイアログが表示される。既存ユーザーの移行障壁をほぼゼロに抑えている。

他のAIエージェントフレームワークとの比較

エージェントフレームワークには多くの選択肢がある。Hermes Agentの位置づけを理解するため、主要プロジェクトとの機能比較表を示す:

項目 Hermes Agent AutoGPT Claude Code Crew AI Dify
学習ループ 内蔵
(スキル自動生成+改善)
なし メモリのみ なし ワークフロー構築
マルチプラットフォーム 複数統合 CLIのみ CLI+IDE CLIのみ Webビルダー
LLMプロバイダー自由度 複数切り替え可 OpenAI中心 Anthropic固定 複数対応 複数対応
自然言語cron ✅ 対応
ターミナルバックエンド 複数
(サーバーレス含む)
ローカル ローカル ローカル クラウド主体
サブエージェント並列化 ✅ 対応 チェーン実行 限定的 ロール分担 パイプライン構築
MCP統合 ✅ 対応 ✅ 対応
RL学習データ生成 ✅ 対応
特化領域 汎用自動化 汎用(老朽化) Pythonコーディング マルチエージェント ノーコード構築

各プロジェクトの選択基準

  • 汎用の自動化タスク+自己学習を求めるHermes Agentが最適。スキルの自動生成と改善が他にない機能
  • マルチエージェントでの役割分担・ワークフロー構築Crew AIDify。複数のエージェントを協調させるのに優れている
  • コーディングタスク特化OpenHands。コード生成・修正に特化した設計
  • ノーコード運用Dify。ビジュアルワークフロー構築に強い

ベストプラクティスと運用上のTips

Hermes Agentを本番運用する際、実装上・運用上の注意点を列挙する。

メモリとスキルの保守

定期的にメモリを確認・整理する。古い情報や重複は削除し、スキルの命名を統一する。

hermes
# 会話内で
> /compress
# コンテキストの圧縮・最適化を実行
> /insights --days 30
# 過去30日の利用統計を表示、スキル使用頻度を確認

セキュリティ設定

本番環境では、コマンド承認機能を有効化し、危険な操作(ファイル削除、システム再起動など)を実行前に確認する:

hermes config set security.command_approval true
# ファイル削除操作の実行前に確認プロンプトが表示される

ゲートウェイ運用時には、許可ユーザーリストを明示的に指定:

hermes config set gateway.telegram.allowed_users "user_id_1,user_id_2"

コスト管理

複数モデルを並列利用する場合、/usage コマンドで定期的にトークン消費を監視。高額なモデルと廉価モデルを使い分ける設定をする:

hermes config set model.default openrouter:meta-llama/llama-2-70b-chat
# デフォルトは低コストモデル

# 複雑なタスクが必要な場合は /model で切り替え
> /model openai:gpt-4o

Hermes Agentの使い方:実践シナリオ別クイックリファレンス

Hermes Agentの使い方を、よくある実践シナリオ別に整理する。初めて触るユーザーが「何から始めればいいか」を即座に把握できるようにまとめた。

シナリオ1:日常タスクの自動化

# Hermes Agentを起動して日常タスクを自動化する
hermes

# 例: 毎朝の情報収集を自動化
> /cron "毎朝8時にHacker Newsのトップ10記事を要約してTelegramに送信"

# 例: プロジェクトの定期レポート
> /cron "毎週金曜17時にGitリポジトリの週次コミット統計をSlackに投稿"

シナリオ2:開発プロジェクトでの活用

# プロジェクトディレクトリでHermesを起動
cd ~/my-project && hermes

# コードレビューを依頼
> このリポジトリのsrc/配下のPythonファイルを読み、コード品質の問題点を指摘して

# テストの自動生成
> tests/ディレクトリに、src/utils.pyのユニットテストをpytestで生成して

# Git操作の自動化
> 未コミットの変更をレビューし、適切なコミットメッセージを提案して

シナリオ3:リサーチ・情報整理

hermes

# 複数ソースからの情報収集
> このURLの論文を読み、要点を5つのバレットポイントにまとめて
> https://arxiv.org/abs/xxxx.xxxxx

# 比較分析
> React、Vue、Svelteの最新バージョンの特徴を比較表にまとめて

# ドキュメント生成
> README.mdのテンプレートを、このプロジェクトの構成に合わせて生成して

シナリオ4:マルチプラットフォーム連携の使い方

# ゲートウェイを起動して複数プラットフォームから操作
hermes gateway start

# CLIで複雑なタスクを開始
hermes
> 大規模なデータ分析タスクを開始

# 外出時はTelegramから進捗確認
# Telegram: /status で現在の実行状態を確認
# Telegram: 追加の指示をテキストや音声メモで送信

# オフィスに戻ったらSlackで結果を受け取り
Hermes Agent使い方のコツ
初回利用時は簡単なタスク(ファイル操作、テキスト処理)から始め、スキルが蓄積されたら複雑なワークフローに移行するのが効率的。/insights --days 7で直近の利用統計を確認し、どのスキルがよく使われているかを把握すると、さらなる自動化のヒントが得られる。

公式ドキュメント体系と参照方法

Hermes Agentの公式ドキュメントはhermes-agent.nousresearch.com/docsに一元管理されている。以下のセクション構成で、実装からトラブルシューティングまで網羅:

セクション カバー内容
Quickstart インストール→セットアップ→初回会話まで2分で完結
CLI Usage ターミナルインターフェース、キーバインド、パーソナリティ、セッション管理
Configuration 設定ファイル形式、全設定オプション、プロバイダー設定
Messaging Gateway 複数プラットフォーム各連携方法、認証フロー、グループチャット
Security コマンド承認、DM ペアリング、コンテナ隔離、APIキー管理
Tools & Toolsets ツールの解説、ツールセットシステム、カスタムツール開発
Skills System スキル生成・保存メカニズム、agentskills.io統合、スキル作成ガイド
Memory 永続メモリシステム、ユーザープロファイル、メモリ検索
MCP Integration MCPサーバー接続、カスタム拡張機能の実装
Cron Scheduling 自然言語スケジュール設定、プラットフォーム配信
Architecture プロジェクト構造、エージェントループ詳細、キークラス実装

ドキュメント内の検索機能で、特定の機能やコマンドを素早く検索できる。

参照ソース