きっかけ
会社でエージェント開発をする際に、Claude と ChatGPT を両方試すプロジェクトに携わることになった。当初は各プロバイダーの SDK を個別に使い分けてたんだけど、プロンプトを調整する度に実装を分岐させたり、パラメータの定義をコピペしたりと、やたら手間がかかるようになった。「どうにか統一できないかな」と探してたら Clawhub を見つけた。
使ってみた
セットアップは本当にシンプルで、リポジトリをクローンして pip install -e . したら即座に使える状態になった。さっそく tutorial を見ながら簡単なエージェントを組んでみたんだけど、プロバイダーの違いを意識せずにコード書けるのが印象的だった。例えば、Claude 用のコードをちょっと変数名を変えるだけで GPT で動かせるレベルで、ストレスが本当に少ない。config ファイルで LLM の切り替えができるから、同じプロンプトで複数モデルの出力を比較するのも秒単位で完了した。
ここが良い
何より良かったのは、プロンプト開発に集中できるようになったこと。従来は「この API の仕様は?」「このパラメータはどう渡す?」みたいな細かい違いで気が散ってたけど、Clawhub を使ったら実装の細部を気にせず、プロンプトエンジニアリングそのものに時間が割けるようになった。ほかにも、複数プロバイダーを並行テストするときに統一されたログ出力フォーマットが返ってくるから、A/B テストも比較も非常にやりやすい。正直、今までの開発時間の 20 ~ 30% は「どのプロバイダーの何をどう使うか」という選定作業に費やされてたけど、今はほぼそれが消えた。
気になった点
ドキュメントがまだ情報量としては少なめで、細かいカスタマイズの方法は GitHub の Issue や Discussion を漁る必要がある。また、新しい LLM プロバイダーに対応させるときは自分で実装を足す必要があるので、そこだけは初学者には難しいかもしれない。
まとめ
複数の LLM を組み合わせてエージェント開発してる人、特にプロンプトチューニングに時間をかけたい人にはかなり良いツールだと思う。自分は今後のプロジェクトでもこれを使い続ける予定。セットアップの手軽さと開発効率の向上を考えると、同じ悩みを持ってる人はぜひ試してみてほしい。