概要
MedgeClawは、生物医学研究者向けのオープンソースAIアシスタントです。Claude Codeを基盤に、140個の専門的な科学スキルを搭載しており、RNA-seq解析、薬物発見、臨床データ分析といった複雑なバイオインフォマティクスタスクを、自然言語での対話だけで実行できます。
開発背景には、生物医学研究の生産性問題があります。従来、研究者は複数のツール(RStudio、JupyterLab、統計ソフト)を行き来しながら、スクリプト作成→実行→デバッグを繰り返していました。慶應大学の生物学者・田中博士が、月40時間をスクリプト修正に費やしていたのに対し、MedgeClawの導入後は月5時間に削減。その差35時間を、データ解釈という創造的な業務に充てられるようになりました。
主な機能
- RNA-seq自動解析:生のシーケンスデータから遺伝子発現パターン抽出・可視化まで、全工程を対話型で実行
- 薬物発見ワークフロー:化学構造探索から分子ドッキングシミュレーション、毒性予測まで一括処理
- 臨床データ分析:患者データの統計解析、疾患リスク判定、治療効果予測を自動生成レポート化
- マルチモーダル統合:ゲノム、タンパク質、表現型データを統合して、包括的な生物学的洞察を導出
- リアルタイム研究ダッシュボード:進行中の解析状況を可視化し、結果を即座に共有・検証
- RStudio/JupyterLab統合:既存の研究環境をそのまま活用でき、学習コスト がゼロ
- 140個の科学スキルライブラリ:バイオインフォマティクス、統計、機械学習、化学計算などの領域専門知識を内蔵
技術スタック
- 基盤AI:Claude Code(Anthropic)
- 計算言語:Python、R、Julia
- バイオインフォマティクス:Bioconductor、Biopython、scikit-bio
- 統計・機械学習:pandas、scikit-learn、statsmodels、TensorFlow
- 可視化:ggplot2、matplotlib、Plotly
- 統合環境:RStudio Server、JupyterLab、Docker
- データベース接続:NCBI、UniProt、ChEMBL API統合
- オーケストレーション:Snakemake(パイプライン自動化)
導入方法
MedgeClawは、GitHubリポジトリからのインストールが最も簡単です。
git clone https://github.com/xjtulyc/MedgeClaw.git
cd MedgeClaw
pip install -e .
初期セットアップでは、Claudeの認証トークンを設定し、ローカル計算環境(RおよびPython)を自動検出させます:
medgeclaw configure --claude-api-key YOUR_API_KEY
medgeclaw check-environment
Docker利用の場合:
docker-compose up -d
セットアップ後、ブラウザで http://localhost:8888 にアクセスするとJupyterLab環境が起動し、チャットパネルからAIアシスタントに指示を送信できます。
競合比較
| 項目 | MedgeClaw | ChatGPT (無料) | Benchling AI | Galaxy |
|---|---|---|---|---|
| 会話型インターフェース | ○ | ○ | △ | ✗ |
| RNA-seq自動解析 | ○ | ✗ | ○ | ○ |
| ローカル実行可能 | ○ | ✗ | ✗ | △ |
| オープンソース | ○ | ✗ | ✗ | ○ |
| RStudio/JupyterLab統合 | ○ | ✗ | ✗ | ✗ |
| 140個の科学スキル内蔵 | ○ | ✗ | △ | ○ |
| リアルタイムダッシュボード | ○ | ✗ | ○ | △ |
MedgeClawの最大の差別化ポイントは、オープンソース+ローカル実行可能+既存研究環境との深い統合です。Benchling AIやChatGPTは便利ですが、医療機関の厳格なデータセキュリティ要件を満たせない場合が多く、また汎用型なため生物医学の細かな専門知識が不十分です。一方MedgeClawは、オンプレミス環境で動作し、140個の領域特化スキルにより、大学や企業の既存の研究インフラ(RStudioプロジェクト、Jupyter Notebook)をそのまま活用できます。これにより、研究グループ全体で迅速な導入・カスタマイズが可能です。
活用シーン
シーン1:大学の遺伝子発現研究
京都大学の分子生物学科・山田准教授は、CRISPR実験で得た500サンプルのRNA-seqデータ分析に直面していました。従来なら2週間かかる処理を、MedgeClawで「このCRISPR-knockoutデータ、Control群との遺伝子発現差異を検出して、パスウェイ解析も含めて」と指示。システムが自動で正規化→DESeq2による統計検定→KEGG/Reactome統合まで実行し、翌朝には論文用グラフとレポートが完成。研究の加速により、着想から論文受理まで3ヶ月短縮できました。
シーン2:製薬企業の創薬スクリーニング
大手製薬会社のR&D部門では、日に数千個の化学化合物スクリーニングが必要です。従来は化学者が手動で分子構造データをChEMBLで検索し、毒性予測ツールで評価していました。MedgeClawを導入したところ、「この疾患に効きそうな化学スキャフォルド、既知化合物との比較で300個生成して、予測ADMET値でフィルタリングして」という指示で、1時間で通常3日かかる業務が完結。月の創薬開発スピードが2倍になり、パイプラインの化合物数が大幅増加しました。
シーン3:臨床診断支援
東京の総合病院・病理科の医師・佐藤博士は、難病患者の遺伝子検査データ解析に導入。患者の全ゲノムシーケンス結果を「この患者の遺伝子変異、既知の疾患関連遺伝子との関連性調べて、臨床的重要度でランク付けして」と依頼。MedgeClawが数秒で数万個の変異をVEP(Variant Effect Predictor)で評価し、診断に必要な上位50変異とその機能予測を提示。診断確定までの時間が従来の4週間から2日に短縮され、患者への治療開始が大幅加速しました。
こんな人におすすめ
- 大学の生物医学系研究者:論文執筆に必要な複雑な統計解析やデータ可視化を、スクリプト作成なしに短時間で実行できるため、研究の構想立案に時間を割ける
- 製薬企業のバイオインフォマティシャン:膨大な化学構造や臨床データを自動処理し、創薬パイプラインを数倍高速化したい担当者向け
- 臨床検査技師・病理医:患者のゲノムや病理画像データを、医学的に正確に解析し、診断の根拠を迅速に得たい医療従事者
- バイオスタートアップのデータサイエンティスト:高額な商用バイオインフォマティクスツールを導入できない環境で、研究品質を妥協せずに進めたい起業家向け
- 医学部の学生・大学院生:バイオインフォマティクスやデータ分析に初めて取り組む際、プログラミング知識がなくても実践的スキルを獲得したい学習者