📚
ドキュメント/ナレッジ
コード/データ/PDF/Webから知識・図表・ドキュメントを生成・抽出・構造化するOSS。ナレッジグラフ・RAG用知識ベース構築・コードベース図解まで
27
記事
ドキュメント/ナレッジ系OSSとは
コードや情報を「読みやすい知識」に変換するOSSのカテゴリです。AIは数秒でコードや文章を生成しますが、人間がそれを理解・検索・再利用できる形に整えるのは別の仕事です。このトピックでは、コードベースをアーキテクチャ図にする・PDFやWebを構造化データにする・複数ソースを横断検索できる知識ベースにまとめる、といったOSSをまとめています。
まず全体像と選び方を押さえたい方は、ピラー記事のドキュメント/ナレッジ系OSSの選び方から読み始めてください。
このトピックの3系統
| 系統 | 何をするか | 代表OSS |
|---|---|---|
| コード→図解・アーキ系 | コードベースを解析して構成図・知識グラフに | oh-my-mermaid / Graphify / CodeGraph |
| ナレッジグラフ・知識ベース系 | 文書・会話を検索可能な知識に統合 | SurfSense / cognee / Atomic |
| 抽出・構造化系 | PDF/Web/音声から構造データを取り出す | Hyper-Extract / MinerU / LangExtract |
読み方の目安
コードの全体像を図で残したい → コード→図解系(oh-my-mermaid・DeepWiki-Open・fireworks-tech-graph)
社内文書をAIで検索したい → ナレッジベース系(SurfSense・Atomic・notebooklm-py)
PDFや非構造データを処理したい → 抽出・構造化系(Hyper-Extract・MinerU・officeParser・liteparse)
📄 関連記事(8件)
🧜
🕸️
🕸
🕸️
🏄
🕸️
📚
🧠
oh-my-mermaid解説|コードベースをAIでアーキテクチャ図化するClaude Codeスキル
Graphify入門:コード・ドキュメント・画像をナレッジグラフ化し、AIの検索トークンを71.5倍削減するOSS
CodeGraph完全解説|Claude Codeのツールコール71%削減・コスト35%節約するローカル知識グラフOSS
Understand Anything入門:コードベースをナレッジグラフ化するClaude Codeプラグイン
SurfSenseとは|データ無制限・自己ホスト可能なNotebookLM代替OSSを一次ソース解説
Hyper-Extract 入門|非構造テキストを8種の知識構造に変えるLLM抽出OSS
DeepWiki-Open完全ガイド — GitHubリポジトリからAI Wikiを自動生成するOSSの使い方
cognee|ナレッジグラフ型AIメモリの仕組みとClaude APIローカル連携・MCP設定手順
🏷️ 「docs-knowledge」タグの記事
🧠
⚛️
🎆
📄
📘
🕸️
🧬
Claude Memory Compilerとは|会話を知識ベースに自動コンパイルするOSS
Atomic 入門|markdownノートを意味でつなぐ自己ホスト型ナレッジベースOSS
fireworks-tech-graphとは|自然言語から8スタイルの技術ダイアグラムを生成するOSS
liteparse|LlamaIndex製RustドキュメントパーサがRAG前処理の速度ボトルネックを解く
Google Code Wiki — GeminiでGitHubリポジトリのドキュメントとアーキ図を自動生成
graphify完全ガイド|Claude Code トークン削減を71.5倍にする知識グラフスキル
Google LangExtract完全ガイド:LLMで非構造テキストから構造化抽出、ソース位置も追跡