概要
Translumoは、画面に表示されるテキストをOCRで認識し、AI翻訳エンジンを用いてリアルタイムに翻訳するオープンソースツール。ゲーム、動画、ウェブページなど、任意のスクリーン上のテキストを対象とし、日本語を含む複数言語への翻訳に対応している。従来、ゲーム内の字幕や外国語テキストは、字幕ファイル編集や手動翻訳に頼る必要があった。Translumoはこのプロセスを自動化し、ユーザーは画面を見つめるだけで内容を理解できる状態を実現する。
主な機能
- OCR文字認識:Windows OCR(推奨)、Tesseract 5.2(レガシー)、EasyOCR(レガシー)に対応。複数のOCRエンジンを組み合わせることで、認識精度を向上させる仕組みを搭載
- マルチ翻訳API対応:DeepL(推奨)、Google Translate、Yandex Translate、Naver Papagoに対応。用途やコストに応じて柔軟に選択可能
- UI/オーバーレイ表示:翻訳結果をウィンドウに表示するか、直接画面にオーバーレイ可能。ゲーム画面を遮らないカスタマイズ設定
- リアルタイム翻訳:画面上のテキストを継続的に処理し、翻訳結果を表示
クイックスタート
インストール
Translumoの最新版は以下のリンクからダウンロード可能。
ダウンロード後、アーカイブを解凍しTranslumo.exeを実行。
実行方法
ツールの設定と実行方法については、公式リポジトリのドキュメントを参照。各翻訳プロバイダのAPI キーを事前に準備し、必要な設定を施したうえで起動。
実践的な使い方
ケース1:PCゲームの多言語プレイ
英語や中国語のインディゲームをプレイする際、字幕ファイルを探す手間は不要。Translumoを起動し、OCRエンジンを選択、翻訳プロバイダをDeepLやGoogle Translateに設定。ゲーム画面左上にオーバーレイウィンドウで翻訳結果が表示される。
ケース2:YouTube動画の字幕翻訳
YouTubeの自動字幕が存在しない言語の動画を視聴する場合、Translumoで画面のテキスト認識→翻訳を実行。ブラウザをリサイズし、字幕エリアのみを対象にすれば、不要な広告やメタデータは翻訳対象外に。
ケース3:コスト最適化
翻訳APIのコスト削減やプライバシー保護を重視する場合、複数の翻訳プロバイダを使い分け。無料枠が充実したサービスを優先し、ニーズに応じて切り替え可能。
まとめ
Translumoは、スクリーン上の文字認識と多言語翻訳を組み合わせた、実用的なOSSツール。対象ユーザーは、以下のいずれかに該当する層:
- ゲーマー:未翻訳ゲームや多言語ゲームをプレイしながら、リアルタイムで内容を理解したい
- 動画視聴者:YouTube、Twitch、NicoNicoなど、字幕の無い海外コンテンツを快適に楽しみたい
- 開発者・翻訳者:OCR+翻訳パイプラインをカスタマイズし、独自のツール構築を検討している
推奨シーンは、字幕ファイルが存在しないコンテンツの視聴・プレイ、複数言語の混在した画面の処理、または翻訳コスト最適化が重要な運用環境。
注意点・制限事項として、以下を理解したうえで導入:
- OCR精度:画像品質が低い場合(小さい文字、背景ノイズ、複雑なレイアウト)は認識精度が大幅に低下。前処理(画像拡大、コントラスト調整)が必要な場合も
- 翻訳API コスト:有料APIを利用する場合、大量のテキスト翻訳で月単位の利用料が増加。複数プロバイダの比較やキャッシング機能の活用で削減可能
- 言語サポート:OCRエンジンと翻訳APIの両者が対応言語を満たす必要。各ツールの仕様を事前確認
- リアルタイム性:処理間隔が短すぎるとCPU負荷が増加し、ゲーム性能低下の原因に。用途に応じて適切な間隔設定が必要
- 法律・利用規約:ゲームや動画の字幕・テキストをスクリーンショットして翻訳する行為は、各コンテンツの利用規約に抵触する可能性。商用利用や大規模配信は事前に確認
Apache 2.0ライセンスのため、商用利用も可能。OSSコミュニティでの貢献も活発で、定期的なアップデートが期待できる。