概要
My Translatorは、リアルタイム音声翻訳機能を備えたデスクトップアプリケーション。Tauriで構築され、システムオーディオやマイクからの音声をキャプチャし、即座に翻訳結果をオーバーレイ表示する。シンプルなインターフェースで、中間サーバーを介さない直接的な翻訳処理を実現。
主な機能
- リアルタイム音声翻訳:システムオーディオまたはマイク入力を16kHz PCMでキャプチャし、Soniox APIにより音声認識と翻訳を同時実行
- デュアルパネルビュー:シングルモード(翻訳テキストのみ表示)とデュアルモード(原文と翻訳を並列表示)の切り替え可能
- 多言語対応:70言語以上の音声認識、任意の言語への翻訳に対応。一方向翻訳および双方向翻訳に対応
- TTS機能:3種類の音声合成プロバイダ(Edge・Google・ElevenLabs)から選択可能
- スマートスクロール:翻訳内容の視認性を最適化するスクロール機能
- フォントサイズ調整:ユーザーの視認環境に合わせた表示カスタマイズ
- 自動更新機能:アプリケーション設定から更新確認・インストールを実行可能
技術スタック
- Tauri:クロスプラットフォームデスクトップアプリケーションフレームワーク
- Soniox API:音声認識と翻訳バックエンド(STT + Translation統合)
- macOS対応:Apple Silicon・Intelアーキテクチャ両対応、署名・公証済み
- Windows対応:Windows 10/11対応
- ライセンス:MIT
レイテンシとコスト
- 遅延:約2~3秒
- 費用:Soniox API利用時の目安として約$0.12/時間
導入方法
プラットフォーム別インストールガイドを参照して環境構築を行う。
macOS向け(英語版・ベトナム語版)およびWindows向け(英語版・ベトナム語版)のインストールガイドが用意されている。
特徴
My Translatorは、オーディオベースの翻訳プロセスに特化したデスクトップアプリケーション。Soniox APIの単一バックエンドにより、複雑な設定なしに安定した音声翻訳を実現。中間サーバーを経由しない構成により、プライバシーとレスポンス性能を両立。
macOS・Windows両プラットフォームでネイティブに動作し、自動更新機能により常に最新版を利用可能。TTS機能により、翻訳結果を音声で確認することもできる。
こんな場面で活躍
- リアルタイム会議の同時翻訳:多言語会議や国際通話時に、システムオーディオを自動的にキャプチャして翻訳を表示
- コンテンツ視聴時の補助翻訳:ポッドキャスト・動画・ウェビナー等の音声をリアルタイムで翻訳
- 言語学習:ネイティブ音声を聞きながら翻訳結果を確認し、リスニング能力向上に活用
- 多言語環境でのコミュニケーション:言語の壁を低減し、チーム内のコラボレーション円滑化