最近、オンライン講座の動画に字幕を入れる必要が出てきて、その作業フローを効率化する方法を探していた。字幕生成ツールは世の中に色々あるけど、多言語対応で、かつセットアップが簡単なものってなかなかない。そこで見つけたのが Pyvideotrans だった。
使ってみるまでは、正直「ツール複数組み合わせるより少し楽かな」くらいの期待値だったんだけど、実際に触ってみたら想像よりシンプルだった。git clone して pip install すれば、依存関係がほぼ自動で解決される。その後は、コマンドラインで動画ファイルを指定して実行するだけ。例えば python pyvideotrans.py -i input.mp4 -lang ja,en みたいな感じで、日本語と英語の字幕が同時に生成される。初回は音声認識モデルのダウンロードで少し時間がかかったけど、その後は結構スムーズに動いた。
一番良いなと思ったのは、翻訳までを含めて自動で処理してくれる点だ。従来は「字幕生成ツール → テキスト抽出 → 翻訳API → 字幕埋め込み」というように複数ステップが必要だったけど、ここでは一度のコマンド実行で終わる。特に複数言語対応が必要なコンテンツだと、この省力化は結構大きい。実際に試した感覚だと、手作業での修正が必要な部分も最小限に抑えられる。
若干気になった点としては、ドキュメントがまだ英語がメインで、日本語の情報が限定的なこと。あとは、処理時間が動画の長さと解像度に左右されるので、4K素材とかだと結構待つ必要がある。Windows での環境構築がやや手間というレポートも見かけるので、Linux や macOS の方が無難かもしれない。
動画コンテンツを定期的に作ってる人、特に多言語対応が必要な状況にいる人には、一度試してみる価値は十分ある。字幕作業に時間を取られるなら、このツールで作業を自動化して、その分クリエイティブな部分に時間を使った方が効率良い。