InvokeAIはどんなツールですか？

Stable Diffusionなどの画像生成モデルをWebUIで操作できるツール。ローカルで動作するため、外部APIに依存せずに画像を生成できます

セットアップに何が必要ですか？

基本的にGitから取得してセットアップスクリプトを実行するだけ。GPUがあると処理速度が大幅に向上しますが、CPUのみでも動作します

ControlNetやLoRAは使えますか？

WebUIから直接操作できます。モデルの切り替えもドロップダウンから選ぶだけで、複雑な設定は不要です

生成した画像の保存方法は？

WebUIで確認後、そのまま画面から保存できます。出力フォルダも自動で整理されます

InvokeAIのセットアップはどのようなプロセスですか？

記事ではセットアップの具体的な環境を明記していませんが、GitHubからクローンしてセットアップスクリプトを実行するだけで起動するとされています。

InvokeAIで画像生成の手間が大幅に減った話

きっかけ

仕事で画像資産が必要になることが増えてきた。外部のAPIを使うと費用がかさむし、毎回プロンプト作って、戻ってくるのを待つのが流れとしてもダルい。ローカルで動く画像生成ツールを探してたらInvokeAIを見つけた。

使ってみた

GitHubからクローンして、セットアップスクリプトを走らせたら割とあっさり動いた。python scripts/invoke.py でWebUIが起動して、ブラウザで http://localhost:9090 にアクセスするだけ。Stable Diffusionのモデルがデフォルトで入ってるし、HuggingFaceから他のモデルも簡単に追加できる。Promptを書いて生成ボタンを押したら、数秒で画像が出力される感じ。最初は「あ、これシンプルだ」という印象。

ここが良い

UIがマジで使いやすい。Promptの微調整もスライダーで数値を変えたり、Negative Promptを足したり、Samplerやステップ数を変更したり、全部画面から操作できる。ControlNetやLoRAといった高度な機能も同じUIで扱えるから、技術的な負担がない。さらに生成した画像はそのままWebUIで確認・保存できるし、出力フォルダも自動で整理される。複数モデルを切り替えて比較したいときも、ドロップダウンから選ぶだけ。

気になった点

GPUのメモリが結構必要で、RTX 3060程度だと12GB必要。CPUのみでも動くけど時間がかかる。あとドキュメントが充実してるとは言いがたいから、詰まったときはコミュニティやディスカッションを見に行く必要がある。

まとめ

画像生成を本格的に試してみたい、とか社内で実験したいと思ってるなら、InvokeAIは本当にいいスタート地点だと思う。セットアップも簡単だし、UIも直感的。ローカルで動くから安心だし、コストもかからない。自分も今後もこれでいろいろ試していくつもり。