きっかけ
仕事で画像資産が必要になることが増えてきた。外部のAPIを使うと費用がかさむし、毎回プロンプト作って、戻ってくるのを待つのが流れとしてもダルい。ローカルで動く画像生成ツールを探してたらInvokeAIを見つけた。
使ってみた
GitHubからクローンして、セットアップスクリプトを走らせたら割とあっさり動いた。python scripts/invoke.py でWebUIが起動して、ブラウザで http://localhost:9090 にアクセスするだけ。Stable Diffusionのモデルがデフォルトで入ってるし、HuggingFaceから他のモデルも簡単に追加できる。Promptを書いて生成ボタンを押したら、数秒で画像が出力される感じ。最初は「あ、これシンプルだ」という印象。
ここが良い
UIがマジで使いやすい。Promptの微調整もスライダーで数値を変えたり、Negative Promptを足したり、Samplerやステップ数を変更したり、全部画面から操作できる。ControlNetやLoRAといった高度な機能も同じUIで扱えるから、技術的な負担がない。さらに生成した画像はそのままWebUIで確認・保存できるし、出力フォルダも自動で整理される。複数モデルを切り替えて比較したいときも、ドロップダウンから選ぶだけ。
気になった点
GPUのメモリが結構必要で、RTX 3060程度だと12GB必要。CPUのみでも動くけど時間がかかる。あとドキュメントが充実してるとは言いがたいから、詰まったときはコミュニティやディスカッションを見に行く必要がある。
まとめ
画像生成を本格的に試してみたい、とか社内で実験したいと思ってるなら、InvokeAIは本当にいいスタート地点だと思う。セットアップも簡単だし、UIも直感的。ローカルで動くから安心だし、コストもかからない。自分も今後もこれでいろいろ試していくつもり。