このブログでは、記事本文の執筆や公開まではかなり自動化できていたのに、画像だけは最後に別の画面を開いて手で作ることが多かった。そこが地味に面倒だった。
今回追加したのは、記事を書く流れの中からそのまま画像も作れる仕組みだ。Windows 側で動かす画像生成ソフト ComfyUI を、WSL からコマンドで呼び出し、記事のアイキャッチ画像や本文中の補助画像を、なるべく手を介さずに作れるようにした。その構成と、実際に使った指示文の例を残しておく。
構成
使っている構成はこうだ。
- Windows 11 側で Stability Matrix + ComfyUI
- GPU は GeForce RTX 4060 Ti
- 普段の作業環境は WSL2 上の Ubuntu
- ブログ本体は Hugo で管理
ここでいう WSL は、Windows 上で Linux のコマンドを使うための仕組みだ。普段のブログ更新やスクリプト実行はこの WSL 側でやっている。一方、画像生成のように GPU を強く使う処理は Windows 側に置いた。ComfyUI は、そうした画像生成を組み立てて動かせる定番ツールのひとつである。その2つをつなぎ、記事の作業フローの中からそのまま画像生成を呼べるようにした。
何を自動化したか
やっていることを大まかに分けると3段階ある。
- 記事本文から、画像生成に必要な要点メモと指示文のたたき台を作る
- 画像生成ソフトにその指示文を渡して画像を生成する
- 生成画像を、アイキャッチ用・本文用として決まったサイズに整えて保存する
実際に使うコマンドはこんな形。
| |
細かい接続先は毎回手で指定しなくてもよいようにしてある。Windows と WSL をまたぐと、どこへ接続すれば画像生成ソフトに届くかが地味に面倒なので、そのあたりはスクリプト側で吸収した。
生成例1: 記事の顔になる画像
この記事の先頭に出ている画像も、この仕組みで作った。
| |

狙いは「いかにも AI 画像」ではなく、ブログの一覧や SNS のカードに載せても浮かない、雑誌やニュースサイトのカットに近い見た目だ。文字は入れず、あとから横長に切り出しても破綻しにくい構図を優先している。
生成例2: 少し幻想寄りのサンプル
| |

現実寄りの写真風だけでなく、少し幻想的な題材にも振れる。青く発光するクラゲのような被写体は、色の印象が強いので、記事の見本として並べたときにも変化が出しやすい。
生成例3: 自然風景のサンプル
| |

風景も十分にいける。横長の構図や光の層がきれいに出るので、記事中の見本として置きやすい。今回は RTX 4060 Ti で試しており、最初に使った画像生成モデルは epiCRealism XL だ。アニメ寄りの絵柄より、こうした汎用的なサンプル画像に流用しやすかった。
実運用で見えたこと
- Windows で画像生成、WSL で記事管理という分担はかなり相性がいい
- 画像生成の本体は ComfyUI に寄せ、記事側は指示文と保存ルールだけを持つ方が管理しやすい
- アイキャッチ画像を自動で 1200x630 に整えておくと、ブログ一覧や OGP で迷わない
- 本文画像を
body-01.pngのような連番にしておくと、あとから差し替えやすい
逆に、最初の設定だけは少し面倒だった。そこさえ通ってしまえば、あとは記事ごとに指示文を差し替えて回すだけになる。
これで何が変わったか
一番大きいのは、「画像だけ最後に人間が別画面で作る」というボトルネックがかなり小さくなったことだ。まだ指示文まで完全自動で最適化する段階ではないけれど、少なくとも同じ手順を何度でも繰り返せるようになった。
記事のテーマに合わせて指示文を差し替えれば、ゲーム記事でも技術記事でも同じ流れで画像を作れる。まだ試行錯誤は必要だが、「画像だけ最後に別作業になる」状態からはかなり前進したと思う。
参考
ComfyUI: https://github.com/Comfy-Org/ComfyUI
Stability Matrix: https://github.com/LykosAI/StabilityMatrix
