
(ローカル版のStableDiffusionで100枚一気に画像生成しました。使用したAIモデルはAnythingXL_v50.safetensors プロンプト文は下記参照)
はじめに
WordPressでブログを書いていると、本文と同じくらい悩ましいのが「挿し絵をどうするか」という問題です。
Stable Diffusionをローカル環境で動かせば自由度は高い。しかし実際には、
- 何枚生成してもピンと来ない
- それっぽいけどブログにはうるさい
- 情報量が多すぎて本文を邪魔する
こんな状態に陥りがちです。
一方、オンライン版の画像生成サービスでは、驚くほど一発で「ブログ向け」の完成度が高いイラストが出てくることがあります。
この差はセンスではありません。設計思想の差です。
この記事では、その違いを分解したうえで、ローカル版Stable Diffusionでも「大衆受けするブログ挿し絵」を出しやすくするための実践的な虎の巻をまとめます。
なぜオンライン版は一発で決まりやすいのか
オンライン版が優秀に見える理由は、AIが特別賢いからではありません。
裏側では、次のような制御がほぼ確実に入っています。
- ブログ・広告向けに調整されたモデル
- 構図や色数が最初から制限されている
- プロンプトが内部で補正されている
- seedが実質的に固定に近い
つまりユーザーは、当たりしか入っていないガチャを引いています。
一方ローカル版は、芸術・写真・抽象表現・事故作まで全部入り。
自由度は高いですが、ブログ用途では外れを引く確率が跳ね上がります。
虎の巻①「作品」ではなく「素材」を作る
ローカル版で失敗する最大の原因は、
良い絵を作ろうとする
ことです。
ブログ挿し絵に必要なのは主張の強い作品ではなく、本文を補助する素材です。
- 芸術性 → 不要
- 個性 → 控えめ
- 分かりやすさ → 最優先
この意識に切り替えた瞬間、成功率が跳ね上がります。
虎の巻② プロンプトの情報量を減らす
ありがちな失敗プロンプトはこうです。
masterpiece, ultra-detailed, cinematic lighting…
これはSNS向けです。ブログ向けではありません。
代わりに入れるべき方向性は以下です。
- simple illustration
- clean composition
- flat color
- minimal background
- blog illustration
- web article illustration
地味です。ですが、それで正解です。
虎の巻③ 構図を明示的に縛る
オンライン版は構図を暗黙に固定しています。
ローカル版では言葉で縛らないと、AIは自由に暴れます。
有効な指定例です。
- one main subject, centered
- upper body only
- facing forward
- plenty of empty space
- simple gradient background
余白は価値です。文字を置ける前提で生成させましょう。
虎の巻④ 色数を制限する
ブログ向け挿し絵は、色が少ないほど読みやすい。
使いやすいキーワードは次の通りです。
- limited color palette
- soft pastel colors
- low contrast
- no strong shadows
逆に避けたいのは、派手さを煽る表現です。
- dramatic lighting
- high contrast
- neon colors
派手さはクリックを奪いますが、本文の理解を助けません。
虎の巻⑤ ネガティブプロンプトは事故防止用
ネガティブプロンプトは芸術性を削ってでも入れます。
ブログ挿し絵用の例です。
text, logo, watermark, signature,
busy background, clutter,
extra limbs, deformed,
nsfw, realistic face,
dark, horror, creepy
目的はただ一つ。
読者を不安にさせないことです。
虎の巻⑥ パラメータは保守的に
おすすめの無難構成です。
- Sampler:DPM++ 2M Karras
- Steps:20〜28
- CFG:6〜8
CFGを上げすぎると、主張が強すぎる絵になりがちです。
オンライン版は、だいたいこのゾーンに寄せています。
虎の巻⑦ seedは半固定で使う
完全ランダムは探索向きで、量産には不向きです。
おすすめの流れは次の通り。
- seed=-1で数枚生成
- ブログ向きな1枚を選ぶ
- seed固定で微調整
これはオンライン版のやり方をそのまま真似しています。
ローカル版が難しい本当の理由
オンライン版は、人間が積み上げた無数の失敗をすでに排除しています。
ローカル版ユーザーは、その地雷原を最初から歩いているだけです。
腕の問題ではありません。仕様です。
実務的な結論
- 一発でブログ向けが欲しい → オンライン版
- 試行錯誤や差分が欲しい → ローカル版
- 完全一致を狙わない
道具は役割で使い分ける。
それが一番コストが低く、精神にも優しい選択です。
おわりに
Stable Diffusionは芸術家でもあり、職人でもあります。
オンライン版は優秀な下請け。
ローカル版は言うことを聞かない天才。
扱い方さえ分かれば、どちらもブログ制作の強力な味方になります。
(おまけ)今回の記事用のStable Diffusion用プロンプト(ブログ挿し絵向け)
ポジティブプロンプト
simple illustration, blog illustration, web article illustration,
a person sitting at a desk using a computer, thinking pose,
clean composition, centered subject, upper body only,
flat color, soft pastel colors, limited color palette,
minimal background, simple gradient background,
plenty of empty space, calm atmosphere
(このプロンプトを日本語に約すとこうなります)
シンプルなイラスト、ブログのイラスト、ウェブ記事のイラスト
机に座ってパソコンを使う人、考え事をしているポーズ
すっきりとした構図、中央に被写体、上半身のみ
単色、柔らかなパステルカラー、限られたカラーパレット
最小限の背景、シンプルなグラデーションの背景
十分な余白、落ち着いた雰囲気
ネガティブプロンプト
text, logo, watermark, signature,
busy background, clutter,
extra limbs, extra fingers, deformed body,
realistic face, photorealistic,
dark, horror, creepy, scary,
nsfw, violent
(このネガティブプロンプトを日本語に約すとこうなります。nsfwとはNot Safe For Work(職場で見るには安全ではない)の略です。つまりHな画像です)
テキスト、ロゴ、透かし、署名、
雑然とした背景、雑然としたデザイン、
余分な手足、余分な指、変形した体、
リアルな顔、フォトリアリスティック、
暗い、ホラー、不気味、怖い、
NSFW、暴力的
推奨生成設定(ローカル版)
- Sampler:DPM++ 2M Karras
- Steps:22〜26
- CFG Scale:6〜7
- Seed:-1で数枚 → 良さそうなものを固定
- 解像度:768×512 または 1024×576(横長・ブログ向き)
運用メモ(実務向け)
- アイキャッチ用は「余白多め・横長」
- 本文挿し絵は「情報量をさらに減らす」
- 同じseedで色や表情だけ変えると統一感が出る
この運用を徹底すると、オンライン版に近い安定感をローカル環境でも再現しやすくなります。
(追記)筆者の感想
実際に記事の通りに画像生成してみたら、なんか怖い画像が多いんですけど・・・
以下は62枚目の画像です。

お化けですか・・・?
コメント