ComfyUI.Tokyo

サイト内検索 help
複数条件の場合はキーワードの間にスペースを入れてください。
例 ksampler controlnet

Flux_Kontext_Multiple_Input_Images 多画像の合成

このワークフローのように Flux Kontext に複数の ReferenceLatent を接続 して使う場合、以下の特徴があります。

  1. Flux Kontext Multiple Input_Images の特徴
    • 複数画像からの文脈融合
      各画像から抽出した latent 特徴(色・形・質感・構造)を、Flux Kontext が統合して一つの生成コンテキストにします。
      例えば
      • 1枚目 → 背景や構図の情報
      • 2枚目 → キャラクターの髪色や服の質感
      • 3枚目 → 顔の特徴や肌の質感 といった具合に、役割分担が可能です。
    • 優先度は順番や FluxGuidance の数値で制御可能
      `ReferenceLatent` を複数接続した場合、後段で接続するものほど「上書き」される傾向があります。
      また `FluxGuidance` の数値が高いものほどその画像の影響が強くなります。
    • マスク無しでも融合可能 通常の inpaint のようにマスクを必須とせず、全体の特徴をブレンドすることができます。
      これにより、マスク作業を省略しつつ複数ソースからの合成ができます。
    • ControlNet と異なり抽象的特徴の融合が得意
      ControlNet は構造・ポーズなどの明確な制御に特化しますが、Flux Kontext は色合い・質感・雰囲気といった「抽象的」要素の融合に強いです。
  2. このワークフローでの役割例
    この例では:
    • 左上の犬画像 → 背景の一部や動物要素の参照
    • 左中の女性画像 → 髪色・服装・雰囲気
    • 左下の男性画像 → 顔立ち・肌質
    • それらを `ReferenceLatent` で個別に latent 化し、Flux Kontext に渡して統合
    • テキストプロンプト(例: "2 dogs, woman and man walking in the park")と融合して生成
    結果的に「複数のリファレンスを総合的に混ぜた」1枚の画像が得られます。
  3. 単一画像 Flux Kontext との違い
項目 単一画像参照 複数画像参照
元画像の忠実度 高い(1枚を強く反映) 分散(複数要素を融合)
特徴の混ざり方 ほぼそのまま 部分的・抽象的に混ざる
制御の自由度 やや低い 高い(パーツ別の融合が可能)
マスク依存度 低(全体融合も自然)

Workflow

Flux_Kontext_multiple_images.json

Flux_Kontext_multi_2image.json

適当に小さめにしたワンちゃん

Workflowと異なる絵です。


Link