ComfyUI.Tokyo

サイト内検索 help
複数条件の場合はキーワードの間にスペースを入れてください。
例 ksampler controlnet

FluxKontext5 Switch View

Workflow

Flux Kontextの「Switch View」機能は、単なる画像の回転ではなく、3Dを意識した高度なAI生成技術を応用して、テキストプロンプトに基づいてオブジェクトの視点を変更する機能です。

この機能は、インペイント機能とは異なる、より複雑な原理に基づいています。

  1. 自然言語処理 (NLP) による意図理解
    まず、インペイント機能と同様に、AIは入力されたプロンプト「Rotate the camera 90 degrees to view directly from side of the car, showing its side while maintaining its color and shape」を解析します。
    ここから以下の主要な意図を抽出します。
    • アクション: カメラを90度回転させる。
    • 新しい視点: 車の真横から見る。
    • 維持すべき要素: 車の色と形状。
    AIはこの情報を、画像の新しい生成方向を決定するための「指示書」として使用します。
  2. 3D-Aware Generative モデルの活用 この機能の核心は、3Dを意識した生成モデルにあります。
    通常の画像生成AIは2次元の画像を扱いますが、「Switch View」機能では、モデルが入力された車の画像から内部的に仮想の3次元モデルを再構築していると考えられます。
    • 2D画像からの3D表現の学習: AIは、大量のデータセットから、様々な角度から撮影されたオブジェクト(車など)がどのように見えるかを学習しています。
      これにより、1枚の2D画像が与えられただけでも、その背後にあるオブジェクトの3D的な形状やテクスチャを推論できます。
    • 仮想カメラの回転: プロンプトの指示(「90度回転」)に基づいて、AIはこの仮想の3Dモデルを、まるで仮想のカメラで撮影し直すかのように回転させます。
      これにより、元の画像には存在しなかった「横からの視点」をコンピュータ内で生成します。
  3. 画像の再生成と条件付け (Conditioning)
  4. 仮想的に回転させた3Dモデルを基に、新しい視点からの2D画像を再生成します。この際、プロンプトの残り部分(「maintaining its color and shape」)が重要な役割を果たします。
    • 条件付き生成 (Conditional Generation): AIモデルは、元の画像に含まれる色、質感、スタイルといった要素を「条件」として引き継ぎます。
      これにより、視点は変わっても、車のボディの色やエンブレムのディテールなどが忠実に保たれます。
    • ディフュージョンモデル: 最近の高性能な生成モデル(ディフュージョンモデルなど)は、この条件付き生成に非常に優れています。
      ノイズから画像を生成するプロセスにおいて、プロンプトや元の画像からの情報を「ガイド」として用いることで、指示に沿った画像を高い品質で出力します。
    つまり、「Switch View」機能は、プロンプトと元の画像を組み合わせて、オブジェクトの3D的な理解新しい視点からの画像の創造を同時に行う、非常に高度なAI技術なのです。

    FluxKontext5.json


    Link