Home/用語集

AI動画・絵コンテ用語集

AI動画と絵コンテ制作の背後にある用語を、やさしい言葉で解説。絵コンテやショットリストから、どの最新ツールでも出会う生成モード（t2v、i2v、r2v）まで。

絵コンテと前期制作

絵コンテ（Storyboard）: 順番に並んだショットの連なり——それぞれをフレームや、構図とアクションを記した説明で示し、撮影前に作品全体を「見る」ことができるもの。AIワークフローでは、各コマがそれを生成するプロンプトを伴うことが多い。
ショットリスト（Shot list）: シーン内の各ショットを構造化したテキストの内訳：ショット番号、種類（ロング／ミディアム／クローズアップ）、カメラアングル、動き、被写体、尺。ショットリストは絵コンテの「表計算版」。
アニマティック（Animatic）: 絵コンテのフレームをタイミングに合わせて並べたスライドショー。仮の音声を付けることも多く、素材がまだ無い段階でテンポを検証する。静止画の提示であって、生成された動画ではない。
ログライン（Logline）: 物語を一文で捉えたもの：主人公、目標、障害、そして賭けられているもの。以降のあらゆるクリエイティブ判断は、これを基準に測られる。
トリートメント（Treatment）: 物語全体を散文でまとめた要約——通常1〜2ページ、セリフなし——脚本の前に書き、構造上の問題を安く直せるようにするもの。
脚本（Screenplay）: 映画の整形された台本：シーン見出し、ト書き、セリフ。AI絵コンテのワークフローでは、まず脚本を確定させてから各ショットに分解する。
設定ショット（Establishing shot）: 通常シーンの冒頭に置くロングショットで、場所と空間的な位置関係を示し、アクションに寄る前に観客が「ここはどこか」を把握できるようにする。
カット（Cut）: あるショットから次のショットへの切り替え。ショット間のカットを設計してこそ、絵コンテは無関係な画像の羅列ではなく、連続した動きとして読める。

AI生成モード

テキストから動画（t2v）: テキストプロンプトから直接、入力画像なしで動画クリップを生成すること。
画像から動画（i2v）: 静止画を動かす：開始フレームを与えると、モデルがそこから動きを生成する。
参照から動画（r2v）: 厳密な最初のフレームを指定せず、キャラクター・スタイル・被写体を定義する参照入力から動画を生成すること。マルチモーダルモデルでは、参照は画像だけでなく参照動画や参照音声も含められる（「動画から動画」を参照）。
最初と最後のフレーム（firstlast）: 開始画像と終了画像の両方を与えると、モデルがそれらをつなぐ中間の動きを生成する。
テキストから画像（t2i）: テキストプロンプトから静止画を生成すること。
画像から画像（i2i）: 既存の画像をプロンプトで編集・再スタイルしつつ、その中核となる内容を保つこと——衣装替え、表情の変更、参照画像の整えなどに使う。

AI動画の概念

キャラクターの一貫性: 顔・衣装・体型といったキャラクターの見た目を、複数のショットや生成をまたいで同一人物に保つこと。各プロンプトで描写し直すのではなく、アイデンティティの参照画像とペルソナを再利用可能なキャラクターに結び付けて実現する。
動画プロンプト: 1つのショットのために動画モデルへ送る構造化された記述——通常は最初のフレーム、ショット中の動き、着地点——に加えて、参照画像とスタイル。
マルチモデルプラットフォーム: 1つのアカウントから多数のAIモデル（Sora 2、Kling、Seedance、VEOなど）を使えるプラットフォーム。1つのエンジンに縛られず、各ショットを最適なモデルに振り分けられる。
フレームチェーン: あるショットの最後のフレームを次のショットの最初のフレームとして使い、連続したアクションがカットをまたいでも一貫するようにすること。
アップスケール（超解像）: 画像や動画のピクセル解像度を上げること——たとえば1080pから4Kへ——その際、ピクセルを単に引き伸ばすのではなく、AIモデルがもっともらしい細部（輪郭、質感）を再構築する。低解像度で安く生成したAI映像を、仕上げに拡大する用途でよく使う。FlyAIghのアップスケーラーはTopaz LabsのAPI上で動作する。

動画から動画と参照

動画から動画（v2v）: テキストだけでなく、既存の動画にガイドされて新しい動画を生成すること。参照クリップが、新しい生成のスタイル・動き・被写体を方向づける。現代のマルチモーダルモデルでは、元の動画を参照動画としてプロンプトとともに渡すことで行い、原画をフレームごとに塗り直すわけではない。
スタイル転送: あるメディアの視覚的な美学——色、時代感、アニメーションのスタイル——を新しいコンテンツへ移すこと。AI動画では、スタイル転送は最も一般的な「動画から動画」の作業の一つ（たとえば実写をアニメに変える）。
参照動画: 生成をガイドするために入力として与える動画クリップ——その見た目、カメラの動き、モーションが新しい出力に引き継がれる。最初のフレームとは違い、参照動画は文字どおりの開始画像ではなく、演出の信号である。
参照音声: 生成された動画がそれに合わせて動いたり、それを取り込んだりするように、入力として与える音声トラック——音楽主導や、音と同期した生成に使う。Seedance 2.0のようなマルチモーダルモデルは、参照画像や参照動画に加えて参照音声も受け付ける。

編集とつながり

マッチカット（Match cut）: あるショットの形・動き・構図が次のショットへ引き継がれるカットで、転換が意図的で連続したものに感じられる。ぎくしゃくした無関係なカットの正反対。
J-cutとL-cut: 音声と映像が別々のタイミングで切り替わる編集。J-cutでは次のショットの音が映像より先に始まり、L-cutでは前のショットの音が次へ余韻として残る。どちらもショット間のつなぎ目をなめらかにする。
ジャンプカット（Jump cut）: 同じ被写体の、わずかに違う2つのショットの間で切り替え、時間や位置に意図的な「飛び」を作るカット。勢いを出したり時間を圧縮したりするのに使い、見えない連続性が目的のときは避ける。
イマジナリーライン（180度ルール）: つながりの指針：2人の被写体を結ぶ想像上の線の片側にカメラを保ち、カット間でも左右の位置関係が一貫するようにする。線を越えると観客は方向感覚を失う。

ショットとカメラワーク

ロングショット（遠景）: 被写体をその環境全体の中に収めるショットで、シーン全体と各人の立ち位置を見せる。AI動画では設定の一拍——まず生成して空間関係を固定し、それから寄りのショットへカットする。
ミディアムショット（中景）: 人物をおおよそ腰から上で捉えるショット——表情が読める近さと、ジェスチャーが見える広さを兼ねる。セリフ場面の主力ショット。
クローズアップ（寄り）: 単一の被写体——多くは顔——で画面を埋め、感情や細部を担わせるショット。AI動画では顔が大きく映るため、クローズアップこそキャラクターの一貫性が最も問われる。
パン（横振り）: 固定点からカメラを水平に振り、シーンを左右になめるカメラの動き。AI動画のプロンプトでは、被写体を動かすのではなく「カメラが左／右にパンする」と記述する。
ティルト（縦振り）: 固定点からカメラを垂直に振り、上下に傾けるカメラの動き——高さを見せたり、立ち上がる被写体を追ったりする。パンの縦方向版。
ドリーショット（移動撮影）: カメラ全体がレール上で被写体に近づいたり遠ざかったりして遠近感を変えるショット（拡大するだけのズームとは異なる）。「ドリーイン」は緊張を高め、「ドリーアウト」は状況を見せる。
トラッキングショット（追従撮影）: 動く被写体の横や後ろをカメラが移動しながら、画面内に保ち続けるショット。移動撮影やフォローショットとも呼ばれ、AI動画のダイナミックな動きのプロンプトの背骨。
ズーム: カメラを動かさずにレンズの焦点距離を変え、視野を拡大したり広げたりすること。ズームは空間を平板にし、ドリーは空間を変える——同じ画面でも見え方が違う。
ローアングル（あおり）: 被写体の下から見上げて撮るショットで、被写体を力強く、大きく、威圧的に感じさせる。ハイアングルの反対。
ハイアングル（俯瞰）: 被写体の上から見下ろして撮るショットで、被写体を小さく、弱く、観察されているように感じさせやすい。
ダッチアングル（斜め構図）: カメラを傾けて水平線を斜めにするショットで、不安・緊張・方向感覚の喪失を生む。傾斜アングルとも呼ぶ。
オーバーザショルダー（肩越し）: 一方の人物の肩越しに、もう一方を捉える構図で、会話を空間の中に位置づける。2人の対話の定番の構図であり、180度ルールが視線の一貫性を保つ場面。

実際に試してみませんか？

AI絵コンテジェネレーター脚本を絵コンテにする方法