用 YAML 写玲依四格脚本,可以同时给人看分镜、给 gen 脚本当配置。下面是我用的结构和约定。

1. 顶层结构

一个场景一个 YAML 文件,顶层大致分三块:

  • comic_info:漫画类型、风格、角色、背景等全局信息。
  • description_show(可选):是否在生成时把描述打出来,方便调试。
  • panels:每一格的内容(描述、场景、动作、表情、台词等)。

2. comic_info 约定

comic_info:
  type: "四格漫画"
  style: "柔软线条、讽刺冷幽默、统一角色、日系漫画感"
  color_scheme: "室内暖光,可加一点屏幕/手机绿光"
  characters:
    妹妹:
      name: "参考图"
      appearance: "白毛猫娘、银白色长发、猫耳、圆眼、娇小体型"
      personality: "天真、容易被话术带节奏、事后呆住"
    哥哥:
      name: "参考图"
      appearance: "普通青年、黑发或深色短发、日常休闲装"
      personality: "资本家话术、一步步钓人上钩"
  background_style: "室内、沙发或餐桌旁,可有手机/屏幕元素"
  • type / style / color_scheme:整篇统一,gen 脚本会拼进每格的 system 或 prefix prompt。
  • characters:每个角色下 name: "参考图" 表示该角色用参考图;appearancepersonality 会参与生成时的文本描述。
  • background_style:多格同场景时保持一样,有利于前后帧衔接。

3. panels 约定

每格一个 key(如 panel1panel4),字段建议至少包含:

字段含义给 gen 的用法
description本格简要说明可选展示/日志
scene场景、光线拼进 prompt
action角色动作拼进 prompt
expression表情、情绪拼进 prompt
details其他细节可选拼进
text台词/字幕可写进图或后处理

gen 脚本按 panel1panel4 顺序遍历,即可实现「第一格只参考图,后续格参考图 + 前一格成图」。

4. 与 gen 脚本的配合

  • 输入:gen 脚本读入 YAML(如 scene_01_室内.yaml),再接收「参考图路径」「输出目录」等。
  • 拼 prompt:把 comic_info.stylecolor_schemebackground_style 和当前格的 sceneactionexpressiondetails 拼成一条 prompt;若有 characters,把对应角色的 appearance 也拼进去。
  • 顺序与前一帧:第 1 格只传参考图;第 2~4 格传参考图 + 上一格的输出图,并在 prompt 里强调「同一角色、接续上一格」。
  • 输出:按格号或文件名规范写出(如 scene_01_panel1.png),便于后续拼四格或做视频。

这样 YAML 既是人可读的分镜脚本,也是机器可读的生成配置,改剧情或风格只要改 YAML,再跑一遍 gen 即可。