文章作者: AIMagicCat
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 MagicCat!
相关推荐
2026-03-10
用 Replicate 一键生成玲依四格:我的完整流程记录
从 YAML 场景到 Replicate 出图,我用的是一条「YAML → gen 脚本 → Replicate API」的流水线。这里记完整流程和踩坑点。 1. 流程概览 写 YAML:按 玲依 YAML 脚本约定 写好 comic_info 和 panels。 跑 gen 脚本:例如 node gen.js scene_01.yaml --ref reference.png --out ./output,脚本负责读 YAML、拼 prompt、按格顺序调 Replicate。 Replicate 出图:每格调用一次 Replicate 上的图生图模型(如 nano-banana-2 / 其他 Flux 系),传入参考图、可选前一帧、以及本格 prompt。 收图与拼四格:脚本把每格保存为独立文件,再用手工或简单脚本拼成四格图。 2. gen 脚本做什么 解析 YAML:读 comic_info 和 panels,按 panel1~panel4 顺序遍历。 拼 prompt:把全局 style、color_scheme、background_style 和当前格的 ...
2026-03-10
我如何用 YAML 写出玲依的四格漫画脚本
用 YAML 写玲依四格脚本,可以同时给人看分镜、给 gen 脚本当配置。下面是我用的结构和约定。 1. 顶层结构一个场景一个 YAML 文件,顶层大致分三块: comic_info:漫画类型、风格、角色、背景等全局信息。 description_show(可选):是否在生成时把描述打出来,方便调试。 panels:每一格的内容(描述、场景、动作、表情、台词等)。 2. comic_info 约定comic_info: type: "四格漫画" style: "柔软线条、讽刺冷幽默、统一角色、日系漫画感" color_scheme: "室内暖光,可加一点屏幕/手机绿光" characters: 妹妹: name: "参考图" appearance: "白毛猫娘、银白色长发、猫耳、圆眼、娇小体型" personality: "天真、容易被话术带节奏、事后呆住" 哥哥: name: "参考图" appearance: "普通青年、黑发或深色短发、日常休闲装" personali...
2026-03-10
从角色参考图到连续分镜:玲依 AI 漫画制作实战
做玲依这类固定角色的多格漫画时,角色参考图和前后帧衔接直接决定成品是否「像同一个人」。这篇记录我实际用下来的做法和坑。 1. 参考图准备 选一张「定妆照」:挑一张你最满意、表情/角度都适合当基准的玲依图,作为整篇的 reference_image。建议正面或 3/4 侧、表情自然、光线清晰。 分辨率:至少 512×512,推荐 768×768 或 1024×1024,避免被模型当低清图弱化细节。 只保留角色:若原图背景杂乱,可先抠图或裁成半身/大头,再作为参考图,减少模型把背景元素学进去。 2. 前后帧衔接(连续分镜) 第一格:只喂参考图 + 本格 prompt,不喂前一帧。 第二格及之后:除参考图外,再喂前一格成图作为 image / previous frame,prompt 里可加「与上一格同一角色、同一场景、动作/表情接续」。 同一场景多格:在 prompt 里固定背景描述(如「室内、暖光、沙发旁」),并尽量保持服装、发型描述一致,这样即使模型略有漂移,观感上仍连贯。 3. 分辨率与放大 出图分辨率:按你最终发布需求来...
2026-03-10
AI 漫画配音实战:从廉价 TTS 到声音克隆
在做剪辑漫画视频的时候,我最崩溃的一步不是画面,而是配音。 一开始我以为现在大模型这么多,随便找个 AI TTS 就够用了,结果实际跑下来发现:大部分免费/通用的 TTS 效果都挺一言难尽的。 1. 普通 TTS:能用,但很「AI」我实际试下来,很多 TTS 都有一个共同问题:听得出是机器人在念稿子。 情绪很平:整段像说明书朗读,没有起伏 停顿怪:该停顿的地方飞过去,不该停顿的地方突然卡一下 咬字微妙:个别音节总有点说不出的奇怪口音 用在漫画剪辑视频里,观众一听就知道是「AI 配的」,代入感会被拉掉一大截。 如果只是做工具演示类视频,这种 TTS 还能勉强接受;但一旦有角色、有情绪、有剧情,问题就很明显了。 2. 豆包等商用 TTS:进步明显,但仍有缺憾对比了一圈之后,豆包的 TTS 效果在同类工具里其实算不错的: 情绪和节奏都更自然一些 语气不会那么「合成感」 多角色、多音色选择,比起免费 TTS 已经是明显升级 但实际用在「漫画视频 + 角色对白」这个场景里,还是有几个让我犹豫的点: 成本问题: 长期大量生成语音,成本会持续累积 ...
评论
公告
我是MagicCat,一个喜欢折腾的开发者。我涉及的领域包括:开发、技术、生活、学习、分享。

