Files
karuo-ai/_执行日志/2026-02_Soul视频切片_复盘.md

1.6 KiB
Raw Blame History

Soul 视频切片流水线 · 复盘总结

本对话链:移除 Groq/Gemini → 只用 Ollama+规则 → soul_enhance 完成字幕+高光 → 执行完成。


[卡若复盘]2026-02

🎯 目标·结果·达成率
目标:用已有 API 完成 AI 切片完成字幕与高光增强不追问直接执行。结果Ollama→规则级联、soul_enhance 封面+字幕+加速 6 段全部完成,达成率 100%。

📌 过程

  1. 高光识别:移除 Groq/Gemini只保留 Ollama(卡若AI本地)→规则备用。
  2. 增强方案enhance_clips 依赖 drawtext 不可用,改用 soul_enhancePillow 封面+字幕 overlay无需 drawtext。
  3. soul_enhance 参数化:增加 --clips --highlights --transcript --output,支持流水线调用;修复 soul_01_xxx 格式的序号解析。
  4. 流水线执行soul_slice_pipeline.py 调用 soul_enhanceSoul 57 场 6 个切片全部增强完成,输出 clips_enhanced/

💡 反思

  1. 只用已有能力Ollama、规则、Pillow不依赖外部 API本地可闭环。
  2. drawtext 不可用时Pillow 生成图 + FFmpeg overlay 是稳定替代。
  3. 流水线增强步骤直接切到 soul_enhance避免 enhance_clips 失败后再复制。

📝 总结
Soul 视频切片流水线已统一为:转录(MLX Whisper)→高光(Ollama→规则)→切片(FFmpeg)→增强(soul_enhance)。6 段成片已生成于 soul派对会议第57场 2026 2.22 南风_output/clips_enhanced/

▶ 下一步执行
后续 Soul 视频可直接跑 python3 soul_slice_pipeline.py --video "xxx.mp4" --clips 6,无需配置 Groq/Gemini。