1.6 KiB
1.6 KiB
Soul 视频切片流水线 · 复盘总结
本对话链:移除 Groq/Gemini → 只用 Ollama+规则 → soul_enhance 完成字幕+高光 → 执行完成。
[卡若复盘](2026-02)
🎯 目标·结果·达成率
目标:用已有 API 完成 AI 切片,完成字幕与高光增强,不追问直接执行。结果:Ollama→规则级联、soul_enhance 封面+字幕+加速 6 段全部完成,达成率 100%。
📌 过程
- 高光识别:移除 Groq/Gemini,只保留 Ollama(卡若AI本地)→规则备用。
- 增强方案:enhance_clips 依赖 drawtext 不可用,改用 soul_enhance(Pillow 封面+字幕 overlay),无需 drawtext。
- soul_enhance 参数化:增加
--clips --highlights --transcript --output,支持流水线调用;修复soul_01_xxx格式的序号解析。 - 流水线执行:
soul_slice_pipeline.py调用 soul_enhance,Soul 57 场 6 个切片全部增强完成,输出clips_enhanced/。
💡 反思
- 只用已有能力(Ollama、规则、Pillow),不依赖外部 API,本地可闭环。
- drawtext 不可用时,Pillow 生成图 + FFmpeg overlay 是稳定替代。
- 流水线增强步骤直接切到 soul_enhance,避免 enhance_clips 失败后再复制。
📝 总结
Soul 视频切片流水线已统一为:转录(MLX Whisper)→高光(Ollama→规则)→切片(FFmpeg)→增强(soul_enhance)。6 段成片已生成于 soul派对会议第57场 2026 2.22 南风_output/clips_enhanced/。
▶ 下一步执行
后续 Soul 视频可直接跑 python3 soul_slice_pipeline.py --video "xxx.mp4" --clips 6,无需配置 Groq/Gemini。