多媒体链路
这页聚焦文件处理、抽帧、转码、音轨和证据链任务。
先判断是不是这页的范围
- 你要抽帧、截图、裁剪、缩放、转码、拼接、去音轨、抽音轨:看这里
- 你要把录屏问题片段整理成可回看的证据链:看这里
- 你要理解页面语义、接口协议或安全签名,不要先从媒体文档开始
- 你只是想先跑最小命令,先回入口页,不必先把整篇媒体文档读完
怎么读这页
- 只想取证图片:先看截图、抽帧、关键帧和场景变化抽帧
- 只想改视频文件:再看裁剪、缩放、转码、拼接、换容器和去音轨
- 只想处理音轨:再看抽取音轨、替换音轨、音频转换和本机试听
- 想做完整证据链:最后看组合链路和星图任务
- 如果你要把媒体链路真正写进
--code,结构层先配合星图协议页,执行语义再配合星图深入说明
一句话理解:
- 媒体工具负责处理文件和生成证据
- 它们不负责解释内容,也不负责替代设备或接口域
能力覆盖
| 类型 | 入口 |
|---|---|
| 取证画面 | 截图、抽帧、关键帧、场景变化抽帧 |
| 视频文件处理 | 裁剪、缩放、转码、拼接、换容器、去音轨 |
| 音轨处理 | 抽取音轨、替换音轨、音频转换、本机试听 |
| 组合链路 | 多步串联的媒体预处理与证据链任务 |
边界约定: - 这些工具做的是媒体文件处理,不做内容理解 - 抽帧工具负责生成图片,不负责判断“哪一帧最重要” - 视频处理工具负责改文件,不负责分析页面业务语义 - 音频试听是本机播放,不是把声音推送到设备 - 录屏会话控制属于长会话能力,不是单次文件处理
常见命令
单帧截图
mind --fast "从 /path/to/demo.mp4 的第 3.5 秒抽取一张截图,并返回证据"
图片序列
mind --fast "把 /path/to/demo.mp4 从第 0 秒开始按 2fps 导出图片序列,并返回输出目录"
关键帧提取
mind --fast "从 /path/to/demo.mp4 提取关键帧,最多返回 8 张,并输出结果证据"
场景变化抽帧
mind --fast "从 /path/to/demo.mp4 按场景变化抽帧,阈值 0.35,最多保留 10 张"
视频裁剪
mind --fast "把 /path/to/demo.mp4 从第 12 秒裁到第 25 秒,并输出 mp4 片段"
视频缩放
mind --fast "把 /path/to/demo.mp4 缩放到宽 720,高度等比,并输出新视频"
视频转码
mind --fast "把 /path/to/demo.mov 转成 30fps 的 mp4,编码为 libx264,并返回结果"
视频拼接
mind --fast "根据 /path/to/list.txt 拼接多个视频片段,输出 mp4 文件"
仅换容器
mind --fast "把 /path/to/demo.mkv 仅换容器封装成 mp4,不重编码"
去音轨
mind --fast "把 /path/to/demo.mp4 去掉音轨并输出静音视频"
视频信息探测
mind --fast "探测 /path/to/demo.mp4 的视频信息,并返回时长与原始探测结果"
音轨抽取
mind --fast "从 /path/to/demo.mp4 提取音轨为 mp3,并返回输出文件"
替换音轨
mind --fast "用 /path/to/new_audio.m4a 替换 /path/to/demo.mp4 的音轨,并输出 mp4"
音频格式转换
mind --fast "把 /path/to/demo.wav 转成 16000Hz 单声道 mp3,并返回结果"
音频试听
mind --fast "播放 /path/to/demo.mp3,音量 0.8"
组合链路
录屏问题片段精简回放
mind --fast "先探测 /path/to/demo.mp4,再把第 15 秒到第 28 秒裁出来,然后从裁剪结果中提取关键帧,最多保留 6 张"
视觉证据链预处理
mind --fast "把 /path/to/demo.mp4 先缩放到宽 720,再按场景变化抽帧,最多返回 10 张结果图"
音频分离与验证
mind --fast "从 /path/to/demo.mp4 提取音轨为 wav,再转成 16000Hz 单声道 mp3,最后播放结果文件"
最佳实践
- 先探测视频信息,再决定裁剪、抽帧、转码路径
- 报告配图优先用关键帧或场景帧,不要默认把全量帧都塞回结果
- 长视频优先先裁剪,再抽帧或转码
- 只改容器时优先只换封装,不重编码
- 涉及音轨处理时,最后接一次本机试听做验收
星图任务
只有当你要把探测、裁剪、抽帧、抽音轨、试听串成一条完整媒体证据链时,才需要写完整星图。单个媒体动作直接参考上面的单项命令即可。
更自然的星图写法通常长这样:
mind --plan --code media.md
# name: media_evidence_chain
从 `/path/to/demo.mp4` 中裁出第 `15` 秒到第 `28` 秒的问题片段。
从裁剪结果里提取关键帧,最多保留 `6` 张。
抽出音轨。
播放一次,确认音频结果正常。
这个例子真正表达的是:
- 先裁剪,再抽帧,再抽音轨,再试听
- 重点是媒体处理顺序和证据链,不是要求读者手写工具参数
- 如果只是单步动作,直接用上面的 mind --fast "..." 更合适