Skip to content

多媒体链路

这页聚焦文件处理、抽帧、转码、音轨和证据链任务。

先判断是不是这页的范围

  • 你要抽帧、截图、裁剪、缩放、转码、拼接、去音轨、抽音轨:看这里
  • 你要把录屏问题片段整理成可回看的证据链:看这里
  • 你要理解页面语义、接口协议或安全签名,不要先从媒体文档开始
  • 你只是想先跑最小命令,先回入口页,不必先把整篇媒体文档读完

怎么读这页

  • 只想取证图片:先看截图、抽帧、关键帧和场景变化抽帧
  • 只想改视频文件:再看裁剪、缩放、转码、拼接、换容器和去音轨
  • 只想处理音轨:再看抽取音轨、替换音轨、音频转换和本机试听
  • 想做完整证据链:最后看组合链路和星图任务
  • 如果你要把媒体链路真正写进 --code,结构层先配合星图协议页,执行语义再配合星图深入说明

一句话理解:

  • 媒体工具负责处理文件和生成证据
  • 它们不负责解释内容,也不负责替代设备或接口域

能力覆盖

类型 入口
取证画面 截图、抽帧、关键帧、场景变化抽帧
视频文件处理 裁剪、缩放、转码、拼接、换容器、去音轨
音轨处理 抽取音轨、替换音轨、音频转换、本机试听
组合链路 多步串联的媒体预处理与证据链任务

边界约定: - 这些工具做的是媒体文件处理,不做内容理解 - 抽帧工具负责生成图片,不负责判断“哪一帧最重要” - 视频处理工具负责改文件,不负责分析页面业务语义 - 音频试听是本机播放,不是把声音推送到设备 - 录屏会话控制属于长会话能力,不是单次文件处理

常见命令

单帧截图

mind --fast "从 /path/to/demo.mp4 的第 3.5 秒抽取一张截图,并返回证据"

图片序列

mind --fast "把 /path/to/demo.mp4 从第 0 秒开始按 2fps 导出图片序列,并返回输出目录"

关键帧提取

mind --fast "从 /path/to/demo.mp4 提取关键帧,最多返回 8 张,并输出结果证据"

场景变化抽帧

mind --fast "从 /path/to/demo.mp4 按场景变化抽帧,阈值 0.35,最多保留 10 张"

视频裁剪

mind --fast "把 /path/to/demo.mp4 从第 12 秒裁到第 25 秒,并输出 mp4 片段"

视频缩放

mind --fast "把 /path/to/demo.mp4 缩放到宽 720,高度等比,并输出新视频"

视频转码

mind --fast "把 /path/to/demo.mov 转成 30fps 的 mp4,编码为 libx264,并返回结果"

视频拼接

mind --fast "根据 /path/to/list.txt 拼接多个视频片段,输出 mp4 文件"

仅换容器

mind --fast "把 /path/to/demo.mkv 仅换容器封装成 mp4,不重编码"

去音轨

mind --fast "把 /path/to/demo.mp4 去掉音轨并输出静音视频"

视频信息探测

mind --fast "探测 /path/to/demo.mp4 的视频信息,并返回时长与原始探测结果"

音轨抽取

mind --fast "从 /path/to/demo.mp4 提取音轨为 mp3,并返回输出文件"

替换音轨

mind --fast "用 /path/to/new_audio.m4a 替换 /path/to/demo.mp4 的音轨,并输出 mp4"

音频格式转换

mind --fast "把 /path/to/demo.wav 转成 16000Hz 单声道 mp3,并返回结果"

音频试听

mind --fast "播放 /path/to/demo.mp3,音量 0.8"

组合链路

录屏问题片段精简回放

mind --fast "先探测 /path/to/demo.mp4,再把第 15 秒到第 28 秒裁出来,然后从裁剪结果中提取关键帧,最多保留 6 张"

视觉证据链预处理

mind --fast "把 /path/to/demo.mp4 先缩放到宽 720,再按场景变化抽帧,最多返回 10 张结果图"

音频分离与验证

mind --fast "从 /path/to/demo.mp4 提取音轨为 wav,再转成 16000Hz 单声道 mp3,最后播放结果文件"

最佳实践

  • 先探测视频信息,再决定裁剪、抽帧、转码路径
  • 报告配图优先用关键帧或场景帧,不要默认把全量帧都塞回结果
  • 长视频优先先裁剪,再抽帧或转码
  • 只改容器时优先只换封装,不重编码
  • 涉及音轨处理时,最后接一次本机试听做验收

星图任务

只有当你要把探测、裁剪、抽帧、抽音轨、试听串成一条完整媒体证据链时,才需要写完整星图。单个媒体动作直接参考上面的单项命令即可。

更自然的星图写法通常长这样:

mind --plan --code media.md

# name: media_evidence_chain
从 `/path/to/demo.mp4` 中裁出第 `15` 秒到第 `28` 秒的问题片段。
从裁剪结果里提取关键帧,最多保留 `6` 张。
抽出音轨。
播放一次,确认音频结果正常。

这个例子真正表达的是: - 先裁剪,再抽帧,再抽音轨,再试听 - 重点是媒体处理顺序和证据链,不是要求读者手写工具参数 - 如果只是单步动作,直接用上面的 mind --fast "..." 更合适

相关文档