Skip to content

能力概览

一句话理解

  • chat 最开放,适合边想边做。
  • fast 工具更窄,适合接口、媒体和短链路。
  • plan 先列步骤,再按序执行,适合巡检和回归。

模式边界

  • chat 执行协议:流式对话,模型可持续发起工具调用。
    工具边界:最宽;只排除少量特殊工具。
  • fast 执行协议:流式对话,和 chat 同类闭环。
    工具边界:裁剪后的工具集;排除设备域、部分 inspect、screen、Framix/Memrix。
  • plan 执行协议:先出计划,再顺序执行步骤。
    工具边界:独立计划执行面;排除 securitybench.nexusloop_steps,保留计划内循环。

工具域边界

  • device 应用与系统控制、UI 操作链、设备动作。
  • bench 性能与稳定性,以及接口执行面。
  • common 环境与基础能力。
  • media 截图、录屏、音视频处理与帧级流水线。

补充: - 接口能力不是独立 api 域,而是落在 bench.nexus - free_rule 属于 plan 执行期能力 - global_rule / rule 属于 --code 的蓝本规则层

典型能力摘要

  • 设备控制 启动应用、切换页面、点击、输入、滚动、系统开关。
  • 接口验证 HTTP、SSE、WebSocket、GraphQL、Socket、邮件与文件协议。
  • 性能链路 Memrix 内存/流畅度,Framix 帧级诊断与视觉证据。
  • 媒体链路 关键帧、场景帧、音轨、裁剪、转码、拼接。
  • 编排回归 --codecfg、前后置、循环与规则文本。