飞书 CLI 开源了:AI Agent 时代,命令行工具为何重获青睐

2026年3月30日

89

853

飞书 CLI 开源了:AI Agent 时代,命令行工具为何重获青睐

最近一段时间,科技圈出现了一个有趣的现象:各大产品正在竞相开源自己的命令行工具。飞书刚刚发布了 lark-cli,让 AI Agent 可以直接操作飞书的各种功能——发消息、查日历、写文档、建多维表格、发邮件、管理任务。无独有偶,三周前 Google 也开源了 gws,用于操作 Google Workspace。2026 年了,几乎所有想接入 AI Agent 的产品都在做 CLI。

概述

CLI(Command Line Interface)就是你在电脑上打开一个终端窗口,敲一行命令,电脑帮你干活。比如查今天的日程,不用打开 App 找半天,敲一行命令就能列出结果。没有按钮、没有图标、没有花哨的界面。 AI Agent 要干活,必须具备操作工具的能力。让你帮订会议室,它需要能访问日历系统;让它帮你整理客户数据,它需要能读写表格;让它帮你部署代码,它需要能跑部署命令。API 也能完成这些工作,但 CLI 有一个 API 不具备的核心优势:它是自描述的。

什么是 CLI,为什么 AI Agent 需要它

第一个优势是自描述性。AI 遇到一个陌生的 CLI,运行 --help 就能知道它有哪些能力、怎么使用、参数如何填写。而 API 则需要先拿到文档、弄清楚端点、搞懂认证方式才能动手。CLI 自带说明书,AI 拿来就能用。 第二个优势是文本交互的天然适配。CLI 的输入输出都是文本,而 AI 最擅长的就是处理文字。反观操作 GUI,需要截图、用视觉模型识别按钮位置、再模拟鼠标点击,一行命令能搞定的事被拆成四步,每步都可能出错。对 AI 来说,CLI 是最顺手的操作界面。 第三个优势是低出错率。由于输入输出明确、可预测,CLI 操作的稳定性远高于模拟人类点击图形界面的方式。

CLI 是手,MCP 是另一种手,技能是肌肉记忆。

“技术观察”

CLI 的三大核心优势

让 AI Agent 操作外部服务,目前主流有三种方式:MCP、CLI 和技能(Skills)。它们不是互相替代的关系,而是各司其职。 CLI 是实际执行任务的工具。安装之后,终端里就能跑命令,查日历、发消息、建表格,这些都靠 CLI 来完成。 MCP 则不同,它是提前把工具清单注册给 AI,AI 可以随时调用。但这些清单常驻在上下文窗口中(可以理解为 AI 的"工作记忆",空间有限),即使 AI 暂时不需要某个工具,它的描述也占着位置。CLI 则随用随取,不占用上下文。 技能更像是给 Agent 看的说明书。它本身不执行任务,但告诉 Agent 这个 CLI 有哪些命令、什么场景该用什么参数、出错了怎么处理。没有技能文件,Agent 也能用 CLI,通过 --help 自己摸索。有了技能文件,Agent 一上来就知道该怎么操作,成功率高得多。 简单来说:CLI 是手,MCP 是另一种手,技能是肌肉记忆。飞书这次开源的项目,CLI 和技能文件都一并提供。

CLI 与 MCP、技能的分工

如果要为 AI 设计一个好的 CLI,以下几点值得参考。 help 文本是最重要的文档。AI 碰到不认识的 CLI,第一件事就是运行 --help。这个帮助信息就是工具说明书、参数规格、使用指南的三合一。不要只写一个简单的用法说明就完事,要把每个参数干什么、什么时候用、有什么默认值都写清楚。飞书 CLI 还有一个 schema 命令,可以快速查询任何 API 方法的参数、请求体、响应结构等信息。 支持 dry-run 是为 AI 设计的安全网。AI 会自己做决策,有时候可能理解错了意图,或者匹配到了不该操作的数据。dry-run 相当于一个预览机制——AI 会先跑一遍,返回类似这样的结果:"将要删除以下 47 条记录,未做任何实际修改。"你确认没问题后,再让它真正执行。Google 的 gws 甚至在技能文件里写死了一条规则:所有写入和删除操作必须先 dry-run。 错误信息要能指导下一步操作。人看到 Permission denied 会自己去查文档,但 AI 看到这条信息就卡住了。好的 CLI 应该告诉 AI 缺了什么权限,并把申请权限的命令直接给出来。

如有侵权,请联系删除。

Related Articles

联系我们 预约演示
小墨 AI