
2025年到2026年间,顶级AI公司接踵发布了一类居品:CLI模式的Agent器用。
Anthropic发布了ClaudeCode,一个在终局里开动的AI编程助手。OpenAI发布了CodexCLI,Google发布了GeminiCLI。这一波海浪中,险些每家值得温和的AI公司王人押注了敕令行。
这很反直观。敕令行是1970年代的产物,GUI的出现让计较机走入巨匠,当今转移互联网让触屏操作成为默许。按照时常的逻辑,技艺的标的应该是越来越「可视化」、越来越「易用」。为什么在AI期间,最陈腐的交互体式反而卷土重来?
谜底不是情感,是工程逻辑。
GUI对AI并不友好
GUI是为东谈主类视觉导航蓄意的。按钮、弹窗、拖拽、悬停截止——这些交互范式开荒在东谈主类的视觉直观上。东谈主类看一眼界面,扫描按钮位置,凭直观判断下一步操作。这套机制对东谈主类来说极其当然,险些不需要学习资本。
但LLM的责任模样根柢不是这么。LLM的输入是token,输出亦然token。它的「想考」在话语空间里发生,而不是在像素空间里。
让AI操控GUI,意味着要杰出一起无边的边界:
蚁集资本极高。AI需要借助计较机视觉或AccessibilityTree来「看懂」界面——哪个按钮可点、哪个输入框在那儿、现时弹窗是什么真理。这不是AI的坚强,反而是格外职守。
情状隐式且不能瞻望。合并个按钮,开云体育世界杯中国官网首页今天可点,翌日可能因为某个条款变灰。这种隐式情状对东谈主类来说是「高下文」,对AI来说是不祥情趣——它无法可靠地推理「这个操作在什么条款下可用」。
操作不能组合。莫得认识把两个GUI操作用管谈连起来。「搜索截止→过滤→导出」在GUI里是三次点击,莫得认识当作一个举座传递、复用或自动化。
难以测试和考据。AI本质了一个GUI操作,怎样说明它顺利了?要截图、要领路界面情状,总共这个词响应轮回又慢又脆。
比拟之下,CLI的每个特质王人像是特地为AI蓄意的。
CLI对AIAgent的三大上风
可组合性
Unix形而上学的中枢是:「每个顺次只作念一件事,并把它作念好;退顺次梗概协同责任」。
这个几十年前的蓄意原则,在AI期间欢叫出新的真理真理。
对AIAgent来说,开云体育可组合性意味着不错把多个敕令邻接成复杂的多法子责任流,每一步的输出王人是结构化的文本,不错被下一步耗尽。莫得GUI的「点击→恭候→截图→领路」轮回,只须干净的输入输出。
可瞻望性
这对AI极其拦截。AI在推理一个器用时,需要开荒一个心智模子:这个器用的输入是什么,输出是什么,有什么反作用。GUI的隐式情状让这个心智模子充满不祥情趣。CLI的显式参数让这个心智模子可靠而精准。
可审计性
总共CLI操作王人是可纪录的文本序列。AI本质了什么敕令、得到了什么输出,王人是东谈主类可读的文本。
这种透明性有两个自制。
对东谈主类:不错作念过后审查。你不错稽察AI开动了哪些敕令、每步的输入输出是什么,总共这个词推理链路一目了然。GUI操作的「点了什么」很难被追想,CLI操作的日记自然即是审计纪录。
更宏不雅的趋势
ClaudeCode选拔优先发布CLI模式而不是IDE插件,这个决定背后有明显的工程逻辑:IDE插件受限于宿主环境,CLI器用不错在职何有终局的地点开动,不错被任何Agent调用,不错和任何其他器用组合。
这揭示了一个更根柢的划定:AIAgent调用器用的内容,即是在本质敕令。器用调用(functioncall/tooluse)从语义上即是CLI——给命称号和参数,复返截止。CLI器用自然即是Agent不错调用的函数,不需要任何调理层。
「TerminalasthenewIDE」这个说法早在AI兴起之前就有东谈主提过,但在AI期间它赢得了全新的含义。不仅仅「在终局里写代码」,而是「Agent通过终局与天下交互」。
夙昔,CLI是技艺东谈主员的专属器用。异日,CLI可能会成为Agent的通用话语——东谈主类通过当然话语和Agent对话,Agent通过CLI和系统交互。
小结
GUI的地位不会受到太大影响,它仍然是东谈主类径直操作计较机的最好界面。但当你的AI器用需要调用另一个器用时开云体育,CLI是最当然的桥梁,会有更多的软件为了适合Agent民风推出更多的CLI器用。
上一篇:开云体育 天下杯夯拉榜|姆巴佩一战冲破两项记录, 英超名将踢惬心足球
下一篇:没有了