读写分离是实现computer use的更好方式
有网友认为Claude computer use这样的方式不好,更好的做法是调API。
我认为,综合而言,computer use是最好的方式,更是最容易大规模落地的方式。因为这样的方式能最好的利用大量存量软件的设计成果。不仅是因为当前大量软件功能没有API,还因为:
1、GUI是对软件交互的约束和对工作流的体现,API文档缺失这些信息,也很不容易表达。调API有更高的自由度,但过高的自由度也带来严重的不可控;
2、普通用户不能理解API,基于GUI才能实现人机协同。
但computer use这样的方式也很不完美,一种更好的方式我认为是读写分离,即通过API去完成读操作,通过GUI去完成写操作。举个简单的例子,搜商品当然不一定要傻傻的打开Amazon,直接调API就可以了,但下单最好打开下单页让用户确认。