site stats
Ferret-UI:苹果开发出能“看懂”手机屏幕上并能执行任务的多模态模型它将移动UI的视觉元素和语言元素结合起来,不仅能“看懂”屏幕上的内容,还能理解用户的指令和问题,进而执行任务或提供信息。Ferret-UI的能力不止于看和识别,它还能进行推理。…
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多