site stats
#AI开源项目推荐:Vary一套视觉感知上限极高的通用多模态框架:Vary有多模态能力,并且可以做 OCR 和公式识别。底层是基于LLaVA 和 Qwen(通义千问)测试了一下,中英文 OCR 识别准确率相当高,公式识别也很不错,测试了一篇文章里的公式,只有一个地方把 g 认成了 σ ,其他都对了。…
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多