这种在 GPT 中不能正确识别图片,说 OCR 未正确加载,是因为 GPT 中开启了代码执行(Code Interpreter & Data Analysis),当你要做 OCR 时,GPT不知道自己其实已经有了多模态读取图片的能力,硬要写代码去做 OCR,结果代码又没写对,反而无法正确识别图片中的文字。解决方案:
1. 如果是自己的GPT就关闭Code Interpreter,绝大部分场景是不需要写代码的,现在已经很鸡肋了
2. 如果你无法关闭Code Interpreter,就在提问时加一句:“不要执行代码,请用自身多模态能力识别文字”
3. 直接使用 ChatGPT, 不要用 GPT
点击图片查看原图
点击图片查看原图