这个测试很有意思:让 Gemini 1.5 Pro 和 GPT-4o 做高考数学题中的选择题填空题,这部分题目满分是 73 分,结果 Gemini 得了 39 分,GPT-4 o 得了 31 分。
Gemini 1.5 Pro得分细目:
- 单项选择题:8题中答对6题,得30分,第6题和第8题答错
- 多项选择题:第10题得4分
- 填空题:第12题得5分
ChatGPT-4o得分细目:得了73分中的31分
- 单项选择题:8题中答对5题,得25分,第2题、第4题和第6题答错
- 多项选择题:第10题得6分
- 填空题:0分
使用的提示词:https://t.co/ZefFANRykV
有条件的可以测试一下其他模型结果如何