在线mt4交易平台以阿里千问和讯飞星火为代表克日,复旦大学 NLP(自然措辞收拾)实习室 LLMEVAL 团队颁布了 2024 年高考数学大模子评测的结果。正在此次评测中,阿里千问和讯飞星火差别得到了 2024 高考数学新 I 卷的第一名和第二名,以及高考数学新 II 卷的第二名和第一名,两份考卷的评测中,GPT-4o 均列第三名。
复旦 NLP 团队以为,全新出炉的高考查题具备高度的独创性和保密性,是用来评测大模子的绝好评测齐集。正在新 Ⅰ 卷中,阿里千问和讯飞星火对 14 道数学客观题确切切率抵达 70% 以上,大幅领先 GPT-4o 的 57%,字节豆包、智谱清言、百川等大模子紧随其后,确切率超出 50%,百度文心一言、腾讯元宝、Kimi 等大模子确切率较低。而正在正在新 Ⅱ 卷的评测中,讯飞星火、阿里千问、GPT-4o 确切率均超出 60%,其他大模子的差异较小,除百川、DeepSeek 和海螺以外,确切率均正在 50% 以上。
数学才华是 GPT-4o 无间以后引认为傲的才华模块,OpenAI 正在 5 月 14 日的颁布会上推出大措辞模子 GPT-4o 时,曾中心演示其数学才华。
正在现场演示中,GPT-4o 诈骗其及时的图像识别和语音才华举办正在线教学。从评测结果能够看出,阿里千问和讯飞星火对数常识题的深切剖判和阐明才华仍然超出 GPT-4o,使其正在高考数学试题的解答上具有更高确切切率。有网友展现,做数学题真相仍旧咱中邦人的拿手。
以阿里千问和讯飞星火为代外,邦产人工智能大模子正在数学范围的精巧才华,为来日人工智能本事正在教诲范围的使用供应了有力救援。
转载请注明出处。