多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯

《野猪乐园》显示文章详细内容：

happy_daddy

等级：资深长老

经验值：87736

魅力值：479

龙币：199251

积分：95109.2

注册日期：2002-12-07

多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯

多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对，但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了，错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字，认为9.11大于9.9，考虑到数字涉及的语境问题，记者将其限定为在数学语境下，如ChatGPT这样的大模型也照样答错。在这背后，大模型数学能力较差是长期存在的问题，有行业人士认为，生成式的语言模型从设计上就更像文字思维而不是数字思维。不过，针对性地语料训练或许能在未来逐步提升模型的理科能力。（第一财经日报）

--
To the world you may be one person, but to one person you may be the world.

2024-07-18 08:32:32

此文章已经被查看210次

系统提示：此篇文章由"邻友圈"客户端发送，下载邻友圈客户端>>

相关文章：

[回复] [顶端]

多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大？就此问题，第一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯-happy_daddy (903字节阅读:210次跟贴:0 2024/07/18 08:32)

您必须登录论坛才可以发表文章：

用户名：

密码：

记住密码：

（忘记密码注册）