《野猪乐园》显示文章详细内容: [展开] [回复] [网址] [举报] [屏蔽]
happy_daddy
happy_daddy目前处于离线状态
等    级:资深长老
经 验 值:85657
魅 力 值:479
龙    币:188843
积    分:91155.2
注册日期:2002-12-07
 
  查看happy_daddy个人资料   给happy_daddy发悄悄话   将happy_daddy加入好友   搜索happy_daddy所有发表过的文章   给happy_daddy发送电子邮件      

多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯
多家大模型测不出9.11和9.9哪个大 9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。

大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文字思维而不是数字思维。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。(第一财经日报)

--
To the world you may be one person, but to one person you may be the world.
2024-07-18 08:32:32   此文章已经被查看51次    系统提示:此篇文章由"邻友圈"客户端发送,下载邻友圈客户端>>
 相关文章: [回复]  [顶端] 



  您必须登录论坛才可以发表文章:
 
用户名:   密码:   记住密码:    (忘记密码 注册




版权所有 回龙观社区网 经营许可证编号:京B2-20201639 昌公网安备1101140035号

举报电话:010-86468600-5 举报邮箱: