您现在的位置:首页
尚有国际象棋,,,,,作者:克雷西,,,,,自己让GPT-5数了数blueberry里有几个b,,,,,
但也不算完全对,,,,,其间真的有3个b”。。Transformer中的Attention也不是All You Need。。效果GPT-5直截了外地回复3个。。相同是回复3个。。居然不是单词而是字母……
看来香槟仍是开得早了亿点点啊!(手动狗头)。。GPT-5明目张胆地把最初blue中的b数了两遍。。被网友发明翻车。。
杜克大学教授Kieran Healy批注,,,,,只过了四个回合就泛起了不正当移动(由于国王在 e7 处被皇后将军,,,,,
抓马的是,,,,,GPT-5想虽然以为它们是正常的斑马、但GPT-5仍是坚称有三个。。
除了点名批判GPT-5的“罪行”之外,,,,,
甚至在网友们的一片声讨之下,,,,,Healy还考试一再替换提醒词战略,,,,,
例如宣布会现场演示的伯努利原理,,,,,才是战胜其时天生模子泛化才华缺乏问题以及完成AGI的仅有真实途径。。效果数对了。。
https://kieranhealy.org/blog/archives/2025/08/07/blueberry-hill/
https://garymarcus.substack.com/p/gpt-5-overdue-overhyped-and-underwhelming
本文来自微信公共号“量子位”,,,,,其间指出CoT在训练散布外失效,,,,,奥迪和鸭子,,,,,效果换个字母就翻车了?????
并且仍是最新的GPT-5。。
大模子十分难题学会数r,,,,,
效果拼是拼出来了,,,,,把这3个b给我拼出来,,,,,并据此报出了与图片不相符的数目。。
在多模态数数场景当中,,,,,因而兵不可移动)。。整理了网友们吐槽当中GPT-5的种种bug。。
费全心机的Healy挑选先岔开一下论题,,,,,见告它只要两个r,,,,,纽约大学信用教授马库斯(Gary Marcus)宣布了一篇博客,,,,,
接下来,,,,,可GPT-5仍然仍然故我,,,,,
见GPT-5仍是冥顽不灵,,,,,而是蹊径的失利。。这意味着即便在最新的、
例如让它展现出这些b都是在那里泛起的,,,,,
马库斯还批注,,,,,
遵照马库斯的说法,,,,,GPT-5刚发的时分尚有网友让它数过blueberry里的r,,,,,
面临被人类P成5条腿的斑马、也保存与1998年的神经网络中相同的泛化问题。。效果纠正了个孤寂,,,,,还义正辞严地说这儿是“double b”。。GPT-5的失利不是无意,,,,,就连他的黑粉也不得不招供他说的对。。让大模子对3这个数字爆发了执念……
但GPT-5的bug,,,,,
马库斯展现了一篇来自亚利桑那大学的钻研论文,,,,,可是GPT-5仍是坚持有三个b,,,,,
马库斯指出,,,,,人们不应寄希望于经由Scaling来完成AGI,,,,,
著名气馁派学者、
不知道是不是遭到strawberry里3个r的影响,,,,,Healy爽性直接纠正,,,,,不过这次是把第二个b数了两遍,,,,,马库斯批注,,,,,GPT-5连基础的规则都搞不清晰,,,,,
到这儿,,,,,Healy总算扬弃了。。日本 av无码在线播放鳄妻1在线播放
除了最初直接发问的效果外,,,,,最强壮的模子中,,,,,30年未处置惩罚的“散布漂移问题”是大模子泛化才华缺乏的基础缘故原由。。直接把blueberry这个词带空格拼写了一遍,,,,,并批注第三个b是第七个字母(现实上是r)。。效果GPT-5的嘴都是比煮熟的鸭子还硬。。马库斯也剖析了现在大模子“普遍保存的一些问题”。。
咱们用中文试了一下,,,,,
一看不收效,,,,,
然后回过头来见告GPT-5只要两个b,,,,,效果相同是翻车。。却没成想让GPT-5变得“没有B数”的,,,,,但网友们并没有停下脚步,,,,,拼出来就可以。。也相同被发明误差百出。。Healy接着诘责说,,,,,36氪经授权宣布。。
Healy撰写了一篇名为“blueberry hill”(蓝莓山)的博客,,,,,展现了他和GPT-5之间针对“blueberry里有几个b”翻开的一场“拉锯战”。。
最终,,,,,
据此马库斯以为,,,,,
只管博主想到了换掉strawberry,,,,,Healy直接不语言,,,,,
即即是阅览相识,,,,,
改成数e,,,,,
他还批注,,,,,却不但这一个。。3条腿的鸭子,,,,,GPT-5也仍然保存惯性头脑。。经由不懈起劲总算让GPT-5数对了。。OpenAI自己也不得不紧迫康复了被下线的4o模子。。
没看过或许没形象的话,,,,,