未来已来？GPT-4刚上线就引发马斯克恐慌一文梳理其与3.5版本区别

来源：凤凰网

时间：2023-03-15 14:17:11

财联社3月15日讯（编辑马兰）ChatGPT公司OpenAI隔夜上线了其最新人工智能模型GPT-4，轰动了整个科技界。据OpenAI自己称，GPT-4将是该公司里程碑式的模型。

(相关资料图)

在其概念视频中，OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码，并通过图片产生文字。此外，OpenAI还承诺GPT-4相比之前的模型，包括ChatGPT此前应用的GPT-3.5，将更加安全且具协调性。

用简单的话说，GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点，变身为一个能看图说话的高级“解语花”。

然而，这朵“解语花”也点燃了不少人的焦虑，比如硅谷最著名的企业家马斯克。

他在推特平台上发文称：人类还能做什么？我们最好使用Neuralink（来对抗人工智能）！

此外，他还回复了网友关于GPT-4内测的帖子，称他个人十分关切这个新模型，也认为这个新的人工智能看起来很有意思。

但马斯克关于GPT-4和Neuralink的评论还是让不少网友觉得尴尬，不少人嘲讽他的脑机广告听起来并不吸引人。相比于人工智能机器人取代人类，在大脑里植入设备似乎更让人头皮发麻。

不过，网友们关于GPT-4领导机器人占领世界的想法也是过于杞人忧天。

正如OpenAI强调的那样，GPT-4目前仍是并不完美的模型，其能力远不如人类。GPT-4仍有许多局限性，如社会偏见、幻觉和对抗性提示。

硅谷做题家

GPT-4现在最热门的话题莫过于它强大的应试能力。根据OpenAI的评估，GPT-4已经能轻松通过美国的律师考试，且考进了前10%的排名。相比之下，它的上一代模型GPT-3.5只能吊个车尾。

除了律师考试，GPT-4还在美国大学入学测试SAT中考到710分，虽然分数不高，但已经够上美国大学录取水平。更重要的是，GPT-4能在大学的基础微积分课程中获得4的成绩（5分为满分），这证明了该模型已经掌握了高等数学大部分的概念。

网友也对它的这些做题能力进行了进一步的测试。

比如让它分析柱状图，并回答图形背后的统计学意义，或者出一道用法语描述的物理题。令人欣慰的是，它竟然没有胡言乱语，而是有条有理地给出了正确答案。

另一方面，已经升级为GPT-4模型的ChatGPT，现在已经可以通过用户的简单需求直接生成代码，甚至网站。即便用户只是在餐巾纸上画了个简单界面，GPT-4都能直接搞出一个可运行的网站。

如此好用不废话的程序员，大概是每一个产品经理心中永远的神。

量子波动速读？

更让人嫉妒的是，曾经中国爆火的“量子波动速读”竟然也在GPT-4上获得了重现。这种被机构滥用的反人类教育噱头，在非人类的人工智能上却得到了完美的诠释。

有网友将一整篇论文上传给GPT-4，然后，GPT-4就在极短时间内完成了阅读，并给出清晰的总结摘要。

甚至，如果有人问它某个图是什么意思，代表了什么意义，GPT-4也能像模像样地给出解答。

与GPT-3.5相比，GPT-4将文字输入限制提升至2.5万字，这让其阅读体量大大增加，也让用户的文书处理工作变得更加简洁。

此外，强大的识图能力和显著提高的回答准确性，也保证了GPT-4在文字处理上的优越性，相较于GPT-3.5的答不上来就乱编，已经出现了长足的进步。

破解冷笑话

如果说昨天的ChatGPT还是一个不解人意的“老古董”，那么今天的ChatGPT就已经可以轻松理解网友心照不宣的冷笑话，即便是表情包，它也能说个子丑寅卯来。

比如鸡米花拼成的世界地图，ChatGPT就轻松回答出了网友想要的答案：这是个玩笑，用鸡米花和世界地图两个不相干的东西形成一种幽默。

虽然识图这一功能在人工智能领域并不罕见，谷歌搜索甚至连淘宝都具备识图功能，但这一功能还是首次亮相于ChatGPT。

而除了简单的识图之外，更可贵的是，ChatGPT现在还能解释图像的具体意义，并理解图像背后的隐喻含义，这在其他识图人工智能上仍十分罕见。

可惜的是，目前图像输入的功能仍只是预览阶段，还不能使用，即便是氪金玩家现在也只能按捺住好奇心。

Cosplay“受害者”

早在ChatGPT出来的时候，网友们就热衷于让人工智能玩角色扮演的游戏。什么假设你是一个财经编辑啦，假设你是一个程序员啦，假设你是小说家啦……总之，网友想到什么，ChatGPT就被迫成为什么。

而现在，这样的花活居然被OpenAI官方带头认可。

相比于GPT-3.5时期，现在鸟枪换炮的ChatGPT不再用一本正经的语气规劝网友，类似于“我只是个人工智能，我无法……”的表达，现在都用更具个性化的话替代。

OpenAI要求GPT-4拿出服务精神。既然用户希望得到一个定制的GPT-4，那么GPT-4就要表现出相应的人物性格和态度。

缺憾仍在

根据OpenAI的内部测试，GPT-4仍有GPT-3.5的老毛病，就是胡言乱语。专业地讲，GPT-4仍会产生幻觉，生产错误答案，并出现推理错误。

总的来说，GPT-4已经显著减轻了幻觉问题，在这一项上，GPT-4的分数比GPT-3.5要高出40%。但这可能也意味着GPT-4的乱讲话可能更隐蔽，更难以被用户察觉。

另一方面，GPT-4仍缺乏对数据截至日期后新进展的了解能力，即其无法在训练学习后，追踪新的信息来补足对某件事认知。此外，它也无法从经验中学习，并可能一直轻信人类。

在安全边界上面，GPT-4也得到了相应的加强，与GPT-3.5相比，它对违禁内容的回复率下降了82%，对敏感内容（如医疗建议）的响应率则提高了29%。

还有一个不太友好的地方在于，GPT-4的使用目前仅对ChatGPT Plus玩家开放，换句话说，需要付费。

目前OpenAI对GPT-4的训练规模、硬件、算力等一切保持缄默，只说会在未来陆续公布，可谓是吊足了外部观众的胃口。

不过，瑕不掩瑜，截至目前，科技人士对GPT-4的评估仍持正面态度。更多的人则在说：未来已来，迎接新世界吧。

关键词：

延伸阅读:

火速变现微软开始在ChatGPT聊天中插广告 2023-03-30
全球播报:美参议员反对封禁TikTok：不喜欢别用宪法没有赋予封禁权 2023-03-30
一枚超2亿元的腕表背后：“表王”百达翡丽的危机 2023-03-29
环球看点！3亿个工作将被ChatGPT取代更要担心的却不是失业 2023-03-29
当前聚焦：赛博难民打响反AI第一枪 2023-03-29
天天实时：谁在取代老干妈？ 2023-03-29
天天新资讯：你现在听的歌很可能是AI唱的 2023-03-29
每日速看!快手CEO程一笑：生成式AI与业务场景融合价值潜力大 2023-03-29

版权声明：
凡注明来网络消费网的作品，版权均属网络消费网所有，未经授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的，应在授权范围内使用，并注明"来源：网络消费网"。违反上述声明者，本网将追究其相关法律责任。
除来源署名为网络消费网稿件外，其他所转载内容之原创性、真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考并自行核实。

热文