欢迎来到区块链早报官方网站!
首页>>观点 > 正文

竞品还在追赶,OpenAI 用 GPT-4 飚赢自己

区块链早报 发布时间:2023-03-16 12:06:49 OpenAIGPT-4
热度:199℃

赶在百度“文心一言”发布前一天,OpenAI祭出了GPT-4,这对于百度、谷歌们来说,可能是一个重大打击。

人们已经领略过GPT-3.5加持下的ChatGPT,但GPT-4比“前辈”更强大,它具有更高的可靠性和准确性,能够读懂图片,甚至还能角色扮演。目前,GPT-4已被应用到ChatGPT和Bing上,再一次刷新外界对AI的能力认知。

GPT-4越耀眼,谷歌、百度等竞争对手们便越焦虑。毕竟,其他公司忙着对标GPT-3.5时,OpenAI快速将大模型升级为GPT-4,一骑绝尘的样子丝毫“不讲武德”,像一个孤独求败的杀手,眼望着挑战者的到来。


GPT-4打败GPT-3.5


知名KOL和菜头说,因为OpenAI在3月15日凌晨发布了GPT-4,他和他的一些老朋友都没睡好,微信里的消息提示此起彼伏,“感觉像是回到了乔布斯还在世的时候,大家相约线上看苹果发布会的那些夜晚。”

北京时间3月15日凌晨,GPT-4发布受万众瞩目,这是采用GPT-3.5的ChatGPT火爆后的必然结果。看客们想要知道,它比GPT-3.5到底强多少?人们甚至没有兴趣拿它来对比别的同类产品,因为能站在同一起跑线上与之对比的还没有出现。

OpenAI很了解围观者的胃口,在那场更像是产品演示的发布会里,开发者一上来就让GPT-3.5和GPT-4分别尝试回答同样的问题。结果,熬夜的人没白等。

一开始,OpenAI的开发者复制了一篇博客文章,并交给了GPT-3.5,让它进行总结,要求是每个单词都要以“G”开头。结果GPT-3.5直接选择了放弃。轮到GPT-4,它快速地给出了答案,完全符合要求。随后,开发者又让它尝试以字母“A”开头回答同样的问题,GPT-4又做到了。

这还没完,如同提升“节目效果”一样,开发者直接和Discord社群互动起来,选取了网友提出的字母“Q”。再来一遍,GPT-4依然轻松拿捏。

这轮演示,OpenAI特地选取了一个超过GPT-3.5“阈值”的问题来测试,意在表现GPT-4的能力进化水平。正如官方所解释的,在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙,当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指令。

为了全面且可视化地评估GPT-4的能力提升程度,OpenAI展示了它与GPT-3.5共同参与了多项模拟考试的情况,包括统一律师资格考试、研究生入学考试、医学知识自测、艺术史、微积分等等,结果GPT-4几乎碾压了GPT-3.5。比如,在模拟律师考试中,GPT-4的分数在应试者的前10%左右,而GPT-3.5 的得分排在倒数10%左右。

各项考试中GPT-4领先GPT-3.5

如同苹果发布会每次都会带来一个大彩蛋,GPT-4也带来了一项跨越式的功能——接受视觉输入。这意味着,GPT-4能够看懂图片了。

官方解释:GPT-4在给定由散布的文本和图像组成的输入的情况下,可生成文本输出(自然语言、代码等)。换言之,给它一张带有文字的图片,并提出要求,它就能给出想要的结果。

在演示中,开发者画了一张网站的草图,要求GPT-4用简短的 HTML/JS 将这个草图变成彩色的网站。仅仅几秒钟后,GPT-4就带来了一个完整的网页。

不仅如此,GPT-4还能尝试理解一些流行的“梗图”。如下图所示,让它解释这张图的笑点在哪,GPT-4不但Get到了,还一本正经地解释了一通。

GPT-4解释“梗图”的笑点

GPT-4的识图功能只有体验过才能知道是否如OpenAI说得这么厉害。遗憾的是,目前视觉输入还没有完全开放,仅在一小部分开发者中进行测试。OpenAI创始人Sam Altman解释称,此举是为了防止可能出现的安全性和伦理问题。

GPT-4还有一项特别本领,它可以扮演不同的角色和说话的方式,这与具有固定语气和风格的GPT-3.5不同。基于这个功能,用户可以让GPT-4实现角色扮演并定制它的性格。

就像当年的一代代新款iPhone给人们带来惊奇感受,GPT-4展现了比它的上一代更强大的能力。不过,它也并不完美。与GPT-3.5一样,GPT-4有时仍会虚构事实,“一本正经地胡说八道”还不能完全避免。OpenAI宣称,在内部对抗性真实性评估中,GPT-4的得分比GPT-3.5高40%,显然,它还有很大的提升空间。


谷歌、百度更焦虑了


OpenAI正和当初的苹果走在一样的道路上:成为引领者,并在别人苦苦追赶时,又猛地拉开一大截。

就在GPT-4发布前,互联网巨头谷歌也在YouTube上发布了一支预告片,宣布将AI整合到Gmail电子邮件和GoogleDocs文档等办公应用中。谷歌在视频中费了很大力气展示相关功能,告诉人们可以在文件中进行头脑风暴、校对、写作和改写;利用幻灯片中自动生成的图片、音频和视频,将创意构想变为现实等。

然而,“一点水花都没有,几个小时之后GPT-4开发布会,人一下子就全跑光了。”和菜头如此描述他的观察。从社交网络上舆论风向看,谷歌的AI新动作被铺天盖地的GPT-4消息所淹没——无论是海外的推特还是国内的微博,GPT-4都登上了热搜榜。

和谷歌一样被冷落的AI玩家还有Meta。不久前,Meta公布了旗下全新的AI大型语言模型LLaMA,宣称可帮助研究人员降低生成式AI工具可能带来的“偏见、有毒评论、产生错误信息的可能性”等问题。Meta还放话,这一大模型仅用约1/10的参数规模,就能匹敌OpenAI GPT-3、谷歌PaLM等主流大模型的性能表现。这一新动态在GPT-4到来后,没有在舆论场上再露脸。

OpenAI的光芒越盛,其他科技巨头们就越焦虑。

2月,仓促应战ChatGPT的谷歌还闹出过笑话,其开发的聊天机器人Bard首秀“翻车”,答错问题导致其市值一天之内蒸发约1000亿美元。

在国内,百度也在加急研发与ChatGPT类似的聊天机器人“文心一言”。按照预告,百度将在今天下午举办有关文心一言的新闻发布会。在许多人也许还在好奇文心一言能否比肩GPT-3.5模型下的ChatGPT,结果,OpenAI赶在百度发布会前带来了更强大的GPT-4。

别人忙着对标GPT-3.5时,OpenAI如同冷血杀手一般,亲手击败了自己出品的GPT-3.5。同类竞争公司们有多焦虑,网友们已经自行脑补出了各种“梗图”。

“那种提刀在手,环顾天下,寂寞如雪的感觉,让我忍不住感慨:即便在美国本土,这件事也和绝大多数美国科技公司无关了。”和菜头形容,OpenAI迭代的速度让他感觉到心惊肉跳,“所有试图追赶的人和公司,目前落后进度最少两年。在这种AI爆发式增长的时代,两年就是三辈子。”

回顾GPT的发展,它用5年时间里完成了从量变到质变的飞跃。2018年,GPT-1首次发布,当时的模型参数只有1.17亿个,随后的GPT-2将标准提高到15亿个参数,GPT-3和GPT-3.5的神经网络直接提升到1750亿个参数,而到了GPT-4,采用的参数超过2000亿个,并利用了超过200万个数据源(GPT-3.5使用了45万个数据源),包括互联网上的各种文本、图像、音频和视频数据。

相比之下,2022年初谷歌曾披露其LaMDA 模型参数为1370亿个,不如当时的GPT-3多。而据百度透露,文心一言大模型参数规模达到2600亿,相比GPT-4更多,这或许还能让它留给人们一些期待。

不过,有专家指出,模型参数并不是决定AI聊天机器人能力的绝对因素,在此基础上,对数据的清洗和标注、模型结构设计、训练推理的技术积累都会决定最终产品的表现。

GPT-4甚至不用担心产品化了,它已经应用于ChatGPT和微软的搜索引擎必应(Bing)上。一骑绝尘后,尘土里若隐若现着谷歌和百度。


标签:OpenAIGPT-4

热门文章

  • 上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO
    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    上车交易所平台币最后的机会!QKEx平台币将于UTC+8时间11月8日12:00开启平台币最后一轮IDO

    QKEx是QK集团于2020年开始自主研发的全球化加密资产综合服务平台,包含现货、合约、理财、算力挖矿等多板块业务;QKEX首创CommunalFI的行业全新概念,计划实现社区行为经济上链,打造去中心化社区经济及交易生态。 据官方消息,QKEx将于UTC+8时间11月8日12:00开启平台币最后一轮IDO,官方对外显示第三轮IDO价...

  • 链盈AI——引领金融智能化的未来
    链盈AI——引领金融智能化的未来

    链盈AI——引领金融智能化的未来

    在数字资产市场快速崛起的背景下,链盈A1 (Chain Profit DeepSeek)为全球投资者提供了全新的智能化量化交易与资产管理平台在数字资产市场快速崛起的背景下,链盈A1 (Chain Profit DeepSeek) 依托Numerai万亿级AI对冲基金算法框架与DeepSeek-R1超维推理引擎,为全球投资者打造了首个联邦式AI+区块链量化平台。通过300+全球AI...

  • 41000元大奖诞生!Envo 幸运广场首个一等奖开出,生态热度再飙新高
    41000元大奖诞生!Envo 幸运广场首个一等奖开出,生态热度再飙新高

    41000元大奖诞生!Envo 幸运广场首个一等奖开出,生态热度再飙新高

    据悉,Web3 社交平台 Envo内的“幸运广场”模块于今日首次开出 一等奖大奖,单笔奖金高达 624.72 DND(约合人民币 41,000 元),再次点燃市场关注。这是 Envo 幸运广场自两个月前上线以来的首个一等奖。此前最高记录为一位用户获得的 456.45 DND,而本次中奖金额直接刷新平台历史纪录,成为 Web3 圈热议焦点。...

  • BENQI推出全新UI,支持低门槛验证者部署
    BENQI推出全新UI,支持低门槛验证者部署

    BENQI推出全新UI,支持低门槛验证者部署

    Avalanche生态协议BENQI正式发布新UI,整合流动质押、借贷及验证者平台IGNITE,支持一键运行主网验证者。全新UI界面统一呈现BENQI的三大核心服务模块:Liquid Staking、Lending及验证者工具IGNITE,用户可通过一个入口快速访问质押、借贷和主网验证者部署功能。亮点包括:●PAYG模式:每周仅需4 AVAX即可租用2000AVAX 验证者...

  • 链盈AI 3.0全球首发盛典圆满落幕 开启智能金融新纪元
    链盈AI 3.0全球首发盛典圆满落幕 开启智能金融新纪元

    链盈AI 3.0全球首发盛典圆满落幕 开启智能金融新纪元

    2025年4月27日,香港——链盈科技(Chain Profit DeepSeek)主办的"链盈AI 3.0全球首发盛典·中国站"在香港圆满举行。本次盛会汇聚200余位行业精英,包括中国区核心社区成员、战略合作伙伴及美国AI量化平台Numerai代表,共同见证DApp 3.0的震撼发布与链盈全球化战略的全面升级,链盈AI 3.0将率先应用于供应链金融...

  • Envo CTO专访:代码之外,皆是星辰大海
    Envo CTO专访:代码之外,皆是星辰大海

    Envo CTO专访:代码之外,皆是星辰大海

    在Web3发展步入深水区的当下,从“概念过热”到“落地求真”,真正具备系统性构建能力的平台逐渐脱颖而出。作为其中的佼佼者,Envo不仅以持续的产品创新与生态扩张赢得市场关注,更在用户体验、代币经济、技术架构等多个层面不断刷新行业标准。近日,Benzinga、环球邮报、罗马日报等世界知名媒体就“Web3平台的未来形...

  • CyberCrowdChain(CCROWD)将于1月17日上线HTX
    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    CyberCrowdChain(CCROWD)将于1月17日上线HTX

    据官方消息,CyberCrowdChain(CCROWD)将于1月17日上线HTX,存款将于1月13日13:00开放,在存款量满足市场需求时开放CCROWD/USDT现货交易对。据悉,CyberCrowdChain是一种基于以太坊的代币,它继承了传统加密货币的安全性和透明性,并融合了人工智能,为资产表示和交易过程带来更高的可信度和创新性。CCROWD目前已上线Polon...

  • DIYI交易所引领加密货币新潮流,打造全球顶级数字资产交易平台
    DIYI交易所引领加密货币新潮流,打造全球顶级数字资产交易平台

    DIYI交易所引领加密货币新潮流,打造全球顶级数字资产交易平台

    据相关消息报道,2024年2月16日,全球——由银行金融投资家沈龙领衔,联手帝亿资本及顶尖区块链团队打造的下一代加密货币交易所「DIYI」宣布启动。该项目以“People’s Exchange”为核心定位,聚焦现实资产代币化(RWA)、NFT-Fi创新、去中心化治理与全球化社区生态,致力于打造对标酷币(KuCoin)的千亿级交易平台,...

  • 理财新选择,托菲斯打造 Bitcoin 价值增值共享平台
    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    理财新选择,托菲斯打造 Bitcoin 价值增值共享平台

    据官方消息报道,托菲斯正式发布其全新挖矿理财服务,为广大用户提供Bitcoin价值增值的共享平台。作为业界领先的大型 Bitcoin 矿机企业,托菲斯以其雄厚的实力和卓越的技术,在挖矿领域独树一帜。凭借专业的技术团队和深厚的行业经验,托菲斯创新推出挖矿收益与存币生息双重收益模式,一方面,托菲斯支持三十余种主...

  • 一个三线小城生意人的“逆袭”:当Web3社交代币遇上长期主义
    一个三线小城生意人的“逆袭”:当Web3社交代币遇上长期主义

    一个三线小城生意人的“逆袭”:当Web3社交代币遇上长期主义

    去年此时,我的朋友老张——一个在山东临沂经营五金店近二十年的小生意人,做了一件让所有熟人都觉得“疯狂”的事:他将半数积蓄换成了名为DND的代币,并将其质押在名为Envo的Web3社交平台中。如今,这笔不到3万美元的投资已悄然增值至10万美元,成为他“理财生涯中最成功的决策”。而这一故事的背后,不仅是一个普通人的财...

观点

更多 >
  • 三位创始人圆桌亮相,KulaDAO 再掀热潮
    三位创始人圆桌亮相,KulaDAO 再掀热潮

    4 月 22 日,KulaDAO 三位联合创始人将首次同台出席由Crypto Town Hall主办的X Space圆桌对话,与 Scott Melker、Mario Nawfal 共议 Kula 的发展蓝图。这不仅是项目的全球展示窗口,更是 RWA 治理迈入新阶段的重要信号。📅时间: 4 月 22 日10:15 PM(UTC+8)自 2025 年 4 月 15 日上线 MEXC、Coins.xyz 与 Coin...

  • 腾讯会议做不到的五件事,Envo正在实现
    腾讯会议做不到的五件事,Envo正在实现

    2025年4月2日,“腾讯会议崩了”登上微博热搜。大规模用户在线会议中断,引发行业对中心化协作工具可靠性的再度讨论。类似的问题,近年来在多款会议软件中屡见不鲜:卡顿、掉线、封会,甚至数据泄露。而在另一条技术路径上,Web3社交平台 Envo 正在用全新的技术架构与经济模型,重构线上会议的底层逻辑。它的会议系统不仅解...

观点Envo CTO专访:代码之外,皆是星辰大海
观点Numerai与Chain Profit DeepSeek达成战略合作,共同推动智能投资的未来
观点JAE Coin: 让你的投资与未来政治领袖同行
观点蚂蚁原副总裁漆远创业公司被曝all in大模型,原方向AI制药不做了
观点百度文心一言潜藏风险,AI视频素材来源不明,创作者或陷版权风暴