新浪科技

ChatGPT 阴影之下的谷歌 Bard 实测:珠玉在前

IT之家

关注

先笑一下,谷歌自己开发的人工智能工具,居然主张分拆谷歌阻止垄断?在反垄断的问题上,谷歌刚刚开放公测的生成式 AI Bard 相当地大义灭亲。

本周二,谷歌宣布生成式 AI Bard 推出 Beta 测试版,逐步分批向注册的公众开放测试。但目前只面向美国和英国用户开放公测,而且暂时只支持英语。其他地区与语言的用户,需要等待 Bard 的后续更新。

虽然谷歌有着横跨诸多领域的漫长产品线,但 Bard 无疑是近年来最受关注也是最为重要的新品,更直接关系到未来几年谷歌的竞争力和市场前景。尽管谷歌 2 月初就已经公开展示 Bard,但并没有开放公测,而是只向谷歌员工以及少数受邀的可信测试者开放内测。

2 月初谷歌在展示 Bard 的过程中,出现了一个事实性错误(对韦伯天文望远镜的基础知识介绍错误)。尽管这个小错误相当专业,只有天文爱好者才能发现,但却依然拖累谷歌母公司股价大跌 8%,一天时间市值蒸发了 1000 亿美元。

或许因为这个前车之鉴,谷歌高层对 Bard 的公测保持着非常谨慎的态度。在在开放公测之后,谷歌 CEO 皮查伊周二向员工发布内部备忘录称,“我们已经采取了负责的态度进行研发,包括邀请了不同背景和立场的 1 万名可信人士进行测试,我们也欢迎所有的反馈,从中学习,不断迭代和改善。”

看起来,皮查伊是在给 Bard 可能的纰漏打预防针。“即便在所有这些进展之后,我们依然处在漫长 AI 征途的起步阶段。随着越来越多的人开始使用 Bard 和测试性能,他们会给我带来惊奇,可能会出现问题。”

与此同时,谷歌也在淡化生成式 AI 对自己搜索业务的冲击,强调 Bard 并不是搜索引擎的取代产品,而是一个补充辅助。值得一提的是,Bard 是单独的网页对话框,而不是作为谷歌搜索工具,但在回答之后会提供一个谷歌搜索按键。

过去三个多月,科技行业最火的产品无疑是 ChatGPT。OpenAI 打造的这款生成式 AI 产品发布之后火遍全球,让用户感受到了前所未有的智能体验,更直接带动了下一个科技风口,甚至卷到中国互联网创投圈。

另一方面,互联网巨头微软不断加码战略投资 OpenAI,将其牢牢绑在自己的 Azure 云平台上,在 ChatGPT 大火之后顺势接入自己的办公组件以及必应搜索,将 AI 定为自己产品的核心竞争力,又一次向占据搜索市场主导地位的谷歌发起冲击。

这股 ChatGPT 热潮的背后,最尴尬的莫过于行业巨头谷歌。尽管谷歌早在 2015 年就开始研发生成式 AI,在 2021 年就发布了对话应用语言模式 LaMDA,但一直在内部稳步研发。

去年 6 月,一位谷歌 AI 工程师号称 LaMDA 已经具有人类情感,虽然谷歌很快就将他调离工作岗位,但此事被媒体曝光之后,还是引发了不小的争议和猜测,更让谷歌对 AI 安全性保持谨慎,不愿仓促推出。

ChatGPT 去年发布之后,AI 项目负责人迪恩(Jeff Dean)在内部会议上表示,虽然谷歌也有类似的 AI 工具,但目前技术还不成熟,如果过于仓促推出产品,可能会影响谷歌的声誉,因为用户非常相信谷歌提供的信息。

然而,谷歌现在却不得不加快研发步伐,追赶竞争对手的产品。这并不是谷歌习惯的节奏。去年 12 月,谷歌将生成式 AI 的产品级别提升到最高的红色,协调公司内部 AI 研发资源,加快推出自己的应对产品。

实际上,谷歌在 Bard 的推进步伐上左右为难。如果研发动作迟缓,外界会担忧谷歌的竞争实力和行业前景,拖累股价低迷不振;但如果推进过于仓促,外界更会对 Bard 出现的纰漏感到失望,打压股价跌跌不休。这或许是皮查伊在 Bard 公测时频频打预防针的主要原因。

那么,Bard 的实际使用表现如何呢?

相比 ChatGPT,Bard 的最大优势是巨大的信息资源,他们可以依托谷歌的搜索工具获取最新信息,根据自己的梳理给出答案。此前 ChatGPT 的训练数据最新只到 2021 年,无法回答 2022 年之后的信息咨询。此外,Bard 的回复速度也明显快于 ChatGPT。

Bard 可以联网搜索信息,意味着用户可以直接询问今天的体育比赛比分、股价价格走势、系列新闻动态。不过在实际测试中,我发现 Bard 还是存在着时间差,还没有做到完全实时。

但相对于 ChatGPT 的训练数据库,谷歌 Bard 的联网能力还是有着明显的优势,他们可以就最新事件给出自己的回答。当我询问美国前总统特朗普近期可能在纽约被起诉以及硅谷银行倒闭的情况时,Bard 都给出了简单但是比较完整的事件梳理与总结。

帮助用户提供航班酒店订餐信息,对谷歌来说本就是分内之事。但 Bard 也会出现信息偏差。我周二要求 Bard 为自己定一张从加州圣何塞到北卡夏洛特飞行时间最短的机票时,Bard 居然给出了一个完全错误的航班号。而当我周四再次询问 Bard 的时候,发现谷歌已经纠正了这个错误,给出了正确的航班号。

不过就在今天,OpenAI 宣布通过认证安全的第三方插件,让 ChatGPT 在受控环境下接入实时信息,解决此前无法联网的最大痛点。第一批插件主要来自 Expedia、Instacart、Shopity、Slack 等服务平台,帮助用户获得生活以及协作类信息。这意味着 ChatGPT 也可以提供订餐订票,也可以检索公司文件和笔记信息。

做数学题、讲个笑话、写首情诗,这些对话操作对 ChatGPT 已经是小菜一碟,在 Bard 这里也是不在话下。在这些指令方面,Bard 并没有太大的问题,甚至还能提供不同文本选择。Bard 也允许用户复制文本。

在工作辅助方面,Bard 同样也可以完成日常任务,帮助用户写商业邮件和简单文章,也可以做表格、做笔记、做分析,不过需要将文件上传到 Google Drive。

虽然 Bard 网页端提供语音输入,但实际并无法使用;虽然 Bard 号称支持多种语言翻译,但实际使用却表示自己暂时无法完成指令。这些细节都表明 Bard 依然是个半成品,还需要后续完善。

个人不懂编程,无法亲身体验 ChatGPT 和 Bard 在编程能力方面的差别。但从身边程序员朋友的反馈来看,ChatGPT 在这方面似乎更了解他们的需求,也不会帮助他们编程,“Bard 不给码农需要的黑底语法高亮。在 Python 问题的回答质量也比 ChatGPT 差远了。”

Bard 是有自己观点输出的。谷歌发言人在开放公测后表示,Bard 这样的大语言模型(LLM)是根据公开内容进行训练的,他们会反映出对具体的政治人物、名人以及其他公众人物的正面或负面看法,甚至会在回答中给出对争议社会或政治问题的某些方面的观点。

不过,Bard 很多时候并不显示信息源,因此准确性需要用户自行判断。换一个角度来看,用户并不清楚 Bard 是如何得出结论的,也存在被谷歌的算法误导而轻信其结论立场的可能。在美国社会严重割裂的情况下,这一点很可能会引发保守派的质疑。

有趣的是,当一位测试者询问 Bard 怎么看待美国司法部对谷歌的反垄断诉讼时,Bard 居然立场鲜明地选择了“大义灭亲”。Bard 义正言辞地指责“谷歌收购竞争对手,施压网站使用其工具,对其广告交易进行限制。这些措施损害了消费者,扼杀了数字广告市场的创新。我希望法庭认可司法部的诉求,下令谷歌采取措施打破垄断。”看起来,Bard 并没有因为谷歌出品,就给予母公司特殊待遇,谷歌在最敏感的反垄断问题上,也没有干预 Bard 的看法。

或许,如果 Bard 是去年年底先发布的生成式 AI,那么 Bard 的表现足以引发一片赞叹,或许也会带动一波行业热潮。但 Bard 的公测时间比 ChatGPT 晚了整整四个月,在经历过此前体验 ChatGPT 的诸多惊喜之后,的确很难对 Bard 有新鲜感。Bard 暂时还不支持其它语言,也不支持图片,不会编程,国际市场用户也不知道何时可以使用。

就在谷歌发布 Bard 公测版之前,OpenAI 和微软已经掀起了新一波的 AI 军备竞赛。OpenAI 前几天刚刚发布了新一代大型多模态模型 GPT-4,接受图像和文本输入,提供文本输出,并接受了更多数据的训练(基于微软 Azure 平台),在模型文件中拥有更多的权重。用 OpenAI 的话来说,GPT-4 已经在各种专业和学术基准上表现出人类的水平。

GPT-4 的创造性和协作能力也超过了此前的诸多版本,高级推理能力超越了 ChatGPT。根据 OpenAI 的介绍,已经安排 GPT-4 参加了美国律师资格考试、法学院入学考试以及美国高考 SAT 的数学与写作。在这些测试中,GPT-4 的成绩超过了 88% 的应试者。

毫不意外,微软在第一时间推出了企业级 Azure OpenAI GPT-4 的预览版服务。企业可以根据 Azure OpenAI 服务来构建自己的应用程序。机器人开发人员只需要几分钟就可以以自然语言构建虚拟助手。

在这波生成式 AI 军备竞赛中,OpenAI 无疑是暂时的领先者,无论是研发步伐还是智能程度,都快了谷歌一步;也让其战略合作伙伴微软看到了追赶谷歌的曙光。自从 2 月初必应接入 ChatGPT 以来,必应页面访问量增长了 15.8%,应用全球下载量增长了 8 倍,日活用户更是突破了 1 亿人。与此同时,谷歌搜索页面访问量则下降了 1%,搜索应用下载量减少了 2%

原本大局已定的搜索市场,也因为生成式 AI 技术的加持,又重新注入了竞争活力。不过,这并不意味着谷歌的市场地位即将动摇。谷歌搜索的日活用户依然是 10 多亿级别,是必应的十倍以上。如果谷歌尽快完善 Bard 的用户体验,向全球用户开放全面公测,支持多种语言,凭借着巨大的用户基数和数据优势,未来的 AI 军备竞赛依然格局难定。

最后我询问 Bard,谁是其主要竞争对手。Bard 列出了微软的小冰、OpenAI 的 GPT-3 以及亚马逊的 Lex。“这些模型都是基于大量文本和代码进行训练,可以生成文本,翻译语言,书写多种创意内容,回答用户的问题。但我相信自己通过谷歌搜索从现实世界获取和处理信息的独特能力,持续保持回复与搜索结果一致。从而能够以更为全面和更具信息地回答你的问题。”

加载中...