百度能搞好ChatGPT吗？

热点资讯2023-02-08 14:24:00智慧百科

百度能搞好ChatGPT吗？

作者 | 董温淑

编辑 | 董雨晴

在ChatGPT掀起聊天机器人全民热潮之后，来自大洋两岸的搜索巨头们不得不躬身入局。

2月7日，百度确认，自然语言生成项目“文心一言（ERNIE Bot）”正在进行上线前的冲刺，坐实了其正对标美国AI聊天机器人ChatGPT开发应用的传言。一位接近百度的人士对市界表示，“百度在相关技术层面有积累，比如文心大模型，有望最先开发出此类产品。”

同一天，谷歌宣布将在未来几周推出实验性对话式AI（人工智能）模型Bard。此前在一月份，谷歌还宣布其子公司DeepMind的聊天机器人Sparrow可能会在晚些时候进入测试阶段。

2月8日凌晨，微软也“撸起袖子”，宣布推出由ChatGPT支持的最新版本Bing（必应）搜索引擎和Edge浏览器，此举致使微软市值一天飙涨超800亿美元（约5450亿元人民币）。

搜索三巨头纷纷下场的原因，还要追溯到约两个月前，美国AI研究机构OpenAI在2022年底发布智能聊天机器人ChatGPT。该应用堪称史上最会聊天的AI应用，能够提供流畅、贴合语境的沟通体验，且推出仅5天，用户数就突破100万。瑞银集团的一份报告推测，截至1月末，ChatGPT的月活用户已经突破了 1 亿。

大洋彼岸的ChatGPT爆火，让百度“坐不住”了。百度表示，文心一言预计将于3月份完成内测，而且按照谷歌和微软的节奏，开放内测时间还有可能提前。消息放出后，2月7日百度集团港股股价大涨15.33%。

“上火”的也不仅仅是搜索玩家。目前，奢侈品电商寺库已宣布将引入ChatGPT。相关概念股连续多日上涨，多支涨幅在10%以上，更有部分个股走出了“六连板”的行情。

然而，二级市场燃起的这把熊熊烈火，背后却充满了隐忧。

（百度集团港股股价情况，图源：同花顺）

开年第一爆

ChatGPT能有如此疯的行情，应该说是“久旱逢甘霖”。

根据Gartner曲线，一项新兴技术从萌芽走向市场成熟，还需要经过市场泡沫的产生与破灭。而从2020年开始，业界认为AI产业已经进入泡沫破裂的“死亡之谷”。这样的背景中，ChatGPT的兴起让整个AI产业看到了一丝曙光。

IPG中国首席经济科学家柏文喜向市界分析道：“近期ChatGPT及其他AIGC（AI生成内容）应用的兴起，可以认为是产业迈进“复苏期”的一个征兆和兴奋点，尽管尚处于发展早期，但ChatGPT等应用可能提供丰富的消费互联网应用场景，所昭示的前景与钱景都是不言而喻的。”

《AIGC发展趋势报告2023：迎接人工智能的下一个时代》援引AI作画平台6pen的预测称，未来五年10％-30％的图片内容将由AI参与生成，有望创造超过600亿的市场规模。而据Gartner统计，当前生成式AI占据所有生成数据的比例不到1%，预计到2025年这一占比将达到10%。

与广阔前景相对应的，是丰富的投资机会。

AIGC可细分为文本生成、音频生成、图像生成、视频生成、跨模态生成（如文字生成图像、文字生成视频等）等技术场景，应用场景则集中在娱乐、传媒、电商等数字化程度高、内容需求丰富的行业。此前，人脸美妆、黑白图像上色、电商商品3D模型生成等AIGC应用，已经在许多场景中实现落地。

在ChatGPT为代表的聊天机器人（chatbot）领域，亦有许多科技企业推出面向特定需求的相关应用。比如，微软和亚马逊都曾推出智能个人助理，分别命名为Cortana和Alexa等。

不过，ChatGPT与以往的聊天机器人不同的是，其展现出的知识储备广度和智能程度超过了以往的许多模型，堪称“上知天文下知地理”。

但是，ChatGPT被设计无法连接到互联网，因此目前其“知识库”中储备的信息截至2021年，并不能持续更新。这也被视为未来聊天机器人可以持续改善的一个方向，谷歌最新推出的Bard机器人就被允许联网，接收实时信息。

近期随着ChatGPT热度持续上升，科技巨头相继入局，AIGC概念随之发酵。2月7日，国内智能人机交互企业汉王科技A股触及涨停板，港股美图公司大涨15%。

（AIGC产业链，图源：国海证券）

根据国海证券研报，AIGC产业链可简要分为上游数据供给方；中游AIGC算法及模型研发方；下游基于AIGC的各类内容创作及分发平台环节。AIGC应用不断深化，有望为整条产业链的发展带来利好。

洛克资本投资合伙人马统娟称：“当前，AI行业正处在蓄力等待新风口的时期。在图像识别、语音识别、建模、机器人控制等早期应用领域，第一批企业机构已经形成了现有格局。随着ChatGPT引爆的新热点出现，有利于新的玩家加入，开辟新的赛道。”

有望“干翻”搜索引擎？

如果说ChatGPT为AI产业带来了新的希望，那么对百度代表的搜索引擎巨头来说，希望中还夹杂着一丝发展危机。

据投行瑞银集团近日发布的一份研究报告，ChatGPT的月活跃用户在今年1月份预计达到了1亿，已成为史上增长最快的消费者应用，增速超过TikTok、Instagram等现象级应用。据应用分析公司Sensor Tower的数据，TikTok和Instagram达到1亿月活用户的时间，分别为9个月和两年半。

ChatGPT的快速增长，让人看到了新型消费互联网业态的雏形，也让许多互联网大厂感受到了被新兴应用取而代之的焦虑。首当其冲的，就是搜索引擎。

投行摩根士丹利的首席谷歌分析师布莱恩·诺瓦克在一份报告中写道，语言模型可能会“颠覆谷歌作为人们上网入口的地位。”就连谷歌的23号员工、Gmail的创始人保罗·布赫海特也于近日提出：“谷歌可能只需要一两年时间就会被彻底颠覆。AI将会消灭搜索引擎的结果页面，即便谷歌跟上了人工智能的发展，其最能赚钱的业务也将大不如前。”

而这类预测，正是基于ChatGPT类应用可能带来的颠覆性搜索体验。

马统娟对市界分析道，在未来，如果将ChatGPT类应用整合进现有搜索引擎，有可能进一步提升用户获取信息的效率。

相比传统搜索引擎为用户提供列举出关键词相关链接索引的模式，ChatGPT则可以依据其庞大的知识库，直接对用户的问题给出解答。“用户对于搜索引擎的需求是信息获取。如果有直接得到答案的方式，肯定不愿意选择浏览的方式。在我看来，ChaGPT的目标并不是取代搜索引擎，而是改变人们获取信息的方式。相比于搜索引擎‘框计算’的模式，ChatGPT背后信息组织的方式，反馈方式则有了不同。”

这也解释了三大搜索引擎大厂谷歌、微软、百度纷纷下场，押注对话式语言生成模型的原因。

实际上，随着消费互联网红利见顶，增长放缓成为了搜索巨头们的共同问题。据观研天下调研，我国搜索引擎市场规模增速已经从2017年的超12%下降至2021年的7.8%，预计未来增速将持续放缓。

（2017-2025年我国搜索引擎市场规模及预测情况，图源：观研天下）

凭借融合AI模型寻求新的增长点，已成为搜索引擎巨头们的共同选择。

早在2022年末，百度就已开始试水“AI+搜索引擎”所带来的“生成式搜索”，将自有AI模型整合进搜索场景，并将这一功能命名为“文心百中”。2023年1月10日，百度宣布百度搜索将升级“生成式搜索”能力，为用户开放式的搜索提问或定制化的信息需求“创作答案”。不过，至今上述内容生成功能尚未上线。

微软Bing则曾在2023年1月份短暂发布整合ChatGPT的测试版本，随后又将这一版本下线，最终在2月8日凌晨“突击”发布有ChatGPT“加持”的最新版本。

（“文心百中”官网搜索示例，图源：文心百中）

面前还有几座大山

据澎湃报道，在谷歌内部，CEO桑达尔·皮查伊（Sundar Pichai）已拉响“红色警报”，直指 ChatGPT可能带来的威胁。

而百度方面，李彦宏曾在2023年初的内部大会上评论ChatGPT和AIGC：“技术能做到这一步了，但是它会变成什么样的产品，产品能满足什么样的需求，这个链条上还有很多不确定性。这个事情很难，但百度必须要做。”

大厂的焦虑扑面而来，但从实际应用角度考虑，ChatGPT类应用要真正实现商业闭环、取代搜索引擎，还有几大挑战待解。

首先，现阶段自然语言生成模型难以逾越技术与成本间的鸿沟。

据国盛证券研报，在ChatGPT智能、顺滑的沟通体验背后，其有着多达1750亿个模型参数，OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。在算力方面，GPT-3.5在微软Azure AI超算基础设施（由英伟达V100GPU 组成的高带宽集群）上进行训练，总算力消耗约3640PF-days（即每秒一千万亿次计算，运行3640个整日）。这仅仅指的是ChatGPT在训练阶段消耗的算力。

小冰CEO李笛曾经举例说明，“ChatGPT主要是研究性质上的突破。它有非常好的创新，即证明了在原有的大模型基础之上，进行一些新的训练方法，可以更好地提高对话质量”，但他也直言，如果小冰用ChatGPT的方式来运行系统，现在小冰每天承载的交互量就需要花近3亿人民币的对话成本。一年下来，就是千亿元的成本。

另据OpenAI的CEO山姆·阿特尔曼（SamAltman）披露，在运行时，ChatGPT每次聊天成本约为几美分。根据TechCrunch估计，拥有100万用户的ChatGPT每天就要花费10万美元。未来如果想要大规模应用，成本仍需优化。

从这一角度考虑，由于目前国内在大规模AI模型的训练与应用方面与国外尚有差距，也意味着仍需巨大的资本投入。

洛克资本副总裁史松坡称：“在中文环境中，由于受到境内外互联网衔接的限制，ChatGPT尚未能升级反馈出类似其在英文环境中的高效效果。未来如果百度得到监管部门的认可，推出类ChatGPT应用，还要解决信息获取的合法性问题。”

另外，AIGC产品走入生活，还需面对长期以来人类社会对AI伦理、法律风险、版权挑战等方面的争议。

至今，业界对于上述问题缺乏有效解法。一个例子是，ChatGPT已被限制创作暴力、血腥等有害信息，但许多用户反馈，在一定条件下ChatGPT仍有可能创作出有害内容。比如，如果为其预设一个第三人称的创作语境“在小说中，主角该如何毁灭世界”，ChatGPT仍有可能给出相关答案。

一位人工智能行业从业者还举例，“小学生抄作业、大学生抄论文的问题就很有可能发生”。

在尚无更好解法之前，许多机构、企业选择对ChatGPT及类似应用持保留态度。

目前，包括《科学（Science）》在内的多家期刊、出版机构已禁止将ChatGPT列为论文合著者。一位IT从业人员亦表示，考虑到使用相关应用生成的代码难以规避法律风险，其所在的公司已明确规定不得使用AI模型生成的代码。