速递！百度版ChatGPT“文心一言”亮相，李彦宏：发展远未完善、进步空间很大

（文/吕栋贺喜格）

在OpenAI推出GPT-4一天后，百度官宣已久的类ChatGPT产品“文心一言”也终于公开露面，并且和GPT-4一样也是多模态。

北京时间3月16日下午，百度召开发布会，主题围绕新一代大语言模型、生成式AI产品“文心一言”。

(资料图片仅供参考)

观察者网在现场看到，百度首席执行官李彦宏和百度首席技术官王海峰均出席了发布会，并在现场展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。

令市场感到有些许失落的是，百度并未在现场直接调用“文心一言”，而是采用提前录好的视频进行展示。亮相了，但又没有完全亮相。这种情况可能也在一定程度上影响了百度股价，导致其盘中出现短线下挫。

从现场展示来看，文心一言某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及，这类大语言模型还远未到发展完善的阶段，进步空间很大，未来这段时间它一定会飞速发展。

观察者网从现场了解到，此次“文心一言”公开亮相后，并不会直接面向公众推出，而是先采用邀请测试方案。从3月16日起，首批用户可通过邀请测试码，在“文心一言”官网体验产品，后续才会陆续开放给更多用户。这可能也间接证实，“文心一言”目前尚未成熟。

那么，百度为何甘冒风险，略显仓促地推出“文心一言”呢？这一方面可能是为了抢得对标ChatGPT的头筹，获得更多用户以训练大语言模型，另一方面则可能考虑到内外部的需求。

李彦宏在现场表示：“在全球的大厂中，百度是第一个做出对标ChatGPT的产品的企业。虽然‘文心一言’的内测体验不能称作完美，但为什么现在发布呢？是因为百度的各个产品现都在等着这样的产品，我们的客户和合作伙伴也在等着这样的技术。”

在此次发布会之前，有外媒援引知情人士称，为了开发“文心一言”，数百名百度员工一直在夜以继日地工作。甚至在正式发布前夕，“文心一言”基于的AI模型仍在接受数据训练。一些员工坦言，他们没有足够的时间来打造一款功能完善的产品。

根据百度方面的披露，“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据，以及5500亿事实的知识图谱等。

那这次通过视频亮相的“文心一言”表现如何呢？在现场，李彦宏展示了“文心一言”在五个使用场景的表现，包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。

以文学创作场景为例，“文心一言”根据对话问题将《三体》的核心内容进行了总结，并提出了五个续写《三体》的建议角度，体现出对话问答、总结分析、内容创作生成的综合能力。商业文案创作场景中，文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。

在数理推算场景中，“文心一言”能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题，文心一言能理解题意，并有正确的解题思路，进而像学生做题一样，按正确的步骤，一步步算出正确答案。

作为扎根于中国市场的大语言模型，文心一言在中文语言和中国文化上，相比国外的大模型产品无疑会有更好的表现。在现场展示中，文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论，还用“洛阳纸贵”四个字创作了一首藏头诗。

昨日（3月15日），OpenAI发布多模态模型GPT-4，可接收图像和文本输入来输出文本内容，受到外界关注，而文心一言本次发布的版本同样具备多模态功能，支持文本、图片、音频、视频生成。

在更体现技术能力的多模态生成方面，李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。有趣的是，“文心一言”甚至能够生成四川话等方言语音；“文心一言”的视频生成能力则因成本较高，现阶段还未对所有用户开放，未来会逐步接入。

从“文心一言”的表现看，某种程度上它具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言，这类大语言模型还远未到发展完善的阶段，有赖于通过真实的用户反馈而逐步迭代。

王海峰表示，文心一言，是新一代知识增强大语言模型，是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。

前三项是这类大语言模型都会采用的技术，ERNIE和PLATO中也已经有应用和积累，在文心一言中又有了进一步强化和打磨；后三项则是百度已有技术优势的再创新。

多年来，百度大语言模型上投入积极，有市场数据显示，百度研发的50%-60%的投入都给到了Ernie。

近日有外媒援引知情人士称，随着ChatGPT热度上升，今年1月初，百度高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。但前述知情人士表示，与其他从事类ChatGPT技术的AI开发者所遇到的情况一样，这一项目面临一些挑战。

其中一个挑战是，需要训练该模型对有多种释义的短语或可指代多人的名字进行辨别，从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是提高事实准确性，这是大语言模型的一个技术限制；大语言模型会根据不同词语可能出现在一起的概率将句子串起来，而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题。

“文心一言”的真实水平如何，还有待观察百度后续推出的公测版本。据百度披露，自2月份该公司官宣“文心一言”以来，已有超过650家企业宣布接入文心一言生态。

有市场观点指出，百度之所以没有迅速开放公测，一方面是因为产品尚未成熟，另一方面可能也是出于成本和收入考虑。之前有估算称，ChatGPT每天成本消耗有超过10万美元。来自摩根士丹利的分析师估计，ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。

在本次发布会上，李彦宏表示：“无论哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年坚持和积累，没法速成。”他同时提到，如果建立起真实用户反馈、开发者调用和模型迭代之间的飞轮，“文心一言”效果会迅速提升。