(文/吕栋 贺喜格)
在OpenAI推出GPT-4一天后,百度官宣已久的类ChatGPT产品“文心一言”也终于公开露面,并且和GPT-4一样也是多模态。
北京时间3月16日下午,百度召开发布会,主题围绕新一代大语言模型、生成式AI产品“文心一言”。
(资料图片仅供参考)
观察者网在现场看到,百度首席执行官李彦宏和百度首席技术官王海峰均出席了发布会,并在现场展示了“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
令市场感到有些许失落的是,百度并未在现场直接调用“文心一言”,而是采用提前录好的视频进行展示。亮相了,但又没有完全亮相。这种情况可能也在一定程度上影响了百度股价,导致其盘中出现短线下挫。
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大,未来这段时间它一定会飞速发展。
观察者网从现场了解到,此次“文心一言”公开亮相后,并不会直接面向公众推出,而是先采用邀请测试方案。从3月16日起,首批用户可通过邀请测试码,在“文心一言”官网体验产品,后续才会陆续开放给更多用户。这可能也间接证实,“文心一言”目前尚未成熟。
那么,百度为何甘冒风险,略显仓促地推出“文心一言”呢?这一方面可能是为了抢得对标ChatGPT的头筹,获得更多用户以训练大语言模型,另一方面则可能考虑到内外部的需求。
李彦宏在现场表示:“在全球的大厂中,百度是第一个做出对标ChatGPT的产品的企业。虽然‘文心一言’的内测体验不能称作完美,但为什么现在发布呢?是因为百度的各个产品现都在等着这样的产品,我们的客户和合作伙伴也在等着这样的技术。”
在此次发布会之前,有外媒援引知情人士称,为了开发“文心一言”,数百名百度员工一直在夜以继日地工作。甚至在正式发布前夕,“文心一言”基于的AI模型仍在接受数据训练。一些员工坦言,他们没有足够的时间来打造一款功能完善的产品。
根据百度方面的披露,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等。
那这次通过视频亮相的“文心一言”表现如何呢?在现场,李彦宏展示了“文心一言”在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
以文学创作场景为例,“文心一言”根据对话问题将《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
在数理推算场景中,“文心一言”能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
作为扎根于中国市场的大语言模型,文心一言在中文语言和中国文化上,相比国外的大模型产品无疑会有更好的表现。在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
昨日(3月15日),OpenAI发布多模态模型GPT-4,可接收图像和文本输入来输出文本内容,受到外界关注,而文心一言本次发布的版本同样具备多模态功能,支持文本、图片、音频、视频生成。
在更体现技术能力的多模态生成方面,李彦宏现场展示了“文心一言”生成文本、图片、音频和视频的能力。有趣的是,“文心一言”甚至能够生成四川话等方言语音;“文心一言”的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
从“文心一言”的表现看,某种程度上它具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但整体而言,这类大语言模型还远未到发展完善的阶段,有赖于通过真实的用户反馈而逐步迭代。
王海峰表示,文心一言,是新一代知识增强大语言模型,是在ERNIE及PLATO系列模型的基础上研发的。它的关键技术包括有监督精调、人类反馈的强化学习、提示、知识增强、检索增强和对话增强。
前三项是这类大语言模型都会采用的技术,ERNIE和PLATO中也已经有应用和积累,在文心一言中又有了进一步强化和打磨;后三项则是百度已有技术优势的再创新。
多年来,百度大语言模型上投入积极,有市场数据显示,百度研发的50%-60%的投入都给到了Ernie。
近日有外媒援引知情人士称,随着ChatGPT热度上升,今年1月初,百度高管让其自然语言处理团队开始用文心大模型整合出一款对标ChatGPT的产品。但前述知情人士表示,与其他从事类ChatGPT技术的AI开发者所遇到的情况一样,这一项目面临一些挑战。
其中一个挑战是,需要训练该模型对有多种释义的短语或可指代多人的名字进行辨别,从而能对用户的要求做出更精确的反应。另一个挑战是使该聊天机器人生成的语言看起来更像人类说的话。第三个挑战是提高事实准确性,这是大语言模型的一个技术限制;大语言模型会根据不同词语可能出现在一起的概率将句子串起来,而不是根据信息片段。这种限制也使得这种模型难以控制以避免敏感话题。
“文心一言”的真实水平如何,还有待观察百度后续推出的公测版本。据百度披露,自2月份该公司官宣“文心一言”以来,已有超过650家企业宣布接入文心一言生态。
有市场观点指出,百度之所以没有迅速开放公测,一方面是因为产品尚未成熟,另一方面可能也是出于成本和收入考虑。之前有估算称,ChatGPT每天成本消耗有超过10万美元。来自摩根士丹利的分析师估计,ChatGPT每次查询的成本大约是谷歌传统搜索查询成本的七倍。
在本次发布会上,李彦宏表示:“无论哪家公司,都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理,需要多年坚持和积累,没法速成。”他同时提到,如果建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,“文心一言”效果会迅速提升。