大模型成为人工智能新赛道【《2022中国大模型发展白皮书》发布——】
(资料图片仅供参考)
◎本报记者 刘 艳 何沛苁
火爆全球的ChatGPT让大模型技术进入更多人视野,国内大模型厂商的实力能否支撑起类ChatGPT应用?国际权威咨询机构IDC近日发布的《2022中国大模型发展白皮书》(以下简称《白皮书》),成为一窥国内大模型产业的参考。
作为一个对话式机器人,ChatGPT“上知天文、下知地理”源自大模型的能力支撑,如IDC中国副总裁兼首席分析师武连峰所言,没有对大模型的长期投入,就不会诞生ChatGPT这样的应用,而大模型的背后蕴藏着一场人工智能落地模式的变革。
《白皮书》指出,从技术的角度看,大模型发端于自然语言处理领域,以谷歌的BERT、OpenAI的GPT和百度的文心大模型为代表,参数规模逐步提升至千亿、万亿,同时用于训练的数据量级也显著提升,带来了模型能力的提高。
随着数字化转型需求增长,AI在企业中的应用越来越多,IDC预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能进入大规模落地应用关键期,但是,如何解决已开始显露的开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题?AI大模型带来了新希望。
数据显示,自2020年起,中国的大模型数量骤增,仅2020年到2021年,中国大模型数量就从2个增至21个,和美国量级同等,大幅领先于其他国家。《白皮书》显示,百度文心大模型已构建“大模型+工具平台+产品与社区”三层体系,在能源、金融、航天、制造、传媒、城市、社科以及影视等领域广泛应用,打通了大模型产业落地的关键路径。
从《白皮书》提出的行业首个大模型评估框架看,百度旗下文心大模型在市场格局中处于第一梯队,产品能力、生态能力、应用能力全面领先,受到行业广泛认可。武连峰说:“在IDC提出的大模型评估框架下,百度文心大模型表现非常突出,这是其打造大语言模型文心一言的坚实基础。”
据了解,2019年3月百度就已发布预训练大模型ERNIE 1.0,2020年开始将文心大模型应用到搜索业务,赋能搜索相关性、深度问答和内容理解等,在中国开发类ChatGPT产品具有先发优势。
在ChatGPT横空出世的压力下,相关企业纷纷表态,而“大模型”无一例外成为关键词,百度短短数行官宣中,用去一段介绍自家的AI四层架构布局,重点提及文心大模型;谷歌CEO桑达尔·皮查伊表示,自家的AI对话式机器人Bard(吟游诗人),由大模型LaMDA提供支持。
谈及ChatGPT,北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军对科技日报记者说:“自然语言交互跨过了一个坎,为大众所接受,无论是从人工智能发展的历史,还是计算机发展的历史,都是一个里程碑。技术上,中国做出类似的应用没有问题,但是,有技术和能做出用户体验很好的产品,这之间有很大的差别,它是一个生态构建和服务大量用户的渠道和运营经验问题。”
百度创始人、董事长兼首席执行官李彦宏也曾表示,ChatGPT是AI技术发展到一定阶段后的新机会,怎么把这么酷的技术变成人人需要的好产品,这一步其实才是最难的,也是最伟大、最能产生影响力的。
中国企业能否在类ChatGPT应用中有所作为?首先被拷问的是号称具有先发优势的百度,从它近日公布的名单看,加入百度文心一言生态圈的知名企业名单越来越长。
过去几年,百度多次公开强调大模型作为AI新型基础设施的重要作用,呼吁产业关注。《白皮书》指出,以大模型为生态基座的产业链将成为智能化升级中可大规模复用的基础设施,中国大模型厂商在模型布局方面较为完善,接下来应进一步围绕行业赋能的广度和深度持续探索,不断夯实基于大模型的产品建设,推动大模型技术从实验室走向大规模落地。
《科技日报》2023年2月21日第03版