“百模大战”愈演愈烈垂直领域应用创新成破局关键

今年以来，我国大模型产业蓬勃发展，赛道热度不断高涨。在近日举行的2023全球数字经济大会人工智能高峰论坛上，北京市经济和信息化局党组书记、局长姜广智表示，现在全国已有80余个大模型公开发布。

大模型产业进入“百模大战”时代，各方思辨与争论不断。“‘百模大战’是否存在重复建设？”“如何推动垂直领域应用创新？”成为业界关注的焦点。

多位接受《证券日报》记者采访的业内人士表示，大模型产业是未来科技竞争的关键较量之一。对于大多数企业而言，面向垂直场景、垂直行业、垂直领域探索基于大模型的应用创新，将是重点攻克的方向。局部的跑通，将带动行业整体景气度、创新热情和创造活力提升。

(相关资料图)

企业争相布局

在我国大模型产业领域，阿里、华为、腾讯等公司布局相对较早。2019年阿里进行了大模型研发，于2022年发布“通义”大模型系列。腾讯也于2022年对外披露了旗下“混元”大模型的研发进展。

进入2023年，ChatGPT掀起了大模型浪潮。百度3月份发布大语言模型“文心一言”，成为我国首个类ChatGPT产品。之后，我国多家企业发布的大模型争相亮相。

《证券日报》记者梳理发现，截至7月3日，我国10亿级参数规模以上大模型已超80个。除了互联网巨头外，商汤科技、云从科技、科大讯飞等人工智能赛道上市公司，光年之外、百川智能等初创企业，上海人工智能实验室、哈尔滨工业大学等科研院所单位，均先后发布了大模型。

“我们把大模型及相关产品分为三类。第一类是通用大模型，如OpenAI的ChatGPT、百度的‘文心一言’、科大讯飞的‘星火’等都属于通用大模型；第二类是行业大模型；第三类是基于通用大模型或行业大模型的应用型服务。目前已经发布的产品大多集中在第一类和第二类。”有业内人士表示，“从参数量来看，‘文心一言’等通用大模型的参数量在1000亿级别，其他企业或初创公司大模型参数量通常在100亿、10亿级别。”

“百模大战”是否存在重复建设？中央财经大学数字经济融合创新发展中心主任陈端在接受《证券日报》记者采访时表示：“中国在PC时代和移动互联网时代，成长起一批一度在全球领先的互联网企业，这些企业出于应对下一轮生存竞争的需要，纷纷主动加入大模型的早期研发竞争，这是一件好事。不过，通用大模型领域的竞争，未来将产生马太效应，只有少数强者能够胜出。”

深度科技研究院院长张孝荣在接受《证券日报》记者采访时也表示：“大模型训练有较高的门槛，受制于数据、算力的限制，真正能跑通大模型商业化的企业数量将不会很多。现在国内的大模型还在实验室阶段，厂商需要更多时间和资源去训练模型、调试参数等，市场竞争环境有利于产业发展，最后必然是大浪淘沙。”

落地应用是关键

“从已经发布的大模型来看，通用大模型数量较多，应用型的大模型较少。目前国内的产品和ChatGPT存在差距，我们要正视这一差距，通过场景式牵引进行重点突破，打造标杆形成示范，有效快速缩小差距。”北京社科院研究员王鹏在接受《证券日报》记者采访时表示。

陈端向记者表示：“在特定的领域和场景中实现大模型的价值，这一市场需求是非常大的，也会有很好的市场兼容度，容纳更多的竞争者。因此，对于更多参与者而言，探索基于大模型的应用创新，将是突围方向。”

这一观点也得到了赛道企业的高度认同。百度创始人、董事长兼首席执行官李彦宏近日表示：“比大模型数量更重要的是应用，是在垂直领域应用的突破。新的国际竞争战略关键点，不是有多少个大模型，而是大模型上有多少原生的应用，这些应用在多大程度上提升了生产效率。”

在上市公司佳都科技“佳都知行交通大模型”的发布会上，公司董事长刘伟表示：“通用大模型的诞生只是一个起点，其最终还是要落脚到特定应用场景、解决行业具体问题上。以行业大模型为关键驱动，赋能行业生产效率和服务质量提升，将会带来经济社会发展和产业的深刻变革。而应用场景优势带来的数据和反馈，又将进一步加速行业大模型技术迭代，这也将成为国产大模型的最大竞争力。”

据了解，在政务、公共安全、医疗等领域，垂直领域应用型大模型正在陆续落地。上市公司拓尔思基于自有的公文、政策文件、政务办事指南等数据作为专业训练数据，打造了政务专业大模型；美亚柏科自主研发的MYAI大模型聚焦垂直领域应用，目前已在公共安全、政务、税务、企业数字化转型等多个行业领域的大数据项目建设中得到应用。