今年以来,我国大模型产业蓬勃发展,赛道热度不断高涨。在近日举行的2023全球数字经济大会人工智能高峰论坛上,北京市经济和信息化局党组书记、局长姜广智表示,现在全国已有80余个大模型公开发布。
大模型产业进入“百模大战”时代,各方思辨与争论不断。“‘百模大战’是否存在重复建设?”“如何推动垂直领域应用创新?”成为业界关注的焦点。
多位接受《证券日报》记者采访的业内人士表示,大模型产业是未来科技竞争的关键较量之一。对于大多数企业而言,面向垂直场景、垂直行业、垂直领域探索基于大模型的应用创新,将是重点攻克的方向。局部的跑通,将带动行业整体景气度、创新热情和创造活力提升。
(相关资料图)
企业争相布局
在我国大模型产业领域,阿里、华为、腾讯等公司布局相对较早。2019年阿里进行了大模型研发,于2022年发布“通义”大模型系列。腾讯也于2022年对外披露了旗下“混元”大模型的研发进展。
进入2023年,ChatGPT掀起了大模型浪潮。百度3月份发布大语言模型“文心一言”,成为我国首个类ChatGPT产品。之后,我国多家企业发布的大模型争相亮相。
《证券日报》记者梳理发现,截至7月3日,我国10亿级参数规模以上大模型已超80个。除了互联网巨头外,商汤科技、云从科技、科大讯飞等人工智能赛道上市公司,光年之外、百川智能等初创企业,上海人工智能实验室、哈尔滨工业大学等科研院所单位,均先后发布了大模型。
“我们把大模型及相关产品分为三类。第一类是通用大模型,如OpenAI的ChatGPT、百度的‘文心一言’、科大讯飞的‘星火’等都属于通用大模型;第二类是行业大模型;第三类是基于通用大模型或行业大模型的应用型服务。目前已经发布的产品大多集中在第一类和第二类。”有业内人士表示,“从参数量来看,‘文心一言’等通用大模型的参数量在1000亿级别,其他企业或初创公司大模型参数量通常在100亿、10亿级别。”
“百模大战”是否存在重复建设?中央财经大学数字经济融合创新发展中心主任陈端在接受《证券日报》记者采访时表示:“中国在PC时代和移动互联网时代,成长起一批一度在全球领先的互联网企业,这些企业出于应对下一轮生存竞争的需要,纷纷主动加入大模型的早期研发竞争,这是一件好事。不过,通用大模型领域的竞争,未来将产生马太效应,只有少数强者能够胜出。”
深度科技研究院院长张孝荣在接受《证券日报》记者采访时也表示:“大模型训练有较高的门槛,受制于数据、算力的限制,真正能跑通大模型商业化的企业数量将不会很多。现在国内的大模型还在实验室阶段,厂商需要更多时间和资源去训练模型、调试参数等,市场竞争环境有利于产业发展,最后必然是大浪淘沙。”
落地应用是关键
“从已经发布的大模型来看,通用大模型数量较多,应用型的大模型较少。目前国内的产品和ChatGPT存在差距,我们要正视这一差距,通过场景式牵引进行重点突破,打造标杆形成示范,有效快速缩小差距。”北京社科院研究员王鹏在接受《证券日报》记者采访时表示。
陈端向记者表示:“在特定的领域和场景中实现大模型的价值,这一市场需求是非常大的,也会有很好的市场兼容度,容纳更多的竞争者。因此,对于更多参与者而言,探索基于大模型的应用创新,将是突围方向。”
这一观点也得到了赛道企业的高度认同。百度创始人、董事长兼首席执行官李彦宏近日表示:“比大模型数量更重要的是应用,是在垂直领域应用的突破。新的国际竞争战略关键点,不是有多少个大模型,而是大模型上有多少原生的应用,这些应用在多大程度上提升了生产效率。”
在上市公司佳都科技“佳都知行交通大模型”的发布会上,公司董事长刘伟表示:“通用大模型的诞生只是一个起点,其最终还是要落脚到特定应用场景、解决行业具体问题上。以行业大模型为关键驱动,赋能行业生产效率和服务质量提升,将会带来经济社会发展和产业的深刻变革。而应用场景优势带来的数据和反馈,又将进一步加速行业大模型技术迭代,这也将成为国产大模型的最大竞争力。”
据了解,在政务、公共安全、医疗等领域,垂直领域应用型大模型正在陆续落地。上市公司拓尔思基于自有的公文、政策文件、政务办事指南等数据作为专业训练数据,打造了政务专业大模型;美亚柏科自主研发的MYAI大模型聚焦垂直领域应用,目前已在公共安全、政务、税务、企业数字化转型等多个行业领域的大数据项目建设中得到应用。