图片来源@视觉中国
文 | 科技新知
【资料图】
经历了漫长期待与纷纭猜测,华为盘古大模型最新进展悄然面世。
7月7日,华为云在年度开发者大会上郑重其事地揭晓了盘古大模型3.0的面纱,华为常务董事兼华为云CEO张平安喊出“不做诗,只做事”,正式给盘古大模型定调。
此前,外界猜想华为的大模型可能会与ChatGPT正面竞逐。在中文语言处理(NLP)大模型的领域中,华为可能会构建一款主要面向消费者端的对话式AI聊天应用。
然而,华为内部的一位消息人士很快进行了辟谣。他透露华为并未正式提及将发布一个可以与ChatGPT相提并论的产品,华为不会采用类似于“盘古Chat”这样的名称,也不会去“对标”任何一个具体的产品。
上述人士还披露,华为主要是做针对行业的B端业务,因此将大模型应用在这些领域会更加合适。尽管语言处理是重要的,但他坦白认为,这并非华为的强项。如果业务不是主攻方向,华为在当前阶段可能会暂时停止研发,以更专注于保障公司的生存与发展。
从此次大会的内容来看确实如此,华为已经把盘古大模型明确定位为面向各行各业的B端产品。他们试图通过投入盘古大模型的能力,来赋能各个行业。
又一个发力行业的大模型
结合4月8日的人工智能大模型技术高峰论坛来看,盘古大模型并未突破预期。
在那次论坛中,华为云人工智能领域的首席科学家田奇出席,并详细介绍了华为云盘古大模型的发展进程以及在实际应用中的情况。因此,这次华为云大会上的内容,实际上是对之前信息的一种延伸。
在前述论坛上,田奇先是提出了一种类似于自动驾驶的等级划分方式,将大模型的发展阶段划分为“L0至L2”,分别对应着基础通用模型、行业模型以及针对细分场景任务的特定模型。
这正是华为盘古大模型3.0的核心理念,即通过三层次的模型设计,实现大模型在各个行业的落地应用。
具体来看,第一层L0,是盘古基础大模型的所在。在这一层,包含了五个技术领域的大模型,分别是NLP(自然语言处理)大模型、CV(机器视觉)大模型、多模态大模型、预测大模型和科学计算大模型。
第二层L1,专注于行业大模型的构建。华为给行业客户提供基于公有领域行业数据训练过的行业通用大模型。此外,也协助客户使用他们自己的数据来训练行业大模型,从而形成属于他们自己的大模型。
第三层L2,关注更为垂直的细分领域,专注于解决某个细分领域内的应用问题,这往往需要大模型与深度技术紧密结合。在这个层级,华为给客户提供开箱即用的大模型服务,致力于解决更具深度的技术问题。
发布针对行业的大模型产品,早已不是什么新鲜事了。对此田奇指出,行业内大量的业务场景迫切需要更多专业的大模型和专业的AI应用来解决问题,以填补通用大模型在行业落地时的短板。
他认为,通用大模型在应用于行业时,面临着专业性、技能和数据安全合规三方面的挑战。
首先,虽然通用大模型的适用范围广,但在专业性上相对较弱,需要具备行业专业知识才能给出专业且准确的答案。其次,尽管通用大模型具备广泛的知识基础,但在技能方面不足,而企业场景复杂,需要模型拥有多样的技能。最后,数据安全和合规性也是一大挑战,数据是企业的核心资产之一,因此在训练和使用大模型时必须保障企业的数据安全和合规。
为了解决这些挑战,华为云基于实践经验,构建了分层解耦的大模型架构,也就是之前提到的三层结构,以加速大模型在各行各业的落地应用。
至于如何从基础大模型炼成行业大模型,田奇介绍了华为的四大关键举措:沉淀行业知识、淬炼行业技能、对话专业工具、保障安全合规。
另一方面,计算能力是构建大模型的核心。大会上,华为云正式发布了华为昇腾AI云服务。这项服务以拥有2000P Flops算力的单集群为基础,在华为云的乌兰察布和贵安AI算力中心同步上线。
华为构筑了一个以鲲鹏和昇腾为基础的AI算力云平台,该平台包含昇腾的计算引擎CANN、AI框架MindSpore,以及AI开发平台ModelArts,共同组成针对大模型的解决方案。
缘何缺位C端市场?
华为在大模型领域的积淀已经历时数年。
从2020年11月的盘古计划开始,到2021年4月发布的盘古NLP大模型、盘古视觉大模型、盘古科学计算大模型,再到现在的盘古3.0。华为在人工智能方面的深入研发和实际应用一步步地展露,只是核心策略更倾向于服务B端市场,而非C端市场。
从此次发布会来看,盘古大模型在L0层主要由五个模型组成,分别是CV、NLP、多模态、科学计算、预测。但这五个方向的发展成熟度完全不一样。
很明显,盘古大模型的服务更侧重于B端客户,特别是在较为成熟的CV领域。这从两次大会上对CV大模型的关注程度可见一斑。而对于行业内倍受关注的类似ChatGPT的NLP大模型,华为公开的相关细节相对较少。
对此张平安表示,目前全球已发布数百个大模型,中国发布了超80个,To C类应用百花齐放。很多To C的大模型会写诗作画,华为盘古大模型不会写诗,只会做事,致力于深耕行业,为行业带来价值。
这番言论看似贬低了以ChatGPT为代表的语言大模型,但也暴露了华为盘古大模型在应用广度和丰富性上可能存在的不足。
据业内人士透露,华为在NLP领域还相对较弱,生成性最多能应用于一些封闭场景下的客服,语义理解相关的可以应用于舆情的管控、法律司法文书的理解、审计文书的理解,但在输出性、内容生成性方面,盘古大模型之前并未将其作为一个发展重点。
客观来看,这其实与应用场景有关。NLP大模型的应用场景主要是自然语言、智慧旅游、金融领域。而CV大模型的应用场景主要是机器视觉,例如交通行业的高速巡检;电力行业的日常巡检、设备的缺陷识别;制造业的缺陷识别等。
华为能找到的高价值的数字化赋能场景主要以视觉为主,所以这就是盘古大模型更多的研发项目主要围绕这一领域的原因。而NLP方面的力度不大,主要还是商业驱动力不足,华为一开始做AI就未将C端作为一个重点。
此外,这也与企业独特的基因生态结构密切相关。
虽然华为、腾讯、百度等大模型开拓者在执行战略构建和商业模式落地方面存在一些相似性,但真正区分它们的核心依旧在于各自的生态系统。
作为互联网巨头,百度和腾讯通过其广阔的C端用户业务网,比如百度深入的搜索引擎业务以及腾讯在社交网络、电子游戏和营销领域的强大阵容,能够依托其业务丰富性,在数据样本的收集上获得比竞争对手更为显著的优势。
华为则对B端行业的深度理解领先于二者。盘古大模型已在多个行业中得到应用,因此主要关注点更多的是B端市场。
“不做诗,只做事”的局限性
“不作诗,只做事”这种“行业优先”的策略,满足了一部分市场需求——为特定行业解决具体问题。然而,需要深思的是,当华为将AI的视线只聚焦在行业应用上,可能会遗失掉更广阔领域中的发展机会。
事实上,AI技术的潜在应用价值,远超出了眼下所见的“做事”。如果将AI的应用范围仅限于特定行业,这种偏见或许会限制在其他领域寻找AI的价值。
拿诗歌创作来说,AI的诗歌创作不仅仅是在艺术领域的一种创新形式,更是一种科技的展示。通过此种方式,可以向公众展示AI的学习能力、自然语言处理能力等各种能力。这不仅能拓宽AI的应用领域,而且能吸引更多的公众来关注和理解AI技术。
此外,AI的创新性并非与实际应用相互冲突,反而可能互为促进,相辅相成。艺术与科技的融合长久以来都是推动创新的重要力量,其中就包括像图像识别、自然语言处理等技术。借由将AI应用于艺术创作,能更深入地理解并优化这些基础技术,从而提升AI在实际应用中的效果。
比如说,ChatGPT这样的大模型,就是通过其强大的语义理解和推断能力,以及其能提供个性化和情境化回复的能力,得到了广泛的关注和讨论。这种强大的自然语言处理能力,使得AI模型不仅可以在行业任务中发挥其价值,还能在C端市场中提供更加人性化、有趣且富有创造力的服务。
实际上,C端市场对于AI模型的发展至关重要。许多创新性的技术和产品往往首先在C端市场得到接纳和普及,然后才逐渐渗透到B端市场。因此,如果大模型产品只将其目光聚焦于行业应用,可能会错过在C端市场建立更深度连接,提供更个性化和情境化体验的机会。
华为自身就是个很好的例证。虽然华为以前的产品在某些B端企业中已经得到了使用,但影响力并不显著,反而通过ChatGPT的爆火而为人熟知。
随着AI技术的不断发展和普及,越来越多的普通消费者开始接触和使用AI产品。在这样的背景下,那些拥有良好用户体验和人性化交互能力的产品,将会拥有更大的市场需求和发展空间。
总的来说,华为盘古大模型若是只顾“低头做事”,也可能在一定程度上忽视了AI的广泛性、创新性和人性化。一款出色的AI大模型,不仅能“做事”,也能“作诗”,才能实现真正的平衡和全面的发展。