作者|于惠如 编辑|刘宇
国内大模型之战,华为终于出手了。
7月7日,华为在开发者大会2023(Cloud)上发布盘古大模型3.0。但与此前诸多公司的大模型发布会不同,华为没有在现场展示大模型写诗、作画的能力。
(资料图片仅供参考)
“盘古大模型3.0不写诗,只做事。”华为常务董事、华为云CEO张平安给盘古大模型3.0定调——盘古3.0完全面向行业,意在重塑各行各业,让每个行业、每个企业、每个人都拥有自己的专家助手。
盘古3.0发布的前一天,华为轮值董事长胡厚崑在2023世界人工智能大会上称,此轮人工智能浪潮中,华为的思路是推动人工智能“走深向实”,赋能产业升级。
据张平安介绍,“为B端而生”的盘古大模型目前已经覆盖金融、金融、制造、医药研发、煤矿、铁路等十余个行业,覆盖400多个业务场景。
在“BATH”中,华为是最晚介绍大模型进展的公司。但华为对大模型的探索很早就已开启。
2019年-2020年,盘古大模型投入AI大模型研发;2021年4月,华为云盘古大模型正式对外发布;2022年,盘古大模型落地行业应用。
从盘古1.0至盘古3.0,华为在大模型架构和训练方法上进行了升级,盘古3.0包含“5+N+X”三层架构、多个模型。
在盘古3.0架构中,L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型,提供满足行业场景中的多种技能需求。L1层是N个行业大模型,既包括用行业公开数据训练的行业通用大模型,如政务,金融,制造,矿山,气象等大模型;也包括基于行业客户自有数据,在盘古大模型的L0和L1层上训练而来的企业专有大模型。L2层是针对更多细化场景的模型,“开箱即用”。
在发布会后的媒体采访中,张平安透露,对于盘古大模型的下一步计划,华为内部制定非常激进的技术路线。“华为云现在是‘All in盘古大模型’,目标图制定得密密麻麻。”在中国市场成功之后,盘古大模型将继续在海外拓展。
据不完全统计,截至7月,全球已发布数百个大模型,中国有80多个。“百模大战”中,华为为何选择行业大模型作为突破口?
张平安给出的答案是:目前大模型大多数应用都集中在To C领域,在面向行业应用时,由于行业数据获取难,技术与行业know-how结合难,大模型在行业的落地进展较慢。而政企业务的长期积累是华为做行业大模型的优势。
华为云人工智能领域首席科学家田奇表示,目前全球基于大模型开发To B应用的企业不到三分之一,行业中的海量业务场景迫切需要更多专业的大模型和专业的AI应用来解决,弥补通用大模型落地行业的不足。
一位AI领域专家表达了类似的观点:“英雄得有用武之地,科技成果要转化成生产力,还是得有场景,有应用,有商业落地。”
与移动互联网时代的C端客户驱动不同,AI浪潮中大模型技术的变革,动力将由B端客户驱动。不仅仅是华为,其它科技巨头们也已经意识到了这一点,纷纷从最初豪言“打造中国的通用大模型”的状态,将重点转移至行业大模型上。
百度在发布文心大模型后又打造了文心千帆,为企业客户服务;阿里的通义千问在发布之时便宣称要为每一个企业打造专属大模型;腾讯同样发布了行业大模型解决方案。
“大模型发展到现在,‘BATH’的路线其实很相似,成为‘模型底座’,为B端客户提供服务,同时售卖算力赚钱。”上述AI领域专家告诉全天候科技。
以华为为例,在这场大模型竞赛中,华为扮演了“淘金者”和“军火商”的双重身份。
大模型所需要的各项根技术,从底层芯片、数据中心,到上层开发框架、开发平台、工程平台,华为自成一体,形成闭环生态。
同时,华为还升级算力设备、出租算力网络,赚取“军火钱”。盘古3.0发布的同时,华为云推出专门为AI行业建立的昇腾云服务,并在贵安、乌兰察布上线两个新的AI算力中心。
“华为具有典型的To B基因,拥有丰富的与B端客户打交道的经验,懂行业know-how,也积累了足够多的行业数据。从这个角度讲,华为的机会很大。”前述AI领域专家对全天候科技说。
激烈竞争已经开始,谁能在“百模大战”中领先一步,还需要时间验证。