前段时间,受邀参加了科大讯飞星火大模型的一场活动,在活动上讯飞展现了星火大模型百日内的快速迭代升级成果,展现科大讯飞在认知智能领域业界领先的技术水平和快速迭代能力,以及认知大模型在各个领域的商业化潜力。
彼时,我通过社交网络谈了三点感受。
1、星火大模型虽然是一个通用的行业大模型,但第一个杀手级的突破性应用一定来自于教育领域。
(相关资料图)
今天畅言智慧课堂和星火大模型的合作,就是给行业指明了一条道路。这个落地,更多的是从教师层面来提高教育教学的效率,当然反馈过来也让学生可以更高效的掌握知识。
2、至于两个月后,也就是10月24号星火大模型能不能超过GPT,我还是保持观望的态度。
当然,能有一个目标是好事,可以激发团队创业创新的动力。正所谓,取法于上,仅得为中;取法于中,故为其下。
3、科大讯飞与华为合作发布星火一体机,意味着大模型全面开启商业化探索。
据科大讯飞官方信息,讯飞星火一体机将面向金融、国企、央企等重点行业客户,提供基于行业专用数据的自主可控私有化大模型,加速推动重点行业的数智化转型升级,目前已经与多家行业头部客户达成试点意向。
这两天,刘庆峰又因透露“华为GPU已可对标英伟达A100”,引发广大媒体关注。
有朋友让我进一步阐述这三个观点,今天就来进一步聊聊。
从通用大模型到行业大模型 大模型在教育领域迅速落地
近来,随着大模型相关话题讨论持续深入下去,大家逐渐意识到大语言模型虽然经过了大量的训练数据,具有较高的普适性,能够解决很多常见的人工智能问题。但是,由于通用大模型的训练数据和目标应用范围较广,因此在某些特定领域的应用效果可能不够理想。
比如银行、医疗、教育机构,考虑到安全性和适配性,就不大可能用通用大模型,它们更需要TOB领域的行业大模型,来满足特点的需求。例如,医疗领域的行业模型可以分析医学图像和临床数据,帮助医生进行诊断和治疗;金融领域的模型可以分析市场数据和信用风险,帮助银行做出更准确的决策;教育领域的行业大模型,可以根据班级特色和主题需求定制化设计班会内容和活动,帮助教师更加高效地管理班级各项事务。
中国互联网发展了这么多年,已经凝练出来了无数细分领域的产业场景,这些场景理论上来说都可以被行业大模型重塑再造。而且大模型要想真正引爆市场机遇,要靠无数产业链上的合作伙伴共同参与,才能将理念变为现实。
如果还有人搞不懂我们为什么需要行业大模型,我举个通俗的例子。《倚天屠龙记》都看过吧,这部小说中九阳神功是一门盖世神功,也是一个基础大模型。这门功夫浩如烟海,对于大部分武林门派来说不知道从哪下手学习。
金庸老爷子创造性地提出一个操作方案:企业(门派)以九阳神功大模型为核心,根据自己的需求,加了特定参数,“蒸馏”出来少林九阳功、峨眉九阳功、武当九阳功,这三门功法就是三门行业大模型,分别对应少林、武当、峨眉三大门派。
同样的,这三个行业大模型分别适配这三大门派的使用场景需求,比如少林九阳功主要走的是刚猛雄浑的路子,大开大合,以外家功夫见长。武当九阳功阴阳并济,往往能够四两拨千斤,克敌制胜。简而言之,九阳神功作为一个大模型平台,企业(门派)可以在此基础上进行适配自身发展的创新,开发属于自己的大模型。
对于科大讯飞来说,现在要做的事情,就是在星火大模型的基础上,帮助广大企业快速的配置属于自己的行业大模型。
过去20年,科大讯飞在多个领域有所积累,在教育领域的积累更是深厚。尤其在过程化学情采集、智能评价、学习路径规划、精准教学和个性化学习这5个关键环节都实现了核心技术的突破,相关产品和服务已经应用于超过4万所学校。未来,在星火大模型V2.0的加持下,畅言智慧课堂能够更好地满足学生的个性化需求,减轻教师工作负担,提高教学效率与质量。星火教师助手还可以生成独特的课堂互动模板,通过设计小组讨论、角色扮演等环节,助力老师构建轻松有趣的课堂教学情境,以寓教于乐的方式点燃学生想象力。
当然,讯飞做的是全行业赋能,在教育领域落地的同时,也会在政务、工业、消费、医学等领域,开展各种形式的行业落地,我们对此拭目以待。
能否超越GPT4 考量两个要素:对方因素和自身因素
今年5月,科大讯飞正式发布讯飞星火认知大模型,彼时当刘庆峰喊出“对标ChatGPT”口号时,引发了业界广泛关注和争议。当时,没人会相信有一家来自中国的企业,能在大模型这个领域超越行业老大ChatGPT。
我也持怀疑和观望态度!
不过,这几个月出现了一些预期之外的变化。首先是ChatGPT自身发展不及预期,2023年6月份,ChatGPT的访问量环比下滑9.7%,为其推出以来首次。有专家提醒警惕泡沫化风险,还有人认为以ChatGPT为代表的大模型要重蹈区块链和元宇宙的覆辙——这些风口来的很快,去的也很快。
ChatGPT访问量下滑,倒不能证明行业泡沫要来,但恰恰说明大模型的春天要来了。说明有越来越多的企业研发了各类新的大模型,大模型的机会没有被ChatGPT一家独占,市场呈现多元发展的态势。大模型的市场正在多元化发展,不再仅仅依赖于一个单一的ChatGPT,而是有越来越多的选择,这有助于推动整个大模型市场的健康发展。
另外一个要素是,中国无论从官方政策引导还是市场自身发展速度来看,都对AI算力、大数据、大模型等开启了加速度,某些领域在短短几个月走过了过去几年都不曾有过的发展步伐。
工信部数据显示,截至2023年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197EFLOPS,算力总规模近五年年均增速近30%,存力总规模超过1080EB。在8月19日召开的2023中国算力大会上,工业和信息化部副部长张云明在会上透露,目前中国算力产业已初具规模,工业和信息化部将结合算力行业发展的最新情况,在广泛调研的基础上,加快出台推动算力基础设施高质量发展的政策举措,进一步加强顶层设计,为算力基础设施发展提供强有力的政策保障。
这两天,2023亚布力中国企业家论坛第十九届夏季高峰会如火如荼举行,科大讯飞创始人刘庆峰透露了一个振奋人心的消息:华为的GPU能力现在已经跟英伟达A100一样了。任正非高度重视,还有华为的三个董事到科大讯飞专班工作,现在已经做到对标英伟达的A100。今天我们跟ChatGPT还有差距,但是我们很清楚,10月份就能赶上,明年上半年就对标GPT-4。
至于华为的GPU有没有超过英伟达,尚有争论余地。但是可以肯定的是,相比英伟达可能卡脖子的产品,华为的产品可以更便捷、放心地应用到中国的算力时代。早年任正非先生前对华为人工智能的部署时也提到过两点要求,首先是华为各系列产品智能化;其次是AI首先在华为内部先使用,持续探索支持内部管理优化和效率提升,形成经验总结后向外推广。
现在看来,华为已经到了“形成经验总结后向外推广”。中国的企业强强联合每天都在进步,反观ChatGPT被各种因素制约,发展没有预期顺利。这两个因素结合在一起,就让中国的科大讯飞以及百度们,大大缩短了与ChatGPT的差距。
至于具体哪天比肩甚至超过,反而没必要纠结了。
大模型的商业化时代要来了:TOB肯定是突破口
自去年12月以来,有很多伪大模型产品和换皮ChatGPT的大模型割了大量韭菜,这些产品赚到了大模型时代的第一桶金,因此有人开玩笑说“大模型的商业化在C端”。
显然,这是一种错觉。
那么,大模型是靠什么盈利,卖软件?卖硬件?卖软硬一体的服务?卖广告?
大模型的盈利前景当然充满了无限可能,但突破口肯定是B端,也就是基于千百万个行业的具体商业解决方案。
比如钉钉,前不久率先给出了行业内首个大模型落地应用场景的商业化方案:在钉钉专业版年费9800元基础上,增加10000元即可获得20万次大模型调用额度;在专属钉钉年费基础上,增加20000元即可获得45万次大模型调用额度。相当于一次调用平均只需不到5分钱。
钉钉的大模型盈利模式简单粗暴,但这种直接以量计费的方式也确实简单明了,容易被客户接受。当然,这种收费模式背后是钉钉基于AI PaaS所探索的一系列落地实践,为的是解决中小企业“用得起”大模型的问题。首批11款智能化SaaS已经上架,服务于各个领域。
回到科大讯飞。8月15日的发布会上,科大讯飞携手华为发布星火一体机,让所有企业都可以在国产自主创新的平台上,更方便、更自主、更安全可控地私有化部署大模型。
该怎么理解星火一体机?简单来说,就是让中小企业使用大模型就像我们买精装修房子一样,达到“拎包入住”的体验感受。星火一体机可视化节目,开箱可用,提供从底层算力、AI框架、训练算法、推理能力、应用成效等全栈AI能力,可用于问答系统、对话生成、知识图谱构建、智能推荐等多个领域的应用,具备大模型预训练、多模态理解与生成、多任务学习和迁移等能力,帮助企业打造专属大模型。
科大讯飞和华为的分工,具体来说,科大讯飞负责内容,也就是大模型产品本身。华为负责算力,也就是后端的芯片等产品,有了华为的算力支撑,大模型才能发挥出事半功倍的效力。
虽然科大讯飞没有公布意向客户数量,但通过百度和腾讯之前发表的动态来看,国内的中小企业对部署大模型很是上心,也愿意付费使用。比如百度方面,号称有超15万企业申请使用。
总之, 为大模型付费的虽然是B端企业,但最终受益的主要还是我们大众消费者。