狂飙200多天后,国产大模型的数量已超过百家,正式迈入“百模大战”阶段。
越往后走,普通用户和产业各界对大模型的期待,也从“你家的大模型涌现了吗?”的能力突破,快进到了“大模型究竟能帮我干什么”的“价值涌现”。
(相关资料图)
这时候,基础大模型作为通用底座,要为行业/产业用户提供坚实的底层技术支撑,所承载的难度和重要性也不言而喻。
训基础大模型的难度,堪比登月。
每一代大模型的发布,都像是“登月”计划,前期工程细节准备非常多,模型的训练环境和真实环境相差很远,需要没有短板的技术、极高的工程能力和精确性才能顺利登陆产业,达到落地可用的标准。
就在8 月 15 日,讯飞星火认知大模型,就成功完成了第二次“登月”,发布了 V2.0 升级版本,代码能力和多模态交互能力实现重大升级。
从多模态理解、多模态生成、代码生成、代码补齐、代码解释、代码纠错和单元测试生成等一系列新能力及成果应用中,我们看到了国产基础大模型的持续进化。
星火认知大模型V2.0,就如同一艘新的“登月火箭”,进一步拓展了大模型在产业的探索边界,也为大模型应用和生态的蓬勃爆发,提供了坚实支撑。
回溯讯飞星火的“登月”之路,我们可以看到,大模型的底座价值是如何一步步“涌现”的。
建造火箭:能力涌现,为应用筑底座
探索广袤而未知的产业宇宙,需要一艘坚固的可以长途旅行的航天火箭。和“登月计划”一样,大模型的第一步,是建造并发布一个“能力涌现”的基础模型。
大模型发展到今天,其能力限制已经比较明显了:
一是先天不足,容易产生幻觉和遗忘问题,这会导致大模型的回答精度和准确度不高,在需要复杂逻辑的严肃场景中,达不到产业客户采购所需要的质量。
二是后天短板,大模型不是一次发布就高枕无忧了,需要用户反馈的“数据飞轮”,充沛算力和迭代优化的持续保障,没有决心打持久战,通用大模型很快会在激烈的技术竞争中落后。
对于行业和企业来说,所希望引入的,当然是能够持续进化、能力领先的基础大模型。
显然,科大讯飞作为基础大模型的“第一梯队”,也注意到了上述应用现状,并在此次V2.0升级发布会上,为讯飞星火实现了三重能力升级:
一是基础能力的再升级。
大模型的基本综合能力,是作为通用底座支撑智能经济的前提条件。
作为中国人工智能“国家队”, 讯飞星火大模型推出以来,就拥有7大核心能力,包括多风格多任务长文本生成能力、多层次跨语种语言理解能力、泛领域开放式知识问答能力、情境式思维链逻辑推理能力、多题型可解析数学能力、多功能多语言代码能力、多模态输入和表达能力。此次V2.0升级中,讯飞星火的各项能力则再一次增强。
比如代码能力,就被认为是大模型的“硬实力”,是理解能力、逻辑能力、生成能力的集大成者。此次讯飞星火2.0对代码能力进行5个维度的升级,包括代码生成、代码补齐、代码纠错、代码解释、单元测试生成。
根据认知智能国家重点实验室构建的代码的真实的场景使用的测试集,代码生成和补齐维度上已经超过了ChatGPT。
二是关键技术的再进化。
经过一段时间的产业实践和反馈,讯飞星火也在不断进化,快速迭代,以回应产业需求。
在刘庆峰看来,多模态能力是赋能行业的刚需,也是实现通用人工智能的必经之路,同时也是科大讯飞既定的人工智能技术长期战略。
在8 月 15 日的V2.0 升级版本中,讯飞星火还重磅发布了多模态能力,在图像描述、图像问答、识图创作、文图生成、虚拟人合成等方面全新升级。多模态能力升级后,讯飞智作2.0进一步降低短视频制作的门槛,无论是视频的后期处理还是创意视频生产都能轻松搞定,有望满足更多元的视频制作需求,推动AIGC产业的发展。
讯飞星火的能力持续突破,也将不断赋能AI-native原生应用,为生长在“讯飞星火”上的垂类模型和AI应用,提供源源不断的创新动能。
三是垂直领域的再创新。
提高大模型在严肃场景中的准确率就需要聚焦场景,约束环境,结合专有数据进行训练。至今,讯飞星火已经在一些关键领域,比如教育、医疗、汽车、办公、工业、智能硬件等,将认知智能大模型技术落地应用,打造独具优势的行业专用模型,来支撑行业数字化转型和应用创新开发。
以教育场景为例,传道受业解惑是非常认真严肃的场景,用人工智能助力课堂创新,对大模型的认知能力要求很高。科大讯飞全新发布的星火教师助手,支持教学设计的三大环节,创新规划单元教学设计、启发创设情境教学活动、一键生成互动教学课件,大大提升老师的备课效率。
基础大模型,是大模型产业的核心引擎,讯飞星火认知大模型的这三重“能力涌现”,构筑了一个坚实底座,满足了产业各界对基础大模型的期待,也在后续的产业加速落地提供动能。
加速推进:价值涌现,为应用输动力
大模型的“价值涌现”从产业的角度看,就是将大模型的AI技术红利,转化为最终的生产力,为产业提质增效,带来社会数字经济的增长。
这就需要大量、广泛、持续地应用大模型,就像火箭分级一样,仅仅发布出去还不够,还需要加速器进一步使力,推动大模型与行业场景相融合,提升大模型在产业当中的应用密度。
当各界的关注点从“能力涌现”转移到“价值涌现”时,讯飞星火认知大模型也率先交出了答卷,实现了在教育、医疗、汽车、办公、工业、智能硬件等多个行业的深度应用。
具体来说,当AI深入产业会遭遇一个“不可能三角”:普及度、质量、成本。
如果一个AI大模型应用的普及度很高,比如AIGC生成写真,开发成本不高,用户对质量的要求低,就非常容易陷入低质低价的红海竞争。而一个严肃的行业场景,比如矿山,对生成结果的质量要求很高,但场景个性化与琐碎,定制化开发的成本高,普及度就很难提高。
这个“不可能三角”禁锢着大模型的技术商业化和快速增长。那么,有没有办法打破这个“不可能三角”,让大模型的应用受众多、质量高、成本低呢?
“讯飞星火”还真的实现了。主要做了以下几件事:
首先,打磨产品助普及。
以提供应用价值为导向,在一些特定场景中带来实打实的产品,持续释放生产力,为大模型技术的普及度和质量带来保证,有力地提升用户的采购意愿。
此次升级,除了技术获得重大突破,搭载讯飞星火认知大模型核心能力的应用和产品也越来越丰富:既有代码快速生成或者改Bug的智能编程助手iFlyCode1.0,能够进行视频创作的讯飞智作2.0,还有帮助教师设计教学活动、一键生成课件的星火教师助手,面向学生口语练习的星火语伴2.0,讯飞AI学习机也升级AI编程空间和AI创意画板。
这些产品和应用,会进一步加速AI大模型的普及,成为人人可用的生产力工具。
其次,聚焦场景保质量。
在通用大模型的基础上,讯飞面向重点行业客户以私有化部署的方式,帮助行业客户构建自主可控的行业大模型,目前已经与多家行业头部客户达成合作意向。6月30日,讯飞和人保科技签订协议,推进大模型技术在金融垂直领域的应用,加速推动金融业的数字化转型和智能化发展。助力特定行业降本增效,产生的标准化解决方案则有望与行业伙伴一起,在其他企业规模复用。
最后,携手伙伴降成本。
降低成本、扩大产业影响力,不可能靠自己单打独斗,需要产业链上下游生态的紧密支持。以算力成本为例,讯飞就始终坚持开放合作,积极引入国产化算力,在WAIC2023期间举办的昇腾人工智能产业高峰论坛上,科大讯飞发布了与华为在自主可控方面的最新合作成果——讯飞星火与华为昇腾强强联合,全力打造国产通用智能新底座。此次发布会上,讯飞又进一步和华为合作,推出了每个行业都可以快速部署的星火一体机,具备性能领先、安全可控、开箱即用等特点。
讯飞和产业链伙伴一起,缓解大模型算力荒、算力贵的问题,降低大模型的落地成本,为长期持续发展奠定了条件。
和OpenAI“拿着锤子找钉子”的大模型思路不同,科大讯飞在大模型领域的突出优势,就是以应用为导向,由具体场景牵引,与产业链协同进化,以保证大模型可以快速完成价值的自证与他证,从而加速进入各行各业。
此前科大讯飞发布的2023年半年报显示,讯飞星火认知大模型发布后,2023年5月-6月,公司C端硬件GMV创历史新高,同比翻倍增长。以学习机为例,5月-6月,大模型加持后学习机GMV分别同比增长136%和217%。
由此可见,大模型的真实价值,已经在供给端(讯飞星火)和应用端(行业用户),都开始“涌现”。
成功着陆:生态涌现,为应用造丛林
“登月”的最后一个阶段是“着陆”,没有商业化的成功落地,厂商很难回收前期的研发成本,无力继续投入新一轮技术研发。
开启大模型的良性商业循环,让大模型产生业务价值,就需要在落地探索成功之后,营造一个适合大模型持续壮大的产业生态环境,包括辅助大模型的开发工具、软硬件基础设施、开放平台等。
正如刘庆峰所说,“中国人工智能的发展绝不是单个企业、单个科研院所使命,而是整个社会的机会,生态的发展决定了产业的繁荣”。
围绕讯飞星火认知大模型的“生态丛林”建设起来,意味着不同类型开发者、企业都会聚集,如同热带雨林一般,在各自的生态位上交流、互动、生息,孵化出多样化、多角度的AI应用创新,才能让大模型产业更加繁荣、生机勃勃。
目前,讯飞人工智能开放平台已有很好的生态基础。讯飞星火认知大模型发布后,开发者数量在两个月内增加了85万家。截至2023年6月30日,讯飞人工智能开放平台已聚集497.4万开发者,近一年增长率45%;应用数172.5万,近一年增长率13.7%。
此次V2.0升级发布会中,讯飞还进一步面向包括央国企在内的行业客户提供业界领先、自主可控的私有化代码能力平台,降低开发者门槛,助力行业客户数字化、智能化转型。
此外,讯飞开放平台的AI星火营生态以及星火助手计划,可以让更多有创意和想象力的伙伴加入到讯飞开放平台,共同繁荣发展。
能力涌现、价值涌现、生态涌现,讯飞走完了这条从研到用、从点到链的产业成熟之路,国产大模型才有未来,中国AI才有未来。讯飞星火的 “登月之路”,也是基础大模型的通关密码。
“登月”的目标不是为了炫技,而是为了让更多行业和用户可以率先低成本地用上大模型,挖掘技术的富矿,触碰智能时代的魅力和机遇。
惠特曼在诗中写道:伟大的戏码继续上演,而你或可贡献一行诗句,一首新诗,甚至一个全新的故事。
大模型的“登月”之路上,科大讯飞正在全力以赴、不遗余力、充满激情、充满斗志地奋斗着,很快会在今年10月24日迎来第三次升级,届时将全面对标ChatGPT。
通用人工智能的伟大变革,才刚刚开始,不妨拿起笔来,点亮星火,和科大讯飞一起书写全新的故事。