【资料图】
IT之家 5 月 27 日消息,今日知乎联合面壁智能在“2023 中国国际大数据产业博览会”上发布了最新的大语言模型成果。知乎合伙人、首席技术官李大海表示,知乎模型应用“搜索聚合”即日开启内测,面壁智能研发的中文基座大模型 CPM-Bee10b 全面开源,并发布了对话类模型产品“面壁露卡”。
IT之家此前报道,在 4 月“2023 知乎发现大会”上,知乎发布了大语言模型“知海图 AI”并内测 * 站内大模型应用功能“热榜摘要”。时隔一个月之后,知乎带来了又一款站内的大模型应用功能“搜索聚合”。该产品将大模型能力应用到了知乎搜索上,每当用户触发搜索时,系统就会从大量提问和回答中聚合观点,提高用户获取信息、形成决策的效率。李大海表示,“搜索聚合”即日开启内测。
(“搜索聚合”展示图)
发布会上,面壁智能联合 OpenBMB 社区,将自研 CPM-Bee 10b 模型开源。李大海介绍,该模型从零开始自主训练,基于 Transformer 架构,中英双语表现优秀,拥有百亿量级参数、万亿级高质量语料。在 ZeroCLUE 评测中,CPM-Bee 10b 以总分 78.18 分登顶;在英文常识知识推理榜单上,CPM-Bee 10b 得到了 67 分的平均分,媲美英文开源模型 LLaMA。“CPM-Bee10b 将全面开源,并允许商用。”李大海称,面壁智能一直坚持开源路线,未来也会持续拥抱开源,促进大模型领域技术和生态的繁荣。
发布会还带了面壁智能研发的对话类模型产品“露卡”(Luca),该产品在开源基础模型上又有进一步性能提升,可以进行智能交互并支持多轮对话。在发布会现场演示中,“露卡”展示了多项能力,既能帮助人了解世界知识、处理数理逻辑、编写程序代码、激发创作灵感;还可以利用海量知识数据,帮助人更好地获取信息、做出规划、解决问题。发布会现场还展示了“露卡”多模态理解能力,不仅可以解析风景、地理等图片信息,还可以理解人物类图片所传达的情绪含义。此外,“露卡”还可以查找论文并生成摘要。李大海介绍,“露卡”目前已开启内测。
(面壁露卡对话展示图)