3月23日讯 (记者 毛明江 黄心怡)今日,一家颇为低调的通用大模型创业公司,在上海举行的2024全球开发者先锋大会期间正式对外亮相,在公众面前揭开其神秘面纱。
阶跃星辰创始人、CEO姜大昕博士在大会开幕式上对外发布了Step系列通用大模型,包括Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型以及Step-2万亿参数MoE语言大模型预览版。
▍技术大牛云集 以实现AGI为目标
阶跃星辰成立于2023年4月,聚集了多位人工智能界顶尖人才。其创始人和CEO是前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕博士,核心创始团队包括系统负责人朱亦博博士和数据负责人焦斌星博士。
姜大昕是自然语言处理领域的全球知名专家,在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。朱亦博拥有多次单集群万卡以上的系统建设与管理实践经验。焦斌星此前担任微软必应引擎核心搜索团队负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。
据悉,阶跃星辰自成立起,在算力、数据、算法和系统这四大要素上综合布局,在大模型技术路径上坚定投入攀登Scaling Law。公司创始团队认为,攀登Scaling Law是必须坚持但极其艰巨的任务,阶跃星辰团队因此聚集。公司有信心在通用人工智能领域开启追赶OpenAI的竞逐。
▍官宣Step系列大模型 万亿参数模型可预览
虽然成立仅一年,阶跃星辰团队对通往AGI的技术路径,有自己独到的深入理解。
首先坚定相信Scaling Law是方向,参数量决定了模型智能水平的上限,因此Step-1千亿参数语言大模型训练成功后,随即开展Step-2万亿参数大模型的训练工作。
其次是认识到多模理解和生成的统一是通往AGI的必经之路。Step-1V千亿参数多模态大模型,在多模理解上做到了业内领先。一方面验证了Step-1语言大模型的能力,另一方面也为多模生成打下一个好基础。
实测是检验大模型能力的最好方式。在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中,阶跃星辰研发的Step-1V 千亿参数多模态大模型位列第一,性能比肩 GPT-4V。Step-1V的多模理解能力突出,可以精准描述和理解图像中的文字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。此外,Step-1V亦可实现视频理解。
千亿参数模型只是阶跃星辰团队在攀登通用人工智能路上迈出的第一步。此次阶跃星辰还发布了Step-2 万亿参数语言大模型预览版,提供API接口给部分合作伙伴试用。
Step-2万亿参数语言大模型采用 MoE 架构,聚焦深度智能的探索。据了解,参数量从千亿到万亿,增长了一个数量级,对算力、系统、数据、算法四个方面都提出了极高的要求,业内只有极少数公司能做到。训练万亿参数模型体现了阶跃星辰的核心技术能力,也说明了公司探索通用人工智能的决心。
▍自有+合作 探索C端应用
当下,模型能力决定了AI应用水平的上限,同时也将创造全新的应用机会。阶跃星辰在此方面通过自有产品和合作产品两种方式,展开了积极探索。团队研发并推出了两款面向C端用户的大模型产品——效率工具“跃问”和AI开放世界平台“冒泡鸭”。均已全面开放使用。
此外阶跃星辰在金融、网络文学、知识服务等领域已与合作伙伴达成深度合作,共同探索面向C端用户的创新应用。
在金融领域,阶跃星辰与上海报业旗下界面财联社达成深度合作,双方围绕 AIGC 财经资讯、智能投研、智能投顾等领域推进大模型的应用落地。在网络文学领域,阶跃星辰与中文在线独家达成深度战略合作,共同探索大模型在灵感激发、内容创作等网络文学创作领域的应用。在知识服务领域,阶跃星辰与中国知网、中文在线达成战略合作,围绕大众知识服务等场景研究和推进大模型的应用。
“智能阶跃,十倍每一个人的可能”,是阶跃星辰的企业slogan。当下,大模型技术的研发和落地应用仍在快速迭代和探索中,围绕这一前沿技术,聚集最顶尖的人才与丰厚的战略资源,无疑是大模型创业公司的核心竞争力。
阶跃星辰在这样的大环境下从幕后走向台前,正式亮相并发布了一系列重要模型与产品,释放出公司管理层的技术理念与追求:实现通用人工智能或许并不遥远。