在备受瞩目的WAIC 2024世界人工智能大会上,中国新兴的AI明星企业阶跃星辰阶跃星辰首发了三款 Step 系列通用大模型新品:Step-2 万亿参数语言大模型正式版、Step-1.5V 多模态大模型、Step-1X 图像生成大模型。这是自今年三月正式亮相以来,阶跃星辰团队在短短 100 天左右达成的突破,实现了从千亿参数到万亿参数,从语言模型到多模态模型,从理解到生成的全面进步。
阶跃星辰于 2023 年 4 月成立,以“智能阶跃,十倍每一个人的可能”为使命,以实现通用人工智能为目标。阶跃星辰的创始人和 CEO 是前微软全球副总裁,微软亚洲互联网工程院首席科学家姜大昕博士,同时也是算法负责人。核心创始团队包括系统负责人朱亦博博士,拥有多次单集群万卡以上的系统建设与管理实践经验;数据负责人焦斌星,此前担任微软必应引擎核心搜索团队负责人。公司聚集了来自微软、谷歌、字节、腾讯等公司的顶尖人才。
回顾今年3月23日,阶跃在2024全球开发者先锋大会上正式亮相并发布了3款模型,即Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型、Step-2万亿参数MoE语言大模型(预览版)。7月4日,WAIC 2024大会现场,我们注意到阶跃星辰Step家族已经得到全面升级。Step-2万亿参数大模型预览版已经更新为正式版,企业和开发者可以通过阶跃星辰开发平台申请体验。
阶跃星辰创始人、CEO姜大昕博士介绍,Step-2 万亿参数语言大模型采用了创新的 MoE 混合专家模型架构,在数理逻辑、编程、知识、指令跟随等方面体感全面逼近国际主流模型。姜大昕博士认为,攀登 AGI 山峰,“万亿参数”和“多模融合”缺一不可。他表示,万亿参数规模,是实现 AGI 的基础门槛;多模态大模型,是通向 AGI 的必经之路。面向未来,阶跃星辰将持续将模型做大做强,打造超级模型,同时让模型服务于工作和生活,十倍每个人的可能。”
除了Step-2万亿基础模型的重大突破,阶跃星辰最新研发的多模态大模型——Step-1.5V也备受关注,为AI技术在更多场景的应用打开了想象空间。
据了解,阶跃星辰Step-1.5V是对其原有多模态大模型的全面升级。相比于之前的版本,Step-1.5V在图像感知和理解能力上实现了质的飞跃,并具备了出色的视频理解能力。这意味着,AI技术不仅可以更好地理解和分析图像信息,还可以更深入地理解和处理视频内容。
具体而言,Step-1.5V能够准确地识别视频中的物体、人物和环境,并理解视频的整体氛围与人物情绪。这使得AI技术在视频监控、智能安防、内容审核等领域的应用更加精准和高效。同时,Step-1.5V还能够根据图像内容进行解答数学题、编写代码、创作诗歌等高级推理任务,为AI技术在教育、编程、艺术创作等领域的应用提供了新的思路。
此外,阶跃星辰还发布了其在图像生成领域的最新成果——Step-1X图像生成大模型。该模型采用了全链路自研的DiT模型架构,具备更加强大的语义对齐和指令跟随能力,能够生成更具中国风格和文化特色的图像内容。这为AI技术在文化传承、创意设计等领域的应用开辟了新的可能性。
在应用落地方面,阶跃星辰的多模态大模型已经在多个领域取得了显著成果。例如,其与上海报业旗下界面财联社合作推出的君弘灵犀大模型,将大模型能力全面融入了客户智能化服务体系之中,为客户带来了全新的智能投顾问答和投研内容生产体验;而在内容创作领域,阶跃星辰联合上海电影在“AI+IP”领域进行创新探索,双方围绕《大闹天宫》和《葫芦兄弟》两款国民级 IP 进行了AI互动游戏开发和视频生成能力的展示。