阶跃星辰：万亿参数MoE，多模态融合的AI前沿探索- 中国厦门网

当前位置：中国厦门网> 财经> 企业报道>正文内容

阶跃星辰：万亿参数MoE，多模态融合的AI前沿探索
2024年07月06日来源：中国厦门网

提要：图像生成大模型Step-1X的推出，进一步丰富了阶跃星辰的多模态矩阵。Step-1X不仅在语义对齐和指令跟随能力上表现出色，更针对中国元素进行了深度优化，使得生成的图像更具中国风格，更符合国人的审美偏好。无论是《大闹天宫》AI互动体验中的角色生成，还是《葫芦兄弟》的视频生成演示，都展现了Step-1X在多模态理解和生成统一技术路线上的显著成就。

在2024年世界人工智能大会的聚光灯下，阶跃星辰携其Step系列大模型家族惊艳亮相，不仅展示了在万亿参数MoE大模型的深厚积累，更通过多模态融合的创新实践，为AI行业描绘了一幅通向AGI的宏伟蓝图。

万亿参数MoE：从量变到质变的飞跃

阶跃星辰的Step-2万亿参数MoE大模型，无疑是本次大会的一大亮点。与业界常见的upcycle训练方式不同，阶跃星辰选择了更为艰难但也更具有潜力的自主研发路径，从头开始训练，这无疑是对算力与技术的双重挑战。在MoE架构设计上的创新，包括部分专家共享参数以及异构化专家设计，确保了模型在保持通用能力共享的同时，每个专家模块依然保有其独特性，从而增加了模型的多样性和整体性能。这种设计不仅使Step-2的总参数量达到了前所未有的万亿级别，更重要的是，每次训练或推理所激活的参数量也超越了市面上大部分密集模型，实现了从量变到质变的飞跃。

多模态融合：理解与生成的统一

多模态融合是通往AGI的关键步骤，阶跃星辰对此有着深刻的认识。Step-1.5V多模态大模型的升级，标志着公司在这一领域取得了实质性的进展。相比于之前的版本，Step-1.5V在感知能力上有了显著提升，不仅能理解复杂的图表、流程图，还能准确感知物理空间的几何位置，处理高分辨率图像。更引人注目的是，它还具备了理解视频的能力，能够洞察视频中的物体、人物、环境及其情绪，展现出了强大的共情能力。而这一切，都离不开Step-2万亿参数模型的指导，在RLHF训练过程中，Step-2作为监督模型，为Step-1.5V提供了坚实的理论与实践基础，使其推理能力得到了质的飞跃。

图像生成：中国风的深度优化

图像生成大模型Step-1X的推出，进一步丰富了阶跃星辰的多模态矩阵。Step-1X不仅在语义对齐和指令跟随能力上表现出色，更针对中国元素进行了深度优化，使得生成的图像更具中国风格，更符合国人的审美偏好。无论是《大闹天宫》AI互动体验中的角色生成，还是《葫芦兄弟》的视频生成演示，都展现了Step-1X在多模态理解和生成统一技术路线上的显著成就。

现场观众体验《大闹天宫》H5游戏

阶跃星辰的探索，不仅在于技术的突破，更在于对未来AI生态的构建。公司创始人姜大昕博士曾明确提出，大模型的演进将经历三个阶段：从单一模态的独立发展，到多模态的初步融合，最终实现生成与理解的统一，与机器人结合形成具身智能。阶跃星辰正沿着这一路线，以万亿参数MoE和多模态融合为核心，不断拓展AI的边界，为通向AGI的征途提供强有力的支持。从Step-2到Step-1.5V，再到Step-1X，每一步都见证了阶跃星辰在AI前沿探索中的坚定步伐，它们共同构成了阶跃星辰在AI领域持续创新的坚实基石。

责任编辑：杜烽