- 百日突破:阶跃星辰大模型家族亮相,性能直逼GPT-4
- 2024年07月06日来源:中国厦门网
提要:在人工智能的快速发展中,100天足以见证技术的巨大飞跃。AI效率工具“跃问”展示了100天的潜力:掌握一门新语言、学习编程、乐器演奏,或是绘画、摄影等技能。而其背后的创造者“阶跃星辰”,在这100天内,从万亿参数规模和多模态能力出发,推出了其大模型“全家桶”系列,标志着在应用落地方面迈出了重要步伐。
在2024年世界人工智能大会(WAIC 2024)上,首次参展的阶跃星辰发布了万亿级参数的MoE(混合专家)大语言模型Step-2正式版,以及Step-1.5V多模态大模型和Step-1X图像生成大模型。这些模型不仅展示了技术能力,还在WAIC 2024期间与上影合作,首次展示了AI大模型的应用落地效果。
在人工智能的快速发展中,100天足以见证技术的巨大飞跃。AI效率工具“跃问”展示了100天的潜力:掌握一门新语言、学习编程、乐器演奏,或是绘画、摄影等技能。而其背后的创造者“阶跃星辰”,在这100天内,从万亿参数规模和多模态能力出发,推出了其大模型“全家桶”系列,标志着在应用落地方面迈出了重要步伐。
阶跃星辰的创始人兼CEO姜大昕认为,多模态理解和生成的统一是实现AGI(通用人工智能)的关键路径。他强调,模型参数量是决定模型能力上限的关键,而万亿参数的Scaling Law是实现AGI的核心。通用大模型的能力也为垂直领域大模型设定了上限。
随着AI技术的新一轮革新,阶跃星辰正利用其大模型技术和应用,推动中国在全球AI领域的持续领先。
自20世纪50年代图灵提出AI概念以来,AI领域经历了多次技术迭代。从符号主义到联结主义,再到深度学习的崛起,每一步都为AI注入了新活力。2022年底,ChatGPT的出现标志着AI新纪元的开启,也展示了生成式AI产业的成长轨迹。
2024年3月,成立不久的阶跃星辰首次公开亮相,带来了Step-1千亿参数语言大模型和Step-1V千亿参数多模态大模型,引起了广泛关注。公司以实现AGI为目标,专注于通用大模型的研发,并基于此打造了新一代的“AI+”应用。
在短短100天后,阶跃星辰再次发力,推出了万亿参数规模的大语言模型Step-2正式版。Step-2采用MoE混合专家模型架构,在多个领域的表现直逼GPT-4。公司选择了从头开始训练MoE模型的高难度路径,以获得更高的模型上限。
阶跃星辰的Step-2在训练过程中,团队突破了多项关键技术,包括6D并行、极致显存管理和完全自动化运维。同时,Step-1.5V多模态大模型在多模理解和生成统一的技术路线上取得了快速突破,Step-1X图像生成大模型则支持全链路自研的DiT模型架构。
此外,阶跃星辰的Step系列通用大模型因其技术创新和广泛的落地应用实力,荣获WAIC 2024 SAIL之星。
阶跃星辰不仅在大模型技术和方案上提供强大能力,其应用落地也在不断扩展。AI作为新生产工具,已在多个领域得到广泛应用,推动了传统行业的转型升级。
今年3月,阶跃星辰推出了两款面向消费端的自研大模型产品——效率工具跃问和AI开放世界平台冒泡鸭,均已全面开放使用。跃问提供多样化服务,结合联网搜索和代码分析增强能力,有效理解和回应用户查询。冒泡鸭则为用户提供了一个沉浸式的故事创作和角色探索平台。
在WAIC期间,阶跃星辰联合上影推出了AI互动体验,将AIGC和大模型技术与《大闹天宫》情境深度融合,展现了中国传统文化的魅力。
阶跃星辰还在内容创作、金融财经等领域与合作伙伴进行深度合作,探索面向C端用户的创新应用,并推出了开放平台“繁星计划”,加速AI在行业场景的应用落地。
凭借自研的万亿大模型技术实力,阶跃星辰正推动中国AI产业的发展,形成了丰富的产业应用生态圈,并在重点行业实现了领先落地,成为中国大模型创业公司的第一梯队。