混元世界模型1.5(Tencent HY WorldPlay)是腾讯发布的业界首个开源的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路。核心是WorldPlay自回归扩散模型,采用Next-Frames-Prediction任务训练,破解了实时性与几何一致性难题。实时交互生成,通过原创的Context Forcing蒸馏方案和流式推理优化,能以每秒24帧的速度生成720P高清视频;长范围3D一致性,借助重构记忆机制,支持分钟级内容的几何一致性生成;多样化交互体验,适用于不同风格场景及第一、第三人称视角。
>>展开阅读
Bee是腾讯混元团队与清华大学联合推出的全栈开源多模态大模型解决方案,通过提升数据质量缩小开源模型与闭源模型的性能差距。项目包含三大核心成果:1500万规模的高质量双层CoT数据集Honey-Data-15M、开源的数据增强工具HoneyPipe及DataStudio,以及基于该数据集训练的8B模型Bee-8B。Bee-8B在多项基准测试中表现优异,尤其在数学推理和图表理解任务上超越了主流半开源模型。项目通过公开数据集和方法论,为开源社区提供了提升MLLM性能的重要基础设施。
>>展开阅读
SRPO(Semantic Relative Preference Optimization)是腾讯混元推出的文本到图像生成模型,通过文本条件信号优化奖励机制,实现在线调整奖励,减少离线微调依赖。SRPO引入Direct-Align技术,避免后期过度优化,提高训练效率。模型能显著提升生成图像的真实感和审美质量,广泛应用在数字艺术创作、广告营销、游戏开发、影视制作及VR/AR等领域,为创作者提供高效、灵活的图像生成解决方案。
>>展开阅读