混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

混元世界模型1.5(Tencent HY WorldPlay)是腾讯发布的业界首个开源的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路。核心是WorldPlay自回归扩散模型,采用Next-Frames-Prediction任务训练,破解了实时性与几何一致性难题。实时交互生成,通过原创的Context Forcing蒸馏方案和流式推理优化,能以每秒24帧的速度生成720P高清视频;长范围3D一致性,借助重构记忆机制,支持分钟级内容的几何一致性生成;多样化交互体验,适用于不同风格场景及第一、第三人称视角。混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

>>展开阅读

SAM Audio - Meta推出的开源多模态音频分割模型

SAM Audio是Meta推出的开源多模态音频分割模型,从复杂的音频混合中精准分离出任意目标声音。通过结合文本、视觉和时间维度的提示,实现灵活、高效的音频处理,为音频编辑、去噪、声音提取等任务提供了全新解决方案。用户可以通过简单的文本描述(如“吉他声”)、在视频中点击发声物体,或者标记声音出现的时间范围来使用SAM Audio。SAM Audio - Meta推出的开源多模态音频分割模型

>>展开阅读

A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI(Agent-to-User Interface)是谷歌开源的Agent驱动型界面协议,解决AI代理生成复杂交互界面的难题。通过一种声明式JSON格式,让AI代理描述用户界面的结构,客户端应用(如Flutter、Angular等)将这些描述转换为原生组件,实现跨平台兼容与动态更新。A2UI的核心优势在于其非执行代码特性,所有UI描述均为静态数据,不执行代码,从而规避了LLM生成代码的安全风险。支持渐进式渲染,适配对话场景中的实时交互需求,并且框架无关,同一JSON配置可以在不同平台渲染。能根据对话上下文动态生成表单、地图等组件。例如订餐时,AI可直接弹出带日期选择器的界面,避免繁琐问答。项目已集成至Gemini 3模型,可通过GitHub快速体验餐厅预订等Demo案例。A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

>>展开阅读

什么是“JAM 堆栈”?你应该使用它吗?

e39f24385f93b86JAM栈,常常作为程式化或Jamstack JAMStack,是指使用JavaScript、API 和Markup开发客户为中心的网站和应用程序。建立在 Jamstack 上的系统将在客户端运行其所有逻辑,消除服务器端组件。该术语由Netlify创造,描述了一种 Web 开发方法,可提供更高的性能、更好的安全性和改进的开发人员体验。Jamstack 站点在浏览器中自给自足,而不是在每个页面加载时产生服务器往返。

>>展开阅读

IGN给Commodore 64 Ultimate复古主机打出满分10分

IGN给Commodore 64 Ultimate打出10分满分的评价,测评者认为这是其体验过最出色的现代复古科技产品。“Commodore 64 Ultimate完美复刻了这款史上最畅销的个人电脑,并巧妙地融入了现代化的改进,为玩家带来精准还原、原汁原味的8位复古乐趣。”

>>展开阅读

Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

Wan-Move是阿里通义实验室、清华大学等机构联合开发的开源AI视频生成框架,专注于通过精准运动控制技术实现高质量视频合成。核心技术是"潜在轨迹引导",能在现有图像到视频模型基础上无缝添加点级运动控制,支持5秒480P视频生成,运动控制精度超越主流开源方案22.5%。框架无需修改基础模型架构,通过复制第一帧特征到后续帧实现运动注入,适用于单目标、多目标及复杂场景(如多人互动、物体交互),并在MoveBench基准测试中取得FID 12.2、EPE 2.6的顶尖性能。用户可通过ComfyUI插件或云端平台体验,模型已在GitHub开源。Wan-Move - 阿里通义联合清华等开源的AI视频生成框架

>>展开阅读

Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 是英伟达发布的开源 AI 模型系列,包含 Nano、Super 和 Ultra 三种规格。采用混合潜在专家混合(latent MoE)架构,显著提升推理效率并降低运行成本。其中,Nemotron 3 Nano 拥有 300 亿参数,每次激活最多 30 亿参数,专为软件调试、内容摘要、AI 助手工作流及低推理成本信息检索等任务优化。相比上一代产品,其 token 处理吞吐量提升 4 倍,推理 token 生成效率提高 60%,并具备 100 万 token 的上下文处理能力。Nemotron 3 Super 和 Ultra 分别拥有约 1000 亿和 5000 亿参数,适用于多智能体应用和复杂 AI 场景。Nemotron 3 - 英伟达发布的开源 AI 模型系列

>>展开阅读