为什么现代 AI 能做成?Hinton 对话 Jeff Dean

2025 年 12 月初,圣地亚哥 NeurIPS 大会。Geoffrey Hinton(神经网络奠基人、2024年诺贝尔物理学奖得主)与Jeff Dean(Google首席科学家、Gemini模型联合负责人、TPU架构师)的炉边对谈,成为这场大会的重要时刻。

>>展开阅读

nano11 24H2 - Win11 精简版

著名制作系统精简版的开发者 NTDEV 发布了 Win11 24H2 精简版,装后在硬盘上只占用约 7.5GB 的空间。移除 Win11 中无用的功能,即使在低端电脑上也能带来更高的性能。20251218-3

>>展开阅读

Vibe Coding - 与 AI 结对编程工作流程

一个与 AI 结对编程的终极工作流程「Vibe Coding」旨在帮助开发者丝滑地将想法变为现实。本指南详细介绍了从项目构思、技术选型、实施规划到具体开发、调试和扩展的全过程,强调以规划驱动和模块化为核心,避免让 AI 失控导致项目混乱。20251218-2

>>展开阅读

混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

混元世界模型1.5(Tencent HY WorldPlay)是腾讯发布的业界首个开源的实时世界模型框架,涵盖数据、训练、流式推理部署等全链路。核心是WorldPlay自回归扩散模型,采用Next-Frames-Prediction任务训练,破解了实时性与几何一致性难题。实时交互生成,通过原创的Context Forcing蒸馏方案和流式推理优化,能以每秒24帧的速度生成720P高清视频;长范围3D一致性,借助重构记忆机制,支持分钟级内容的几何一致性生成;多样化交互体验,适用于不同风格场景及第一、第三人称视角。混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

>>展开阅读

SAM Audio - Meta推出的开源多模态音频分割模型

SAM Audio是Meta推出的开源多模态音频分割模型,从复杂的音频混合中精准分离出任意目标声音。通过结合文本、视觉和时间维度的提示,实现灵活、高效的音频处理,为音频编辑、去噪、声音提取等任务提供了全新解决方案。用户可以通过简单的文本描述(如“吉他声”)、在视频中点击发声物体,或者标记声音出现的时间范围来使用SAM Audio。SAM Audio - Meta推出的开源多模态音频分割模型

>>展开阅读