金拱门


Wan-Move是阿里通义实验室、清华大学等机构联合开发的开源AI视频生成框架,专注于通过精准运动控制技术实现高质量视频合成。核心技术是"潜在轨迹引导",能在现有图像到视频模型基础上无缝添加点级运动控制,支持5秒480P视频生成,运动控制精度超越主流开源方案22.5%。框架无需修改基础模型架构,通过复制第一帧特征到后续帧实现运动注入,适用于单目标、多目标及复杂场景(如多人互动、物体交互),并在MoveBench基准测试中取得FID 12.2、EPE 2.6的顶尖性能。用户可通过ComfyUI插件或云端平台体验,模型已在GitHub开源。
Nemotron 3 是英伟达发布的开源 AI 模型系列,包含 Nano、Super 和 Ultra 三种规格。采用混合潜在专家混合(latent MoE)架构,显著提升推理效率并降低运行成本。其中,Nemotron 3 Nano 拥有 300 亿参数,每次激活最多 30 亿参数,专为软件调试、内容摘要、AI 助手工作流及低推理成本信息检索等任务优化。相比上一代产品,其 token 处理吞吐量提升 4 倍,推理 token 生成效率提高 60%,并具备 100 万 token 的上下文处理能力。Nemotron 3 Super 和 Ultra 分别拥有约 1000 亿和 5000 亿参数,适用于多智能体应用和复杂 AI 场景。
前段时间,我在上海参加了一个 AI 聚会。活动本身聊的 AI 落地内容很多。但最让我印象最深的,是一位投资人前辈分享的学习方法。他说这个方法救了他,也改变了他投资时看人的标准。具体是什么呢?就是学会「问问题」。当你对一个问题感兴趣,就去和 DeepSeek 聊,一直聊,聊到它答不出来为止。这种「无限追问」的技巧,当时听完我觉得挺震撼的,但活动结束后,这事就被我抛在脑后了。没有尝试,也没惦记。直到最近,我刷到了 Gabriel Petersson 辍学,用 AI 学习进入 OpenAI 的故事。我才突然意识到,那位前辈说的「问到底」,在这个 AI 时代到底意味着什么。
EpicMola用AI生成《龙珠》真人版拍摄现场影像,为原作注入影视工业质感。该片改编自鸟山明同名漫画1-194篇,1986年2月26日至1989年4月19日在富士电视台播出153话,讲述小悟空与布尔玛寻找七颗龙珠的冒险旅程。
现在还有这款「Roubao(肉包)」完全基于 Android 原生开发的 AI 自动化助手,不仅打破了手机自动化依赖电脑运行、技术门槛高的痛点,更以开源免费的姿态,为普通用户提供了一条通往手机自主完成复杂任务的新路径。
Banana Slides是基于Nano Banana Pro AI模型的开源智能PPT生成工具,支持通过自然语言指令快速创建专业演示文稿。允许用户用一句话描述主题(如“人类对生态环境的影响”),可自动生成包含大纲、内容和排版的完整PPT,能上传参考图片或模板定制风格。特色功能包括语音修改(如“把第三页改成饼图”)、自动解析文档图表、多格式导出(PPTX/PDF),采用React+Python Flask技术栈,支持Docker一键部署。适用于教育、职场等场景,尤其擅长处理复杂主题如科技报告、历史演进等内容。
