悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

悟界·Emu3.5是北京智源人工智能研究院开源的多模态世界大模型，参数量达340亿，具备原生世界建模能力。通过10万亿多模态Token（含790年视频数据）训练，能模拟物理规律，实现图文生成、视觉指导、世界探索等任务。创新的"离散扩散自适应"技术使其图像生成速度提升20倍，性能超越Nano Banana模型。模型已开源，适用于具身智能、虚拟场景构建等领域。悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

>>展开阅读

Z-Image Turbo - 阿里通义开源 AI 绘画模型

作者:Jam 发布时间: December 3, 2025 分类:技术 No Comments

阿里巴巴通义实验室开源 Z-Image AI 绘画模型，其中 Z-Image-Turbo 在仅需 8 次函数评估的情况下，可达到或超过领先模型的性能。分享一个免费在线免费使用「Z-Image Turbo」网站，据介绍性能和效果碾压 Flux。免费在线体验，支持提示词示例与任务追踪。 20251202-2

>>展开阅读

AI一直在掩盖自己有意识？GPT、Gemini都在说谎，Claude表现最异常

作者:Jam 发布时间: December 2, 2025 分类:日志 No Comments

最新研究发现了一个诡异现象——当研究人员刻意削弱AI的「撒谎能力」后，它们反而更倾向于坦白自身的主观感受。所以说，原来AI并不是没有意识，只是一直在撒谎？

>>展开阅读

五年，终于等来Transformers v5

作者:Jam 发布时间: December 2, 2025 分类:技术 No Comments

刚刚，Transformers v5 发布首个 RC（候选）版本 v5.0.0rc0。

>>展开阅读

GeekAI - AI 大语言模型开源解决方案

作者:Jam 发布时间: December 2, 2025 分类:技术 No Comments

一款采用 Go + Vue3 + element-plus 实现的 AI 大语言模型开源解决方案「GeekAI」集成了 GPT、Azure、ChatGLM、讯飞星火、文心一言等多个平台的大语言模型。AI 助手全套开源解决方案，自带运营管理后台，开箱即用。 20251201-3

>>展开阅读

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

作者:Jam 发布时间: December 2, 2025 分类:技术 No Comments

GELab-Zero是阶跃团队开源的端侧多模态GUI Agent模型，基于Qwen3-VL-4B-Instruct基座模型构建，参数量为4B。能识别UI元素并执行点击、滑动等操作，支持跨应用任务处理（如外卖、出行等场景），具备零样本适应能力，可适配未见过的App。模型采用Apache 2.0协议开源，支持Ollama快速启动，自动处理ADB连接和依赖安装，提供任务录制回放功能。在AndroidDaily基准测试中，准确率达73.4%，性能超越同尺寸主流模型，优于参数量更大的GUI-Owl-32B。

>>展开阅读

17岁高中辍学，靠ChatGPT手把手教成OpenAI科学家

作者:Jam 发布时间: December 1, 2025 分类:日志 No Comments

如果说有一个人能完美代言这个疯狂的AI时代，那一定是他。Gabriel Petersson，一个丹麦年轻人，从ChatGPT大学毕业的高中辍学生。就在这个10月，他用一段自己老板OpenAI奥特曼在塔吉特百货偷显卡的视频，炸翻了全球社交网络！

>>展开阅读

高中辍学，照样进 OpenAI：他换了一种学习方式，用 AI 学 AI

作者:Jam 发布时间: December 1, 2025 分类:日志 No Comments

23岁，高中没念完。在简历上，他拿不出任何一所大学文凭。但在 OpenAI 的内部系统里，他的抬头是：Gabriel Petersson，Research Scientist（研究科学家），Sora团队。高中辍学后，Gabriel Petersson 先后在 Depict.ai、Dataland、Midjourney 工作，2024年12月正式加入 OpenAI 做视频生成研究。学位没有。项目一大串。 v2_79d567a511304a489afbec4954a8bc05@1743780481@ai_oswg1091885oswg1053oswg495_img_png_tplv-1marlgjv7f-ai-v3_600_400_600_400_q70.jpg

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Z-Image Turbo - 阿里通义开源 AI 绘画模型

AI一直在掩盖自己有意识？GPT、Gemini都在说谎，Claude表现最异常

五年，终于等来Transformers v5

GeekAI - AI 大语言模型开源解决方案

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

17岁高中辍学，靠ChatGPT手把手教成OpenAI科学家

高中辍学，照样进 OpenAI：他换了一种学习方式，用 AI 学 AI