Mistral Vibe - Mistral AI推出的开源命令行编码助手

作者:Jam 发布时间: December 12, 2025 分类:技术 No Comments

Mistral Vibe是Mistral AI推出的开源命令行编码助手，基于Devstral模型开发，支持自然语言交互完成代码搜索、文件操作、版本控制等任务。能自动扫描项目结构和Git状态，通过@符号补全文件引用，支持shell命令执行和脚本模式自动化。工具采用Apache 2.0许可证，兼容UNIX和Windows系统，可作为Zed IDE插件使用，显著提升开发效率。 Mistral Vibe - Mistral AI推出的开源命令行编码助手

>>展开阅读

Open-AutoGLM – 智谱开源的手机端AI Agent框架

作者:Jam 发布时间: December 10, 2025 分类:技术 No Comments

Open-AutoGLM 是智谱开源的手机端智能助理框架，基于 AutoGLM 构建，能通过自然语言指令实现手机操作的自动化。Open-AutoGLM通过 Phone Use 能力框架，将自然语言指令转化为实际操作，如点击、滑动、输入等，可在外卖、社交、客服等场景中自动完成任务。框架借助云手机技术保障隐私安全。Open-AutoGLM 开源目的是推动行业共同进步，保护用户隐私，加速 Agent 技术爆发。目前支持 50 多款主流中文应用，提供完整工具链和详细文档，助力开发者快速上手和二次开发。

>>展开阅读

普通安卓手机变身 AI 手机：Operit AI

作者:Jam 发布时间: December 10, 2025 分类:技术 No Comments

字节和中兴联合开发的豆包手机最近关注度很高，系统直接内嵌了豆包，相比于 App 能够执行更多操作，甚至实现了跨应用进行购买下单、自行刷游戏等功能。不过因权限过高带来一些隐患，很多主流 App 开始禁用豆包手机，比如：微信、银行应用、淘宝、淘宝闪购、闲鱼、大麦都已经禁止。目前豆包手机助手对其 AI 能力做了调整，限制支付金融类、竞技排名的部分游戏、刷分刷激励的限制。那么普通安卓手机如何变身为 “豆包 AI 自动化手机” ？可以借助「Operit AI」这款强大的工具，普通安卓手机也能拥有类似的深度自动化能力。 20251210-5

>>展开阅读

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

作者:Jam 发布时间: December 9, 2025 分类:技术 No Comments

SurfSense 是开源的 AI 研究与知识管理工具。高度可定制，能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源，方便用户整合信息。用户可上传多种文件格式的个人文件到知识库，通过自然语言与知识库交互，快速获取精准答案。支持强大的搜索功能，结合语义搜索与全文搜索，提供更精准的结果。SurfSense 支持本地 LLM，确保数据隐私，开源可本地部署。团队协作功能强大，支持基于角色的访问控制，可安全共享知识库。能将聊天对话快速转换为播客，支持多种 TTS 服务。其技术架构先进，后端使用 FastAPI、PostgreSQL 等，前端基于 Next.js、React 构建，部署方式灵活。SurfSense 是高效、安全且易于使用的知识管理工具，适合个人和团队使用。 SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

>>展开阅读

InkSight - Google开源的AI手写识别工具

作者:Jam 发布时间: December 9, 2025 分类:技术 No Comments

InkSight是Google开源的AI手写识别工具，能将纸质手写笔记转换为可编辑的数字墨迹文件（如SVG格式）。与传统OCR不同，能识别文字内容，能还原笔迹样式、段落结构和重点标记，支持多语言处理。用户可通过HyperAI平台在线体验，上传手写照片后可直接编辑、调整颜色或重组内容。特别适合学生、设计师等需要频繁整理手写记录的群体，准确率达87%，能有效解决传统拍照笔记无法修改的问题。 InkSight - Google开源的AI手写识别工具

>>展开阅读

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

作者:Jam 发布时间: December 9, 2025 分类:技术 No Comments

OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型，能通过多模态感知理解手机屏幕内容，自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求，如“打开美团搜索附近的火锅店”，AutoGLM 可以自动解析意图、理解当前界面、规划下一步动作并执行整个流程。模型通过 ADB（Android Debug Bridge）控制设备，支持多种操作，如点击、输入文本、滑动等，并且内置敏感操作确认机制，确保在涉及登录或验证码等场景时可进行人工接管。AutoGLM 支持远程 ADB 调试，无需 USB 连接即可控制设备，大大提高了使用的灵活性和便捷性。 OpenAutoGLM - 智谱AI开源的手机AI Agent模型

>>展开阅读

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

作者:Jam 发布时间: December 8, 2025 分类:技术 No Comments

LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构（MM-DiT+Single-DiT），结合视觉语言模型（VLM）条件编码器，能实现文生图和多轮图像编辑功能。在图像编辑方面，支持对象添加、风格迁移等15类任务，保持图像风格和光照一致性。具备强大的中文文本渲染能力，可处理标准汉字、生僻字和部分书法字体，能根据场景自动调整字体和排版。通过轻量化结构和优化训练策略，LongCat-Image可在消费级GPU上高效推理，生成“摄影棚级”细节图像。在性能上，在多个图像编辑基准测试中达到开源SOTA水平，在中文文字生成和文生图任务中表现优异。资源已开源至Hugging Face和GitHub，供开发者使用。 LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

>>展开阅读

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

作者:Jam 发布时间: December 8, 2025 分类:技术 No Comments

NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型，采用3.5B参数的Next-DiT架构，专为二次元风格优化。模型通过双文本编码器（GEMMA3-4B-IT和Jina CLIP v2）融合提升prompt理解力，并创新性地引入XML结构化提示来增强多角色场景的生成稳定性。亮点包括16通道VAE优化细节表现、支持LoRA微调，以及仅需8GB显存即可运行，适用于动漫角色设定、同人图创作等场景。模型以非商业许可开源，权重和衍生品需申请授权，源码遵循Apache 2.0协议。 NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

Mistral Vibe - Mistral AI推出的开源命令行编码助手

Open-AutoGLM – 智谱开源的手机端AI Agent框架

普通安卓手机变身 AI 手机：Operit AI

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

InkSight - Google开源的AI手写识别工具

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型