Mistral Vibe - Mistral AI推出的开源命令行编码助手

Mistral Vibe是Mistral AI推出的开源命令行编码助手,基于Devstral模型开发,支持自然语言交互完成代码搜索、文件操作、版本控制等任务。能自动扫描项目结构和Git状态,通过@符号补全文件引用,支持shell命令执行和脚本模式自动化。工具采用Apache 2.0许可证,兼容UNIX和Windows系统,可作为Zed IDE插件使用,显著提升开发效率。Mistral Vibe - Mistral AI推出的开源命令行编码助手

>>展开阅读

Open-AutoGLM – 智谱开源的手机端AI Agent框架

Open-AutoGLM 是智谱开源的手机端智能助理框架,基于 AutoGLM 构建,能通过自然语言指令实现手机操作的自动化。Open-AutoGLM通过 Phone Use 能力框架,将自然语言指令转化为实际操作,如点击、滑动、输入等,可在外卖、社交、客服等场景中自动完成任务。框架借助云手机技术保障隐私安全。Open-AutoGLM 开源目的是推动行业共同进步,保护用户隐私,加速 Agent 技术爆发。目前支持 50 多款主流中文应用,提供完整工具链和详细文档,助力开发者快速上手和二次开发。Open-AutoGLM

>>展开阅读

普通安卓手机变身 AI 手机:Operit AI

字节和中兴联合开发的豆包手机最近关注度很高,系统直接内嵌了豆包,相比于 App 能够执行更多操作,甚至实现了跨应用进行购买下单、自行刷游戏等功能。不过因权限过高带来一些隐患,很多主流 App 开始禁用豆包手机,比如:微信、银行应用、淘宝、淘宝闪购、闲鱼、大麦都已经禁止。目前豆包手机助手对其 AI 能力做了调整,限制支付金融类、竞技排名的部分游戏、刷分刷激励的限制。那么普通安卓手机如何变身为 “豆包 AI 自动化手机” ?可以借助「Operit AI」这款强大的工具,普通安卓手机也能拥有类似的深度自动化能力。20251210-5

>>展开阅读

SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

SurfSense 是开源的 AI 研究与知识管理工具。高度可定制,能连接搜索引擎、Slack、Jira、Notion、YouTube、GitHub 等众多外部数据源,方便用户整合信息。用户可上传多种文件格式的个人文件到知识库,通过自然语言与知识库交互,快速获取精准答案。支持强大的搜索功能,结合语义搜索与全文搜索,提供更精准的结果。SurfSense 支持本地 LLM,确保数据隐私,开源可本地部署。团队协作功能强大,支持基于角色的访问控制,可安全共享知识库。能将聊天对话快速转换为播客,支持多种 TTS 服务。其技术架构先进,后端使用 FastAPI、PostgreSQL 等,前端基于 Next.js、React 构建,部署方式灵活。SurfSense 是高效、安全且易于使用的知识管理工具,适合个人和团队使用。SurfSense - 开源的AI研究与知识管理工具,NotebookLM最强平替

>>展开阅读

InkSight - Google开源的AI手写识别工具

InkSight是Google开源的AI手写识别工具,能将纸质手写笔记转换为可编辑的数字墨迹文件(如SVG格式)。与传统OCR不同,能识别文字内容,能还原笔迹样式、段落结构和重点标记,支持多语言处理。用户可通过HyperAI平台在线体验,上传手写照片后可直接编辑、调整颜色或重组内容。特别适合学生、设计师等需要频繁整理手写记录的群体,准确率达87%,能有效解决传统拍照笔记无法修改的问题。InkSight - Google开源的AI手写识别工具

>>展开阅读

OpenAutoGLM - 智谱AI开源的手机AI Agent模型

OpenAutoGLM 是智谱AI开源的具有“手机使用”能力的智能体模型,能通过多模态感知理解手机屏幕内容,自动生成操作流程来完成用户指定的任务。用户只需用自然语言描述需求,如“打开美团搜索附近的火锅店”,AutoGLM 可以自动解析意图、理解当前界面、规划下一步动作并执行整个流程。模型通过 ADB(Android Debug Bridge)控制设备,支持多种操作,如点击、输入文本、滑动等,并且内置敏感操作确认机制,确保在涉及登录或验证码等场景时可进行人工接管。AutoGLM 支持远程 ADB 调试,无需 USB 连接即可控制设备,大大提高了使用的灵活性和便捷性。OpenAutoGLM - 智谱AI开源的手机AI Agent模型

>>展开阅读

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image是美团LongCat团队发布的开源图像生成与编辑模型。采用混合骨干架构(MM-DiT+Single-DiT),结合视觉语言模型(VLM)条件编码器,能实现文生图和多轮图像编辑功能。在图像编辑方面,支持对象添加、风格迁移等15类任务,保持图像风格和光照一致性。具备强大的中文文本渲染能力,可处理标准汉字、生僻字和部分书法字体,能根据场景自动调整字体和排版。通过轻量化结构和优化训练策略,LongCat-Image可在消费级GPU上高效推理,生成“摄影棚级”细节图像。在性能上,在多个图像编辑基准测试中达到开源SOTA水平,在中文文字生成和文生图任务中表现优异。资源已开源至Hugging Face和GitHub,供开发者使用。LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

>>展开阅读

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1是NewBieAI-Lab团队开源的首个实验性动漫文生图模型,采用3.5B参数的Next-DiT架构,专为二次元风格优化。模型通过双文本编码器(GEMMA3-4B-IT和Jina CLIP v2)融合提升prompt理解力,并创新性地引入XML结构化提示来增强多角色场景的生成稳定性。亮点包括16通道VAE优化细节表现、支持LoRA微调,以及仅需8GB显存即可运行,适用于动漫角色设定、同人图创作等场景。模型以非商业许可开源,权重和衍生品需申请授权,源码遵循Apache 2.0协议。NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

>>展开阅读