GLM-4.5V - 智谱推出的多模态开源视觉推理模型

作者:Jam 发布时间: August 12, 2025 分类:技术 No Comments

GLM-4.5V是智谱推出的全球领先的开源视觉推理模型，总参数达1060亿，激活参数120亿。模型基于新一代文本基座模型GLM-4.5-Air训练而成，具备强大的视觉理解与推理能力，能处理图像、视频、文档等多种视觉内容。模型在多模态任务中表现出色，涵盖视觉问答、图像描述生成、视频理解、网页前端复刻等场景，同时支持快速响应与深度推理的灵活切换。GLM-4.5V在41个公开视觉多模态榜单中达到SOTA性能，通过高效混合训练实现全场景视觉推理，为企业和开发者提供高性价比的多模态AI解决方案。

>>展开阅读

Jam's Blog II

JamLee.Life 心情演绎

GLM-4.5V - 智谱推出的多模态开源视觉推理模型