看草图直出代码!实测智谱最新多模态Coding模型
智东西作者 江宇编辑 漠影
智东西4月2日报道,今日,“国产大模型第一股”智谱发布了其首个多模态Coding基座模型GLM-5V-Turbo,将AI大模型的感知边界从纯文本推到视觉世界。这是继GLM-5-Turbo之后,智谱短时间内在Coding基座模型上的又一次快速迭代。
据官方新闻稿介绍,GLM-5V-Turbo不仅能读懂代码,还能“看懂画面再写代码”。给定一张设计稿截图,它能直接生成完整可运行的前端工程;在接入OpenClaw、AutoClaw等龙虾Agent之后,它也能看懂屏幕、读懂K线图、浏览各类网页,然后自主完成一整套长程任务。
(资料图片)
得益于出色的视觉编程性能,GLM-5V-Turbo在海外引发了广泛的关注,截至发稿前,其官方推文已经获得了130万+的浏览量,海外开发者甚至夸张地打趣道:“对Anthropic来说,现在游戏结束了。”
X网友@Zaid表示,“Anthropic现在的处境岌岌可危。”
如今,放眼整个行业来看,GLM-5V-Turbo推出的意义正变得越来越清晰:当Coding模型开始进入真实生产环境,光靠文本确实已经不够用了,而刚刚发布的GLM-5V-Turbo,将为「视觉编程」新范式提供一个全新的启示。
一、上手实测:看见即复刻,图像即代码
说再多不如直接上手。我们用三个实测案例,看看GLM-5V-Turbo在不同输入方式下的前端复刻能力。
案例一:画个草图,也能复刻?
先从最离谱的场景开始,我们只给GLM-5V-Turbo画几个框框,让它做个酷炫的音乐播放器。结果模型还真搞得像模像样,布局合理、配色协调、连播放控件都安排得明明白白,让它改个配色也是言出法随。建议各位产品经理抓紧体验,以后改需求再也不用看前端的脸色了。
案例二:输入网址,直接复刻
这是GLM-5V-Turbo的主打功能之一。因为模型有强大的GUI Agent能力,只要给它一个目标网站URL,它就能自主浏览页面,梳理布局结构、采集视觉素材与交互细节,然后直接生成完整可运行的前端工程。不需要手动截图、不需要描述需求,一个链接就够了。
例如,我们让GLM-5V-Turbo复刻这个颇具设计感的网站:https://niore.webflow.io/
这是复刻效果,可以看到,不论是布局、字体,甚至是插图都非常相似。
案例三:输入录屏,还原动效
将一段网页操作录屏发给模型,GLM-5V-Turbo能从视频中理解页面的动态交互逻辑——滚动效果、弹窗切换、表单联动、按钮反馈等,然后将这些交互细节还原为可运行的代码。不只是”还原长什么样”,而是”还原怎么动”。
我们把这个美食网站的录屏发给GLM-5V-Turbo,让它复刻一下。
▲录屏
可以看到,网站的布局、照片、字体都比较还原,浮现动效和字体特效这类动态细节也基本复刻到位。
▲结果
二、技术探索:不是简单“加了个视觉模块”
与以往传统方法不同,GLM-5V-Turbo不是在一个纯文本Coding模型上“外挂”了一个视觉理解模块,而是从预训练阶段就开始进行文本与视觉能力的深度融合,解决了“视觉能力与纯文本编程和推理能力无法兼得”的问题。
具体来说,智谱团队研发了新一代CogViT视觉编码器,在通用物体识别、细粒度理解、几何与空间感知上均做到了领先水平,同时设计了一套兼容多模态输入且推理友好的MTP结构,在多模态场景下实现了较高的推理效率。
更关键的是,在强化学习阶段,智谱团队采用了30+任务类型的协同优化策略,覆盖STEM推理、视觉grounding、视频理解、GUI Agent等多个子领域。这种多任务协同强化学习的好处在于,它有效缓解了单领域训练容易出现的不稳定性,也就是说,不会因为某一项能力的提升而牺牲其他能力。
而且从评测数据来看,这套方案确实跑通了。
在多模态Coding维度,GLM-5V-Turbo在设计稿还原、视觉代码生成、多模态检索与问答、视觉探查等基准上均取得领先表现;在衡量真实GUI环境操控能力的AndroidWorld、WebVoyager等基准上同样表现突出。
而在纯文本Coding维度,GLM-5V-Turbo在CC-Bench-V2的Backend、Frontend和Repo Exploration三项核心测试中保持了稳定表现——也就是说,视觉能力的引入并没有拖累纯文本编程能力。
用一句话总结:GLM-5V-Turbo不是在“看图”和“写代码”之间做取舍,而是“全都要”。
结语:Coding基座模型的下一步,是“看见世界”
从GLM-5-Turbo到GLM-5V-Turbo,智谱在Coding基座模型上的迭代逻辑非常清晰:先让模型在文本世界里把任务跑通,再让它“看见”视觉世界,从而进入更广阔的应用空间。
这背后的判断是:Agent时代,模型能力不只由智能水平定义,还由它能处理的context容量定义。一个只能处理纯文本的模型,哪怕推理能力再强,在真实世界里的应用边界也是有限的。因为真实世界的信息,绝大多数以图片、视频、界面等视觉形式存在。
从这个角度来看,GLM-5V-Turbo不只是智谱的一次产品更新,更像是一个行业信号:Coding模型的竞争,正在从“谁的代码写得好”升级到“谁能看懂世界并写出代码”。
而随着越来越多的Coding模型开始进入真实生产环境,“看得懂、写得出、跑得通”这三项能力的整合程度,将成为区分模型之间差距的关键维度。
这场竞赛,才刚刚进入深水区。
相关阅读
-
港股异动 | 阿里健康(00241)跌超4% 高盛预计AI及药品类别投资增加影响公司盈利
智通财经APP获悉,阿里健康(00241)跌超4%,截至发稿,跌4.08%,报4.7港元,成交额4.44亿港元。 -
实时:生意社:上海期货交易所4月8日铜仓单下跌
上海期货交易所4月8日上海地区铜库存合计113,044吨,较上日下跌3022吨;广东地区铜库存合计18,761吨,较上日下跌900吨;江苏地区铜库存合53,245吨,较上日下跌1280吨;浙江地区铜库 -
4月8日红利ETF工银基金份额减少200万份,重仓股美的集团、五粮液、格力电器 每日消息
证券之星消息,4月8日,红利ETF工银基金(159905)最新份额为10.81亿份,较前一交易日减少了200.0万份。 -
新天药业:子公司取得2项发明专利证书-热文
南财智讯4月8日电,新天药业发布公告称,公司全资子公司上海硕方医药科技有限公司近日收到国家知识产权局颁发的2项《发明专利证书》。专利名称分别为“一种完带汤指纹图谱的构建方法及其应用”和“一种润肠通便的 -
85家百亿私募,一季度平均盈利2.01% 通讯
85家百亿私募,一季度平均盈利2.01% -
跨越5年的守护,6岁孩童获赔66万重疾保险金
Y女士的孩子在1岁多时不幸被诊断为脑瘫。面对突如其来的变故,家人虽然心急如焚,但当时孩子的病情症状尚未完全达到保险合同中对特定重疾的赔付标准,理赔一时陷入了困境。面对这一情况,农银人寿泸州中心支公司的... -
301022,明起停牌!筹划购买资产|当前热门
海泰科(301022)筹划购买资产。4月6日,海泰科发布公告称,公司正在筹划发行股份及支付现金购买资产,同时拟发行股份募集配套资金。公司股票(证券简称:海泰科,证券代码:301022)自2026年4月 -
青岛姑娘刘晨保持零封 助力中国队晋级U20女足亚洲杯淘汰赛|每日速递
青岛姑娘刘晨保持零封助力中国队晋级U20女足亚洲杯淘汰赛,刘晨,东道主,青岛市,女足亚洲杯,u20女足,女足世界杯,亚洲杯淘汰赛 -
每日观察!王燊超总能进关键球!杨希真香 乔迪输球不丢人 光头瞄准上海德比
王燊超总能进关键球!杨希真香乔迪输球不丢人光头瞄准上海德比,乔迪,杨希,王燊超,上海德比,莱昂纳多,加布里埃尔,欧冠淘汰赛附加赛 -
东契奇经纪人:我们计划对65场规则提出“特殊情况挑战”申请
东契奇经纪人:我们计划对65场规则提出“特殊情况挑战”申请,比尔,东契奇 -
热讯:李亚鹏回应张雪拟拍卖赛车复刻版给嫣然医院捐款:想给他赠茶
李亚鹏回应张雪拟拍卖赛车复刻版给嫣然医院捐款:想给他赠茶,嫣然,赛车,捐款,拍卖,李亚鹏,陈光标,杜卡迪,张雪(1957年) -
看草图直出代码!实测智谱最新多模态Coding模型
看草图直出代码!实测智谱最新多模态Coding模型,代码,编程,草图,多模态,新论文,coding -
十大保险平台最新排名,慧择蝉联实至名归
在互联网保险迈入服务驱动的下半场,合规实力、技术能力、理赔效率、产品创新与用户体验,已成为衡量平台竞争力的核心标尺一、资质合规硬核,全牌照+广合作筑牢信任底座慧... -
巴因迪尔:比赛一结束我就哭了,土耳其等这一天已经太久_速讯
巴因迪尔:比赛一结束我就哭了,土耳其等这一天已经太久,土耳其,世界杯,科索沃,巴因迪尔 -
太平洋寿险上海分公司护航“人宠共生”新时尚:跨界融合为宠物经济注入金融安全底色
当金融保险的稳健力量与宠物时尚的灵动潮流相遇,会碰撞出怎样的火花?3月27日,由中国太平洋人寿保险股份有限公司上海分公司(简称太平洋寿险上海分公司)总冠名的第六... -
4月1日科创创业50ETF招商基金份额减少300万份,重仓股中际旭创、新易盛、宁德时代
证券之星消息,4月1日,科创创业50ETF招商基金(588300)最新份额为16.69亿份,较前一交易日减少了300.0万份。 -
速递!江苏用“体检”主动为城市“把脉问诊”,各地“量体裁衣”解“城市病”
江苏用“体检”主动为城市“把脉问诊”,各地“量体裁衣”解“城市病” -
特变电工:新疆宏联所持2500万股公司股票解除质押-观点
特变电工:新疆宏联所持2500万股公司股票解除质押每经AI快讯,特变电工(SH600089,收盘价:26.78元)4月1日晚间发布公告称,公司第二大股东新疆宏联创业投资有限公司(以下简称“新疆宏联”) -
京东云PaaS业务负责人离职,团队划入IaaS业务部|通讯
京东云PaaS业务负责人离职,团队划入IaaS业务部,京东云,刘强东,离职,京东集团,业务部,paas -
生意社:4月1日中沙天津PP装置动态_每日速看
中沙天津PP生产线产能共45万吨/年。前期3月20日进入检修停车,计划4月10日恢复。货源主要供给核心客户,出货价格平稳,商家随行就市。
热点
-
跨越5年的守护,6岁孩童获赔66万重疾保险金
-
太平洋寿险上海分公司护航“人宠共生”新时尚:跨界融合为宠物经济注入金融安全底色
-
“医学影像大模型第一股”德适登陆港交所 开盘涨121% 市值突破200亿
-
腾讯微保重疾险推荐测评来了!这两款建议家庭必备
-
首个半天吸金超16亿!德适生物(2526.HK)国际配售遭机构疯抢,超购逾2倍
-
策马扬鞭|Juno Markets 2026交易员技术峰会重庆站精彩回顾
-
微短剧,游园会……招行信用卡把消保宣教“玩出花”
-
消费者权益保护|平安养老险全面启动2026年“3·15”金融消费者权益保护教育宣传活动
-
瑞众保险重磅回归央视《开门大吉》,以温暖守护诠释品牌信赖
-
农银人寿四川分公司积极开展2026年3·15金融消费者权益保护教育宣传活动





