昨儿才说完GLM-4-Flash免费的重磅消息，今儿突然发现个重磅玩意，哦不对，是多个重磅玩意。

说来也巧，不是因为看到了什么新闻，而是今天一起床，看到了这个。

不是，哥们，别人都开始各种收费商业化了，你这咋还送送送个没完啊？

而且别人也就一两百万的送送玩玩，你这也忒实惠了！一送就是一千万？？？

于是我去看了下都发布了什么模型，没看不要紧，一看惊了呀！

然后又恰巧，看到了智谱发的文章。

嗯？这是要干啥？

不鸣则已，一鸣惊人啊！

这是要全方位的来大干一场啊！

同时，官方公布了这样一个视频。

看起来是不是似曾相识？

没错，和chatgpt的上一次发布会上的惊喜有过而不及！

实时语音、图像/视频理解、智能推理、图像生成，全齐活了。

而且，他不像OpenAI那个口嗨大师，公布完迟迟不上线，智谱这是已经上了。

官方内测申请链接放文末了

给大家总结一下主要更新亮点:

语言基础模型GLM-4-Plus:在语言解析、指令执行和长文本处理能力上实现了质的飞跃，持续保持在国际竞争中的领先地位。

CogView-3-Plus:性能与业界顶尖的MJ-V6和FLUX模型相媲美。

不仅在图像理解方面表现出色，还具备基于时间序列分析的视频理解能力。该模型即将在开放平台bigmodel.cn上线，并成为国内首个通用的视频理解模型API。

继2B版本发布并开源后，5B版本也正式对外开源，性能得到显著提升，成为目前开源视频生成模型中的佼佼者。

智谱开源模型的累计下载量已超过2000万次，为开源社区的繁荣发展做出了显著贡献。

GLM-4-Plus在多个关键领域均表现出色。在语言能力方面，该模型在理解、指令遵循和长文本处理等方面已达到国际领先水平，其表现与GPT-4和拥有405B参数的Llama3.1不相上下。特别值得一提的是，GLM-4-Plus通过精准的长短文本数据混合策略，显著提升了长文本推理效果。

在视觉智能领域，GLM-4V-Plus展现出卓越的图像和视频理解能力。它不仅具备时间感知能力，还能处理和理解复杂的视频内容。值得注意的是，该模型将在智谱开放平台上线，成为国内首个通用视频理解模型API，为开发者和研究人员提供强大的工具。

比如，你给它一段这样的视频，并询问它穿绿色衣服的球员在整个视频都做了什么?它可以精准地描述球员的球员所做的动作，还能准确地告诉你视频的精彩时刻在第几秒：

截图自官方

智谱AI在生成领域同样取得了突破性进展。

CogView-3-Plus在文生图性能上已接近目前最优的MJ-V6和FLUX等模型。

同时，视频生成模型CogVideoX推出了性能更强的5B版本，被认为是当前开源视频生成模型中的最佳选择。

最让人激动的是，智谱今天推出了一个炫酷的功能——国内首个面向C端用户的AI视频通话功能。

这个功能可以说是全能型选手，集文本、音频和视频于一身，还拥有超强的实时思考能力。用户和AI聊天就像和朋友一样自然，就算聊天中多次被打断，AI也能迅速反应过来。

至于怎么嵌入COW，请参考昨儿的文章，把里面的flash都换成plus就行了。

这不，老金已经用上了，很爽很舒服！

智谱内测申请地址在这，大家快去填写吧！