<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE wml PUBLIC "-//WAPFORUM//DTD WML 1.1//EN" "http://www.wapforum.org/DTD/wml_1.1.xml">
<wml>
<head> 
<meta http-equiv="Expires" content="0"/> 
<meta http-equiv="Cache-Control" content="no-cache"/> 
<meta http-equiv="Pragma" content="no-cache"/> 
</head>
<card title="智谱AI发布视频生成工具“清影”：30秒快速生成，免费开放体验_砍柴网">
	<p><a href="https://wap.ikanchai.com/">首页</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=5">科技快报</a> &gt; <a href="https://wap.ikanchai.com/?action=category&amp;catid=16">业界</a> &gt; </p>
	<p align="center"><big>智谱AI发布视频生成工具“清影”：30秒快速生成，免费开放体验</big></p>
	<p align="right">2024-07-26 15:12</p>
	<p>7 月 26 日消息，智谱 AI 今日宣布，对视频生成模型进行全新升级，并正式推出新一代产品 &mdash;&mdash;CogVideoX。<br />
<p align="center"><img src="https://d.ifengimg.com/w640_h272_q90_webp/x0.ifengimg.com/res/2024/471FFA76FDC4ECBF5B441359E487AA20911E382B_size17_w640_h272.jpg" border="0" data-lazyload="https://x0.ifengimg.com/res/2024/471FFA76FDC4ECBF5B441359E487AA20911E382B_size17_w640_h272.jpg" /></p><br />
CogVideoX 模型目前已在智谱清言的 PC 端、移动应用端以及小程序端正式上线。所有 C 端用户均可通过智谱清言的 AI 视频生成功能「清影」（Ying），免费体验 AI 文本生成视频和图像生成视频的服务。<br />
<p align="center"><img src="https://d.ifengimg.com/w640_h311_q90_webp/x0.ifengimg.com/res/2024/D0E893BFAAC50D9692252B8B37C118001FFF33A9_size26_w640_h311.jpg" border="0" data-lazyload="https://x0.ifengimg.com/res/2024/D0E893BFAAC50D9692252B8B37C118001FFF33A9_size26_w640_h311.jpg" /></p><br />
据介绍，CogVideoX 的核心技术特点如下：<br />
针对内容连贯性问题，智谱 AI 自主研发了一套高效的三维变分自编码器结构（3D VAE）。该结构能够将原始视频数据压缩至原始大小的 2%，降低了视频扩散生成模型的训练成本和难度。结合 3D RoPE 位置编码模块，该技术提升了在时间维度上对帧间关系的捕捉能力，从而建立了视频中的长期依赖关系。<br />
在可控性方面，智谱 AI 打造了一款端到端的视频理解模型，该模型能够为大量视频数据生成描述。这一创新增强了模型对文本的理解和对指令的遵循能力，确保生成的视频更加符合用户的输入需求，并能够处理超长且复杂的 prompt 指令。<br />
模型采纳了一种将文本、时间、空间三维一体融合的 transformer 架构。该架构摒弃了传统的 cross attention 模块，设计了 Expert Block 以实现文本与视频两种不同模态空间的对齐，并通过 Full Attention 机制优化模态间的交互效果。<br />
「清影」的主要特点如下：<br />
快速生成：仅需 30 秒即可完成 6 秒视频的生成。<br />
高效的指令遵循能力：即使是复杂的 prompt，清影也能准确理解并执行。<br />
内容连贯性：生成的视频能够较好地还原物理世界中的运动过程。<br />
画面调度灵活性：例如，镜头能够流畅地跟随画面中的三只狗狗移动。<br />
此外，智谱大模型开放平台 bigmodel.cn 也部署了「清影」。企业和开发者可通过 API 调用式，体验并使用「清影」的文本生成视频和图像生成视频功能。<br />
【来源：IT之家】<br /></p>
		<p><a href="https://wap.ikanchai.com/?action=comment&amp;contentid=595248">共有评论0条</a></p>
	<p>
	<p>相关推荐</p>
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=651929">智谱发布专为龙虾优化大模型 API价格同步上调20%</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=647609">“大模型第一股” 智谱董事长刘德兵：AI价格战将打到全球</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=646699">智谱推出轻量AI代码编辑器Z Code：界面友好，集成Agent能力</a><br />
		<a href="https://wap.ikanchai.com/?action=show&amp;contentid=563643">智谱AI宣布完成超25亿元融资，美团、腾讯、小米等公司参与</a><br />
		</p>
<p><anchor title="返回"><prev/>&lt;返回</anchor><br /><br /><a href="https://wap.ikanchai.com/" title="返回首页">&lt;返回首页</a></p>
<p align="center">Copyright CmsTop.com<br />2026年04月19日 02:41:49</p></card>
</wml>