<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>音频驱动 | 行业新闻_地产（点击查看更多）</title><description>搜索引擎 + AI 驱动的行业新闻【覆盖行业】信保 ｜出口 ｜金融 制造 ｜农业 ｜建筑 ｜地产  零售 ｜物流 ｜数智【访问入口】hangyexinwen.com【新闻分享】点击发布时间即可分享【联系我们】xinbaoren.com（微信内打开提交表单）</description><link>https://dichan.hangyexinwen.com</link><item><title>⁣📰 重磅开源！通义万相最新模型来了通义万相最新发布的音频驱动视频模型Wan2.2-S2V，实现了仅用一张图片和一段音频生成电影级数字人视频</title><link>https://dichan.hangyexinwen.com/posts/81</link><guid isPermaLink="true">https://dichan.hangyexinwen.com/posts/81</guid><pubDate>Tue, 26 Aug 2025 17:10:17 GMT</pubDate><content:encoded>⁣&lt;br /&gt;&lt;b&gt;&lt;i&gt;&lt;b&gt;📰&lt;/b&gt;&lt;/i&gt; 重磅开源！通义万相最新模型来了&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;通义万相最新发布的音频驱动视频模型Wan2.2-S2V，实现了仅用一张图片和一段音频生成电影级数字人视频。该模型生成的视频时长可达分钟级，显著提高了数字人直播、影视制作及AI教育等行业的视频创作效率。用户可在多个平台上下载并体验此模型，支持多种类型图片及音频驱动的复杂场景表现。&lt;br /&gt;&lt;br /&gt;Wan2.2-S2V通过层次化帧压缩技术，实现稳定的长视频生成，历史帧的Token数量大幅降低，长度可拓展至73帧。此外，模型还支持文本控制，用户可通过输入Prompt对视频画面进行精准调整，丰富视频主体的运动及背景变化，确保生成视频的真实感和表现力。&lt;br /&gt;&lt;br /&gt;在训练上，通义团队使用超过60万个片段的音视频数据集进行全参数化训练，充分挖掘模型性能，并支持多种分辨率场景，满足不同视频生成需求。该产品为企业提供创新解决方案，承诺在效果达标后再合作，旨在实现零风险应用。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🏷️&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;/search/%23%E9%9F%B3%E9%A2%91%E9%A9%B1%E5%8A%A8&quot;&gt;#音频驱动&lt;/a&gt; &lt;a href=&quot;/search/%23%E8%A7%86%E9%A2%91%E7%94%9F%E6%88%90&quot;&gt;#视频生成&lt;/a&gt; &lt;a href=&quot;/search/%23%E6%95%B0%E5%AD%97%E4%BA%BA&quot;&gt;#数字人&lt;/a&gt; &lt;a href=&quot;/search/%23%E9%95%BF%E8%A7%86%E9%A2%91&quot;&gt;#长视频&lt;/a&gt; &lt;a href=&quot;/search/%23%E6%96%87%E6%9C%AC%E6%8E%A7%E5%88%B6&quot;&gt;#文本控制&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://www.53ai.com/news/OpenSourceLLM/2025082673501.html&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;</content:encoded></item></channel></rss>