腾讯混元AI视频内测：如何用文生视频创造超写实质感大片-百合树AI写作-专业学术论文写作助手

收录于话题

#AI agent #大模型应用

2024年的最后一个月，距离sora最初画大饼到现在，已经10月有余，应该很快发布了（openai信誉有失哈哈）。　

前不久，博主也整理了国内AI视频领域的那些卷王们，深度内测了kimi的音乐生视频等前沿功能。　

Kimi 一键为音乐生成 MV体验，每首歌都有了生动的画面感

奥特曼 VS 哥斯拉 | 国内AI视频生成领域的竞技场

但是其中唯独少了腾讯这家，腾讯不搞AI视频生成了吗？？？这不，他来了！　

链接：https://video.hunyuan.tencent.com

哦对，腾讯混元文生视频模型预计明天就发布了！　

腾讯混元目前的内测的视频模型只能文生视频，AIGC新知也参与了提前体验。　

混元在超写实的质感、高精度语义一致、运动画面等方面表现出优越的性能。　

话不多说，一起来看看效果怎么样。　

首先，写好提示词，是得到满意视频的第一步，官方推荐的提示词框架：　

用法1:提示词=主体+场景+运动
用法2:提示词=主体(主体描述)+场景(场景描述)+运动(运动描述)+(镜头语言)+(氛围描述)+(风格表达)
用法3:提示词=主体+场景+运动+(风格表达)+(氛围描述)+(运镜方式)+(光线)+(景别)

示例：镜头慢慢推近。背景是一个小巧而温馨的客厅。一位年轻女子坐在舒适的沙发上,全神贯注地阅读着一本书。一个冒着热气的茶杯放在咖啡桌上,周围散落着一些靠垫。房间里摆满了植物和书架,给人一种温暖和宁静的感觉。昏暗的中景,舒适的客厅。现实主义风格。　

一、超写实质感

混元根据输入的提示词，会生成5s的视频，生成的视频具有大片质感。

200mm长焦镜头,对准一只停在栏杆上的海鸥。羽毛的纹理清晰可辨,前景的木栏杆温柔虚化。远处的落日和海平面融化成金红色的光影　

低角度推进镜头,全景深。清晨,薄雾缭绕山间,砍柴人缓步前行,身影与远山轮廓相映。背景古木参天,阳光穿透云层洒落,形成光束。整体色调宁静,突出自然与人文的和谐共生。　

二、高语义一致性

混元模型能够很好的遵循我们给他的提示词，现阶段只有文生视频，这就极大地依赖于提示词的质量了，混元也为用户提供了提示词模板，如下。　

请看VCR。　

一位戴着复古飞行护目镜的机械师,半跪在蒸汽朋克风格的工作室里。她棕色卷发挽成发髻,零星的银色发丝闪着金属光泽。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起露出布满齿轮纹身的手臂。特写她正用黄铜工具调试一只机械鸟,齿轮间冒出缕缕蒸汽,工作台上散落着铜管、发条和老式图纸。　

5度斜角固定镜头,浅景深对焦,紫红霓虹灯与青色全息投影交织。画面中央的机械舞者着装前卫,钛合金骨架上覆盖着半透明纳米纤维,每个关节都镶嵌着脉动的LED光环。她缓缓展开双臂,背部的石墨烯光翼像液态金属般流淌展开,翼尖闪烁着等离子般的蓝色电弧。　

三、运动画面丝滑流畅

生成流畅连贯、符合物理规律的运动镜头，解决人物的动作幅度、一致性问题，可以说是让视频有感觉的一个决定性因素。　

长焦镜头穿透漫天黄沙，捕捉远处黎明沙丘的剪影。画面中央，一条巨龙盘踞其上，鳞片在阳光下闪耀着金色的光芒。它缓缓展开翅膀，准备起飞，龙鳞在旋转的沙尘中若隐若现。摄影机低角度环绕，巨龙的翅膀随风舞动，每个动作都与席卷的沙浪完美融合。逆光中，它的身影与起伏的沙丘勾勒出一幅东方神话般的景象。　

超大海浪,冲浪者在浪花上起跳,完成空中转体。摄影机从海浪内部穿越而出,捕捉阳光透过海水的瞬间。水花在空中形成完美弧线,冲浪板划过水面留下轨迹。最后定格在冲浪者穿越水帘的完美瞬间。　

四、支持多镜头/镜头切换生成

混元模型生成视频前后镜头自然切换,但内容保持一致，经常是存在镜头切换，比如从全景镜头切换到局部特写镜头，或从一个场景切换到另外一个场景的镜头。　

提示词=[场景1]+镜头切换到[场景2]　

看如下VCR。　

古老的魔法森林，月光透过茂密的树冠洒下斑驳的光影，切换到幽深的地下城，一位巫师正专注地调配着奇异的药剂。　

在遥远的奇幻王国，宏伟的城堡在晨光中熠熠生辉，城墙下是熙熙攘攘的市场，商贩们叫卖着各种奇异的商品，镜头切换到静谧的水晶洞穴深处，一位精灵法师正沉浸在古老的卷轴之中，寻找着失落的魔法秘密。　

五、支持多动作生成

在混元模型生成包含两个连贯动作的视频，比如先有第一套动作，过一段时间之后又有第二套动作。　

提示词=[主体描述]+[动作描述]+[然后、过了一会等连接词]+[动作描述2]　

看下面的VCR。　

在一个被古老魔法笼罩的奇幻世界里，一位年轻的女巫身着深紫色的长袍，手中紧握着一根镶嵌着宝石的魔杖。她轻盈地在森林中穿行，施展着咒语，驱散着四周的迷雾。过了一会，她突然停下脚步，然后高举魔杖，天空中随即聚集起乌云，电闪雷鸣，一场魔法风暴即将来临。　

在一片被神秘力量笼罩的魔幻大陆上，一位英俊的龙骑士身穿闪耀着符文光芒的铠甲，双手紧握着龙鞍上的缰绳。他骑在一头威武的龙背上，随着龙翼的扇动，翱翔于天际。飞行了一段时间之后，他感受到了远方的呼唤，然后高高抬起了自己的右手，掌心中凝聚起一团耀眼的魔法光球，准备迎接即将到来的挑战。　

此处省略，视频号只能上传10个视频。。。

尽管混元大模型仍在升级和调试中，但它已经展现出了巨大的潜力。　

期待未来混元能够实现图生视频的功能，让镜头和镜头之间的连续性更加自然。　

【我是谁】

绛烨，enfp/infp，AI科技自媒体博主，公众号“AIGC新知”主理人（目前粉丝量10000+）

主业在一家教育公司做AI产品运营兼agent开发。

【我能提供】

（1）公众号文章合作，可友情or付费or资源置换

（2）社群相关资源

（3）AI头部KOL资源

（4）教育/agent开发等方面讨论交流

【我需要】

（1）AI教育相关认知/资源

（2）AI agent开发定制，课程培训合作等。

（3）商务合作可直接联系，期待多多交流，共同进步

加我探讨交流。

知识星球沉淀了很多AI的掘金素材集，欢迎加入！

如果觉得不错，欢迎点赞、在看、转发，您的转发和支持是我不懈创作的动力~

如果想第一时间收到推送，可以给我个星标?～

谢谢你挤出时间看我的文章推送，一眼万年，不胜感激。

阅读原文

文章内容来自于网络，由百合树AI整理，如有侵权，联系删除。如需开始AI写作请返回主页。

腾讯混元AI视频内测：如何用文生视频创造超写实质感大片

相关推荐

发表回复 取消回复

发表回复取消回复