腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

收录于话题

#AI agent#大模型应用

2024年的最后一个月,距离sora最初画大饼到现在,已经10月有余,应该很快发布了(openai信誉有失哈哈)。 

前不久,博主也整理了国内AI视频领域的那些卷王们,深度内测了kimi的音乐生视频等前沿功能。 

Kimi 一键为音乐生成 MV体验,每首歌都有了生动的画面感

奥特曼 VS 哥斯拉 | 国内AI视频生成领域的竞技场

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片
腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

但是其中唯独少了腾讯这家,腾讯不搞AI视频生成了吗???这不,他来了! 

链接:https://video.hunyuan.tencent.com

哦对,腾讯混元文生视频模型预计明天就发布了! 

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

腾讯混元目前的内测的视频模型只能文生视频,AIGC新知也参与了提前体验。 

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

混元在超写实的质感、高精度语义一致、运动画面等方面表现出优越的性能。 

话不多说,一起来看看效果怎么样。 

首先,写好提示词,是得到满意视频的第一步,官方推荐的提示词框架: 

  • 用法1:提示词=主体+场景+运动

  • 用法2:提示词=主体(主体描述)+场景(场景描述)+运动(运动描述)+(镜头语言)+(氛围描述)+(风格表达)

  • 用法3:提示词=主体+场景+运动+(风格表达)+(氛围描述)+(运镜方式)+(光线)+(景别)


示例:镜头慢慢推近。背景是一个小巧而温馨的客厅。一位年轻女子坐在舒适的沙发上,全神贯注地阅读着一本书。一个冒着热气的茶杯放在咖啡桌上,周围散落着一些靠垫。房间里摆满了植物和书架,给人一种温暖和宁静的感觉。昏暗的中景,舒适的客厅。现实主义风格。 


一、超写实质感

混元根据输入的提示词,会生成5s的视频,生成的视频具有大片质感。

200mm长焦镜头,对准一只停在栏杆上的海鸥。羽毛的纹理清晰可辨,前景的木栏杆温柔虚化。远处的落日和海平面融化成金红色的光影 

低角度推进镜头,全景深。清晨,薄雾缭绕山间,砍柴人缓步前行,身影与远山轮廓相映。背景古木参天,阳光穿透云层洒落,形成光束。整体色调宁静,突出自然与人文的和谐共生。 


二、高语义一致性

混元模型能够很好的遵循我们给他的提示词,现阶段只有文生视频,这就极大地依赖于提示词的质量了,混元也为用户提供了提示词模板,如下。 

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片
腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

请看VCR。 

一位戴着复古飞行护目镜的机械师,半跪在蒸汽朋克风格的工作室里。她棕色卷发挽成发髻,零星的银色发丝闪着金属光泽。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起露出布满齿轮纹身的手臂。特写她正用黄铜工具调试一只机械鸟,齿轮间冒出缕缕蒸汽,工作台上散落着铜管、发条和老式图纸。 

5度斜角固定镜头,浅景深对焦,紫红霓虹灯与青色全息投影交织。画面中央的机械舞者着装前卫,钛合金骨架上覆盖着半透明纳米纤维,每个关节都镶嵌着脉动的LED光环。她缓缓展开双臂,背部的石墨烯光翼像液态金属般流淌展开,翼尖闪烁着等离子般的蓝色电弧。 


三、运动画面丝滑流畅

生成流畅连贯、符合物理规律的运动镜头,解决人物的动作幅度、一致性问题,可以说是让视频有感觉的一个决定性因素。 

长焦镜头穿透漫天黄沙,捕捉远处黎明沙丘的剪影。画面中央,一条巨龙盘踞其上,鳞片在阳光下闪耀着金色的光芒。它缓缓展开翅膀,准备起飞,龙鳞在旋转的沙尘中若隐若现。摄影机低角度环绕,巨龙的翅膀随风舞动,每个动作都与席卷的沙浪完美融合。逆光中,它的身影与起伏的沙丘勾勒出一幅东方神话般的景象。 

超大海浪,冲浪者在浪花上起跳,完成空中转体。摄影机从海浪内部穿越而出,捕捉阳光透过海水的瞬间。水花在空中形成完美弧线,冲浪板划过水面留下轨迹。最后定格在冲浪者穿越水帘的完美瞬间。 


四、支持多镜头/镜头切换生成

混元模型生成视频前后镜头自然切换,但内容保持一致,经常是存在镜头切换,比如从全景镜头切换到局部特写镜头,或从一个场景切换到另外一个场景的镜头。 

提示词=[场景1]+镜头切换到[场景2] 

看如下VCR。 

古老的魔法森林,月光透过茂密的树冠洒下斑驳的光影,切换到幽深的地下城,一位巫师正专注地调配着奇异的药剂。 

在遥远的奇幻王国,宏伟的城堡在晨光中熠熠生辉,城墙下是熙熙攘攘的市场,商贩们叫卖着各种奇异的商品,镜头切换到静谧的水晶洞穴深处,一位精灵法师正沉浸在古老的卷轴之中,寻找着失落的魔法秘密。 

五、支持多动作生成

在混元模型生成包含两个连贯动作的视频,比如先有第一套动作,过一段时间之后又有第二套动作。 

提示词=[主体描述]+[动作描述]+[然后、过了一会等连接词]+[动作描述2] 

看下面的VCR。 

在一个被古老魔法笼罩的奇幻世界里,一位年轻的女巫身着深紫色的长袍,手中紧握着一根镶嵌着宝石的魔杖。她轻盈地在森林中穿行,施展着咒语,驱散着四周的迷雾。过了一会,她突然停下脚步,然后高举魔杖,天空中随即聚集起乌云,电闪雷鸣,一场魔法风暴即将来临。 

在一片被神秘力量笼罩的魔幻大陆上,一位英俊的龙骑士身穿闪耀着符文光芒的铠甲,双手紧握着龙鞍上的缰绳。他骑在一头威武的龙背上,随着龙翼的扇动,翱翔于天际。飞行了一段时间之后,他感受到了远方的呼唤,然后高高抬起了自己的右手,掌心中凝聚起一团耀眼的魔法光球,准备迎接即将到来的挑战。 

此处省略,视频号只能上传10个视频。。。

尽管混元大模型仍在升级和调试中,但它已经展现出了巨大的潜力。 

期待未来混元能够实现图生视频的功能,让镜头和镜头之间的连续性更加自然。 

【我是谁】

绛烨,enfp/infp,AI科技自媒体博主,公众号“AIGC新知”主理人(目前粉丝量10000+)

主业在一家教育公司做AI产品运营兼agent开发。

【我能提供】

(1)公众号文章合作,可友情or付费or资源置换

(2)社群相关资源

(3)AI头部KOL资源

(4)教育/agent开发等方面讨论交流

【我需要】

(1)AI教育相关认知/资源

(2)AI agent开发定制,课程培训合作等。

(3)商务合作可直接联系,期待多多交流,共同进步

加我探讨交流。

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

知识星球沉淀了很多AI的掘金素材集,欢迎加入!

腾讯混元AI视频内测:如何用文生视频创造超写实质感大片

如果觉得不错,欢迎点赞、在看、转发,您的转发和支持是我不懈创作的动力~

如果想第一时间收到推送,可以给我个星标?~

谢谢你挤出时间看我的文章推送,一眼万年,不胜感激。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注