2024年的最后一个月,距离sora最初画大饼到现在,已经10月有余,应该很快发布了(openai信誉有失哈哈)。
前不久,博主也整理了国内AI视频领域的那些卷王们,深度内测了kimi的音乐生视频等前沿功能。
Kimi 一键为音乐生成 MV体验,每首歌都有了生动的画面感


但是其中唯独少了腾讯这家,腾讯不搞AI视频生成了吗???这不,他来了!
链接:https://video.hunyuan.tencent.com
哦对,腾讯混元文生视频模型预计明天就发布了!

腾讯混元目前的内测的视频模型只能文生视频,AIGC新知也参与了提前体验。

混元在超写实的质感、高精度语义一致、运动画面等方面表现出优越的性能。
话不多说,一起来看看效果怎么样。
首先,写好提示词,是得到满意视频的第一步,官方推荐的提示词框架:
-
用法1:提示词=主体+场景+运动
-
用法2:提示词=主体(主体描述)+场景(场景描述)+运动(运动描述)+(镜头语言)+(氛围描述)+(风格表达)
-
用法3:提示词=主体+场景+运动+(风格表达)+(氛围描述)+(运镜方式)+(光线)+(景别)
示例:镜头慢慢推近。背景是一个小巧而温馨的客厅。一位年轻女子坐在舒适的沙发上,全神贯注地阅读着一本书。一个冒着热气的茶杯放在咖啡桌上,周围散落着一些靠垫。房间里摆满了植物和书架,给人一种温暖和宁静的感觉。昏暗的中景,舒适的客厅。现实主义风格。
一、超写实质感
混元根据输入的提示词,会生成5s的视频,生成的视频具有大片质感。
200mm长焦镜头,对准一只停在栏杆上的海鸥。羽毛的纹理清晰可辨,前景的木栏杆温柔虚化。远处的落日和海平面融化成金红色的光影
低角度推进镜头,全景深。清晨,薄雾缭绕山间,砍柴人缓步前行,身影与远山轮廓相映。背景古木参天,阳光穿透云层洒落,形成光束。整体色调宁静,突出自然与人文的和谐共生。
二、高语义一致性
混元模型能够很好的遵循我们给他的提示词,现阶段只有文生视频,这就极大地依赖于提示词的质量了,混元也为用户提供了提示词模板,如下。


请看VCR。
一位戴着复古飞行护目镜的机械师,半跪在蒸汽朋克风格的工作室里。她棕色卷发挽成发髻,零星的银色发丝闪着金属光泽。深棕色皮质工装背带裤上沾满机油污渍,袖口卷起露出布满齿轮纹身的手臂。特写她正用黄铜工具调试一只机械鸟,齿轮间冒出缕缕蒸汽,工作台上散落着铜管、发条和老式图纸。
5度斜角固定镜头,浅景深对焦,紫红霓虹灯与青色全息投影交织。画面中央的机械舞者着装前卫,钛合金骨架上覆盖着半透明纳米纤维,每个关节都镶嵌着脉动的LED光环。她缓缓展开双臂,背部的石墨烯光翼像液态金属般流淌展开,翼尖闪烁着等离子般的蓝色电弧。
三、运动画面丝滑流畅
生成流畅连贯、符合物理规律的运动镜头,解决人物的动作幅度、一致性问题,可以说是让视频有感觉的一个决定性因素。
长焦镜头穿透漫天黄沙,捕捉远处黎明沙丘的剪影。画面中央,一条巨龙盘踞其上,鳞片在阳光下闪耀着金色的光芒。它缓缓展开翅膀,准备起飞,龙鳞在旋转的沙尘中若隐若现。摄影机低角度环绕,巨龙的翅膀随风舞动,每个动作都与席卷的沙浪完美融合。逆光中,它的身影与起伏的沙丘勾勒出一幅东方神话般的景象。
超大海浪,冲浪者在浪花上起跳,完成空中转体。摄影机从海浪内部穿越而出,捕捉阳光透过海水的瞬间。水花在空中形成完美弧线,冲浪板划过水面留下轨迹。最后定格在冲浪者穿越水帘的完美瞬间。
四、支持多镜头/镜头切换生成
混元模型生成视频前后镜头自然切换,但内容保持一致,经常是存在镜头切换,比如从全景镜头切换到局部特写镜头,或从一个场景切换到另外一个场景的镜头。
提示词=[场景1]+镜头切换到[场景2]
看如下VCR。
古老的魔法森林,月光透过茂密的树冠洒下斑驳的光影,切换到幽深的地下城,一位巫师正专注地调配着奇异的药剂。
在遥远的奇幻王国,宏伟的城堡在晨光中熠熠生辉,城墙下是熙熙攘攘的市场,商贩们叫卖着各种奇异的商品,镜头切换到静谧的水晶洞穴深处,一位精灵法师正沉浸在古老的卷轴之中,寻找着失落的魔法秘密。
五、支持多动作生成
在混元模型生成包含两个连贯动作的视频,比如先有第一套动作,过一段时间之后又有第二套动作。
提示词=[主体描述]+[动作描述]+[然后、过了一会等连接词]+[动作描述2]
看下面的VCR。
在一个被古老魔法笼罩的奇幻世界里,一位年轻的女巫身着深紫色的长袍,手中紧握着一根镶嵌着宝石的魔杖。她轻盈地在森林中穿行,施展着咒语,驱散着四周的迷雾。过了一会,她突然停下脚步,然后高举魔杖,天空中随即聚集起乌云,电闪雷鸣,一场魔法风暴即将来临。
在一片被神秘力量笼罩的魔幻大陆上,一位英俊的龙骑士身穿闪耀着符文光芒的铠甲,双手紧握着龙鞍上的缰绳。他骑在一头威武的龙背上,随着龙翼的扇动,翱翔于天际。飞行了一段时间之后,他感受到了远方的呼唤,然后高高抬起了自己的右手,掌心中凝聚起一团耀眼的魔法光球,准备迎接即将到来的挑战。
此处省略,视频号只能上传10个视频。。。
尽管混元大模型仍在升级和调试中,但它已经展现出了巨大的潜力。
期待未来混元能够实现图生视频的功能,让镜头和镜头之间的连续性更加自然。
【我是谁】
绛烨,enfp/infp,AI科技自媒体博主,公众号“AIGC新知”主理人(目前粉丝量10000+)
主业在一家教育公司做AI产品运营兼agent开发。
【我能提供】
(1)公众号文章合作,可友情or付费or资源置换
(2)社群相关资源
(3)AI头部KOL资源
(4)教育/agent开发等方面讨论交流
【我需要】
(1)AI教育相关认知/资源
(2)AI agent开发定制,课程培训合作等。
(3)商务合作可直接联系,期待多多交流,共同进步
加我探讨交流。

知识星球沉淀了很多AI的掘金素材集,欢迎加入!

如果觉得不错,欢迎点赞、在看、转发,您的转发和支持是我不懈创作的动力~
如果想第一时间收到推送,可以给我个星标?~
谢谢你挤出时间看我的文章推送,一眼万年,不胜感激。