10月31日AI科技快讯

2024年 10月 31日 12:04 AI写作资讯

1. 爱诗科技正式发布PixVerse V3

近日，爱诗科技隆重推出了其最新版本的多模态视频生成工具——PixVerse V3。此次升级引入了一系列创新功能，包括创意模板、对口型、故事续写以及风格转换，旨在更精准地理解用户的提示词，生成富有情感和质感的视频，从而实现现实与虚拟的完美融合。值得一提的是，PixVerse V3不仅支持多种视频比例，还新增了对口型功能，能够自动适配视频中人物的口型。此外，Efect功能提供了八种创意效果，支持类似Pika的“捏”特效，进一步丰富了用户的创作体验。

2. 苹果智能正式上线，同时发布新款iMac

10月28日，苹果公司宣布其智能助手——苹果智能（Apple Intelligence）正式在iPhone、iPad和Mac上上线。同时，苹果还发布了搭载M4芯片的全新iMac，起售价为1299美元，配备16GB内存，并将在11月8日开始发售。这一系列举措表明苹果在智能技术领域的持续创新和对用户体验的重视。

3. MiniMax：7000万美元营收下的甜蜜与隐忧

MiniMax的AI应用Talkie在海外市场表现亮眼，预计年收入将突破7000万美元，成为公司的主要收入来源。自2023年6月上线以来，Talkie迅速崛起，成为全球陪伴类AI应用下载量的前三名，吸引了大量用户并实现了高付费率。尽管其国内版本“星野”未能复制成功，MiniMax依然计划拓展东南亚市场，以应对收入来源单一的潜在风险。

4. 神秘模型“小能猫”夜刷屏：排名超Flux、Midjourney

近期，神秘的文生图模型“red_panda”（小能猫）在网络上迅速走红，其ELO得分超过Flux 1.1Pro，胜率高达79%，每7秒生成一张图像。该模型的真实来源尚未确认，引发了广泛的猜测，可能来自中国厂商或Midjourney V7等。经过实测，red panda在各类竞争中表现出色，尽管并非绝对胜利，但其强劲的表现吸引了众多关注。

5. 微软开源OmniParser：让GPT-4V秒懂屏幕截图，可操控手机/电脑

微软公司宣布开源了一款名为OmniParser的工具，这款工具能够解析和识别屏幕上的可交互图标。OmniParser不依赖额外的上下文数据，能够理解更复杂的图形用户界面（GUI），标志着智能GUI自动化领域的一项重大进展。该工具结合了可交互区域检测模型、图标描述模型和OCR模块等，能够在桌面、移动设备和网页等多个平台上高效工作，提升用户界面的理解准确性。

上一篇：谷歌的 Jarvis 项目：网络浏览人工智能的未来

下一篇：Apple Intelligence 发布：iPhone、iPad 和 Mac 用户的新时代

发表回复取消回复