1.最新 AI 年度报告发布:预测人形机器人热度将下降,英伟达维持霸主地位2.小鹏机器人前高管创业入局 AI 陪伴机器人,完成千万元级天使轮融资3.具身智能机器人公司星海图完成超 2 亿元 Pre-A 轮融资,华兴担任独家财务顾问4.北京市人工智能产业投资基金等入股智谱 AI5.OpenAI 完整版 o1 模型曝光:能力超强 可处理 20 万个 token
今日头条
最新 AI 年度报告发布:预测人形机器人热度将下降,英伟达维持霸主地位
最近,State of AI 发布了 2024 产业报告,也是调研团队发布的第七份年度报告,从研究进展、行业局势、现有政策、安全问题、未来预测等角度出发,对人工智能行业的现状和预期进行了深度分析。据这份 2024 年度产业报告显示,尽管人形机器人曾备受瞩目,但如今其热度已开始降温。就在这时,英伟达凭借其卓越的技术实力,在 AI 市场上稳居霸主地位,其市场地位也很难在未来被其他竞争者撼动。报告指出,随着 AI 技术的飞速发展,前沿实验室之间的技术性能差距逐渐缩小,不再有明显优势。而与此同时,国内经济环境和科技水平的持续提升,为人形机器人领域带来了新的机遇和挑战。特别是在人形机器人领域,特斯拉的擎天柱机器人计划未来年产 10 亿台的消息引发了广泛关注。与此同时,国内也有一支不容忽视的力量正在崛起,那就是赛力斯。据报道,赛力斯日前发布邀请函,将于 11 月 21 日召开人形机器人专题技术论坛,并正在积极参加机器人领域的 autoload 招聘。其中,华为与赛力斯的合作,更是让人看到了国产人形机器人崛起的曙光。华为凭借强大的 AI 技术,有望打造出与北美相匹敌的人形机器人大脑和小脑,而赛力斯则在华为的支持下,正在逐步成长为国内人形机器人领域的注目明珠,华为旗下的极目机器人公司更是引人瞩目。(新智元、学习智能时代)
国内资讯
小鹏机器人前高管创业入局 AI 陪伴机器人,完成千万元级天使轮融资
原小鹏机器人产品设计负责人孙兆治创业成立的上海珞博智能科技有限公司已于年中完成千万元级人民币天使轮融资,由产业相关?投资。公开资料显示,孙兆治是原小鹏机器人(鹏行智能)产品设计负责人,曾任小鹏汽车内饰设计负责?、滴滴造车项目产品负责人、XID Lab 用户体验设计工作室创始人,是业内知名的硬件用户体验专家及?业设计师。团队方面,珞博智能团队其他成员主要来自字节跳动、华为、大疆、商汤、MiniMax、泡泡玛特等科技及潮玩公司,团队在?模型情感陪伴应用、造型设计等??具备丰富的工作经验。珞博智能于 2024 年 1 月创立,公司的业务方向为 AI 陪伴机器人,其首款产品的定位为“ AI 潮玩”,已经完成了前三轮原型机的设计开发,预计将于明年发布和量产。“明年有望成为 AI 陪伴硬件爆发的元年。”孙兆治表示,珞博智能致力于创造机器人的情绪价值,希望打造AI情感陪伴硬件领域的标杆品牌。(36氪)
具身智能机器人公司星海图完成超 2 亿元 Pre-A 轮融资,华兴担任独家财务顾问
近日,专注于打造“一脑多形”具身智能机器人的人工智能公司“星海图”完成超 2 亿元 Pre-A 轮融资,本轮融资由高瓴创投(GL Ventures)、蚂蚁集团领投,米哈游、无锡创投集团、同歌创投、Funplus 及老股东跟投,华兴资本担任独家财务顾问。本轮融资完成后,星海图将继续推动具身本体及核心模组、端到端 AI 算法以及场景解决方案的研发及落地,同时持续拓展海外市场、构建全球竞争力,打造世界领先的物理世界智能体。星海图公司搭建了具身基础模型(Embodied Foundation Model,EFM)和空间智能引擎(Real2Sim2Real,RSR)范式。在具身基础模型 EFM-1 阶段,星海图采用模仿学习为核心算法架构进行丰富的双臂操作任务,由星海图联合创始人许华哲提出的基于 3D 扩散策略 DP3(3D Diffusion Policy)是当前世界最优模仿学习效率算法架构,在真实的机器人操作任务中,DP3 可以仅用 40 次演示数据完成精确的控制、并且以 85% 的高成功率完成任务,同时在空间、视角、外观和实例等多个方面展现出优秀的泛化能力。目前星海图 EFM-1 已经面向客户场景实现算法整机闭环,成为全国首家实现端到端模仿学习算法整机闭环的具身智能公司。(华兴资本)
Diffusion 模型也能“举一反三”?阿里 IC-LoRA 给图像生成模型增加情节记忆力能力
阿里巴巴通义实验室最新研究表明,现有的文生图 Diffusion Transformer 模型已具备生成多张具有特定关系图像的能力,通过 IC-LoRA 的加持,模型变得更智能,只需少量样本即可学会新技能。研究人员设计了简单有效的流程,唤醒 Diffusion 模型的“上下文学习”能力,大大降低了 AI 模型的训练成本,让更多人参与 AI 创作。IC-LoRA 的出现是 AI 图像生成领域的里程碑式进步,让每个人都能成为艺术家。(站长之家)
华人青年科学家、OpenAI 研究副总裁(安全)翁荔(Lilian Weng)近期在 2024 Bilibili 超级科学晚上发表主题为《 AI 安全与“培养”之道》的演讲。这是其首次在国内发表关于 AI 技术的演讲。翁荔表示,ChatGPT 横空出世以来,AI 技术如同搭乘了高速列车,迅速渗透并影响着人类。随着 AI 的智能化和自主化,确保其行为符合人类价值观变得重要,AI 可能因偏见而变得狭隘,或因对抗性攻击而受到质疑。因此,需要用心引导 AI,确保其服务于人类并确保安全,而 AI 安全是实现其潜在益处的基础,类似于自动驾驶技术。从数据层面,提供多样、全面、正确的数据,可以减少 AI 的偏见,而依赖于多人标注的数据,以提高 AI 的准确性;同时,基于强化学习(RL)和基于人类反馈的强化学习(RLHF),通过奖惩机制训练 AI,类似于训练小狗;此外,使用模型自我评价和详细的行为规则来提升 AI 的输出质量。翁荔毕业于北京大学信息管理系,如今该系名为北京大学数字人文实验室,她是 2005 级本科生,是“兜乐”项目的骨干设计人员,毕业后赴美攻读博士学位,曾就职于 Facebook,如今是 OpenAI 华人科学家、ChatGPT的贡献者之一。翁荔在 2018 年加入 OpenAI ,后来在 GPT-4 项目中主要参与预训练、强化学习&对齐、模型安全等方面的工作。她曾提出最著名的 Agent 公式—— Agent =大模型+记忆+主动规划+工具使用。(钛媒体AGI)
推动智驾、智能座舱 AI 大模型应用!腾讯与博世达成新合作
11 月 4 日,腾讯宣布已与汽车技术与服务供应商博世签订新一轮的战略合作备忘录,双方将进一步深化智驾智舱业务领域的合作,在云+AI 及全球化领域的合作,共同探索在自动驾驶云和地图、智能座舱 AI 大模型应用、助力本土车企海外业务、建立混合云底座及 AI 大模型赋能企业级应用等领域的合作,为汽车行业树立智能化转型的新标杆。除了在国内市场的合作外,腾讯与博世还将携手助力本土车企拓展海外业务,共同建立混合云底座,并通过 AI 大模型赋能企业级应用。这些举措将有助于提升中国智能驾驶技术的国际竞争力,推动全球智能驾驶产业的发展。(ITBEAR科技资讯)
华为:网络+AI 释放更多商业价值,关键在于“四新”战略
在第十届全球超宽带高峰论坛(UBBF 2024)上,华为运营商业务总裁陈浩发表了题为“网络+AI,释放更多商业价值”的演讲。他指出,为了深入挖掘 AI 的潜力并实现商业成功,关键在于实施“四新”战略,即新入口、新业务、新体验和新运营。随着超宽带(UBB)产业与 AI 产业的发展,全球光宽千兆用户数已超过 3 亿。UBB 产业的发展为 AI 产业的增长奠定基础,而 AI 也推动了 UBB 更快发展。华为认为,要通过网络+AI 释放更多商业价值,关键在于“四新”战略。新入口:打造 AI 智能体,抢占家庭 AI 新入口,快速发展智家经济。新业务:运营商通过 AI 赋能新兴业务,聚合优质内容,可逐步构建家庭 AI 应用生态。新体验:云游戏、直播购物、AI 搜索等新兴业务层出不穷。新运营:随着运营商网络规模不断扩大,网络运营挑战日益增加,自动驾驶网络的重要性与日俱增。(全球TMT)
近日,绿盟科技在北京举办了以“无界 BOUNDLESS · 数织未来 AI 同行”为主题的 2024 TechWorld 智慧安全大会。会上,绿盟科技发布了 AI 大模型安全威胁矩阵 v2.0 版本,并同步发布 AISS(AI Safety and Security)大模型安全社区以及国内首个 AI 大模型安全知识库。AISS 社区包括国内首个大模型安全知识库,基于绿盟科技风险矩阵构建,帮助企业快速理解和应对大模型全生命周期的多层次威胁。该社区提供了 AI-Scan 大模型风险评估、LLM Guard 守卫式检测、MLOps 后门扫描等技术支持,立体化地推动企业构建全面的大模型安全防御体系。(创业邦)
北京市人工智能产业投资基金等入股智谱 AI
资料显示,智谱 AI 关联公司北京智谱华章科技有限公司发生工商变更,新增北京市人工智能产业投资基金(有限合伙)、深圳市招商数科创新私募股权投资基金合伙企业(有限合伙)、湖北长江中信科移动通信技术产业投资基金合伙企业(有限合伙)等为股东,同时注册资本由约 2791 万人民币增至约 3107 万人民币。据媒体报道,今年 3 月,智谱 AI 宣布完成新一轮融资,由北京市人工智能产业投资基金参与投资,智谱 AI 也成为北京市人工智能产业投资基金成立以来投资的第一家 AI 大模型公司。(钛媒体APP、每日经济新闻)
11月4日消息,据外媒报道,人工智能机器人初创公司 Physical Intelligence 计划于周一宣布一轮 4 亿美元融资,由亚马逊执行董事长杰夫·贝佐斯领投,Thrive Capital 和 Lux Capital 参投,OpenAI、Redpoint Ventures 和 Bond 等跟投。据悉,本轮融资对该公司的估值约为20亿美元(不包括新投资),大幅高于这家初创公司今年成立时筹集的7000万美元种子资金。(鞭牛士)
Perplexity 推出 AI 选举信息中心,助力选民获取投票资讯
近日,AI 搜索公司 Perplexity 正式推出了其新开发的选举信息中心,旨在为选民提供可靠的投票信息。这一平台将为用户提供 AI 生成的投票相关问题答案、候选人总结等功能,并将在 11 月 5 日选举日当天,实时跟踪投票结果,数据来源于美联社。Perplexity 表示,该选民信息中心所提供的数据,包括投票要求、投票地点和时间,均基于非营利组织 Democracy Works 的数据。值得一提的是,这一组织还为谷歌的相关功能提供支持。此外,Perplexity 确保其生成的选举相关答案来自于一系列经过严谨筛选的、值得信赖的信息源,如 Ballotpedia 和各大新闻机构。然而,在测试过程中,Perplexity 的一些 AI 生成的候选人摘要显示出错误,例如未提及已退出竞选的罗伯特?肯尼迪(Robert F. Kennedy)。另外,某个名为 “未来的波图斯夫人” 的候选人出现在平台上,但点击后却展示了副总统卡玛拉?哈里斯的摘要和一些模因图片。针对这些问题,Perplexity 发言人萨拉?普洛特尼克表示,公司正在调查相关错误的原因。值得注意的是,Perplexity 并不是唯一尝试使用 AI 来提供选民信息的公司。其他大型 AI 公司,如 ChatGPT、Meta AI 和 Google Gemini,都倾向于将选民信息问题转向其他资源,显示出在高风险情况下,生成式 AI 的准确性仍面临挑战。(AI新闻资讯)
Meta 公布机器人触觉感知能力研究成果:利用手指传感器结合“AI 大脑”理解 / 操作外界物体
11 月 4 日消息,Meta 发布新闻稿,介绍了旗下 FAIR(基础人工智能研究)团队对于机器人触觉感知能力的研究情况,这项研究旨在让机器人通过触觉方式进一步理解和操作外界物体。Meta 表示,打造相应 AI 机器人的核心在于让机器人的传感器感知理解物理世界,同时利用“AI 大脑”精确控制机器人对物理世界进行反应,而团队目前开发的机器人触觉感知能力主要就是为了让机器人检测其交互的物体的材质与触感,以便于让 AI 判断机器人应当如何操作这些设备(例如拿起鸡蛋等场景)。Meta 目前一共公布了 Meta Sparsh、Digit 360 和 Meta Digit Plexus 等多项研究成果,其中 Meta Sparsh 是一种基于 AI 的触觉编码器,主要利用 AI 的自我监督学习能力实现跨场景的触觉感知,让机器人的 AI 大脑在学习对于某种物体的“触感”后,即可在各种场景灵活“感知”相关物品的特性。此外, Meta 还开发了 PARTNR 基准,这是一项用于评估人机协作能力的测试框架,旨在测试机器人 AI 系统在实际生活场景中的计划和推理能力,该测试框架内置 10 万个自然语言任务,能够模拟居家环境中的各种情境,帮助开发者测试机器人对于自然语言的理解能力及执行能力。(IT之家)(关于具身智能更多消息,欢迎添加whx23999交流)
美图公司旗下 AI 短片创作工具 MOKI 再次迎来升级,涉及 AI 脚本、AI 分镜、AI 视频三大能力,成片的丰富度、稳定度得到全面增强,并进一步降低用户操作难度,让普通人也能成为“导演”。升级后的 MOKI,AI 脚本扩写功能更加智能,新增了对用户输入故事风格的判断,包括绘本、小说、历史、普通等故事风格标签,能够针对不同的故事风格定制化续写脚本。在 AI 分镜的环节,得益于美图奇想大模型(MiracleVision)图像生成能力的升级,MOKI 的文生图语义准确度获得全面提升。在短片格上,本次 MOKI 的升级新增了童年读物、清新日漫等风格模型,画面质感和场景氛围感显著增强,色彩丰富度和对比度进一步提升,环境细节更加丰富,人物互动场景表现更具故事感。还支持创作者本地上传自定义的分镜图,对拥有个人强烈风格的创作者十分友好。在 AI 视频生成环节,MOKI 已经可以实现动作丰富且崩坏率低的出众效果,能够避免动画畸变成真人、画面不动、画面崩溃等非写实类场景问题,且风格化短片效果出众。(快科技)
DataStax 董事长兼首席执行官:生成式AI面临数据过载,应专注于更小、更具体的目标
数据管理公司 DataStax 的董事长兼首席执行官 Chet Kapoor 在 2024 年 TechCrunch Disrupt 大会上启动了一场关于“新数据管道”的对话,讨论现代 AI 应用的背景,他的对话伙伴包括风险投资公司NEA的合伙人Vanessa Larco,以及数据集成平台 Fivetran 的首席执行官 George Fraser。讨论涵盖了多个方面,并得出一个重要的结论是,在 AI 的早期阶段,优先考虑产品市场契合度而非规模的重要性。这与从一开始就试图在整个公司推广生成性人工智能,向大型语言模型(LLM)抛出所有数据并希望最终得到正确结果的做法形成对比。根据 Larco 的说法,这很可能会造成不准确且昂贵的混乱。“从小开始,”她说。“我们看到的是公司从小规模开始,使用内部应用程序,设定非常具体的目标,然后找到与他们试图实现的目标相匹配的数据。”“我称之为生成式人工智能的愤怒小鸟时代,” Kapoor 说。“这并没有完全改变我的生活,没人帮我洗衣服。今年,我合作的每个企业都在投入一些东西到生产中——虽然是小规模的内部项目,但他们正在投入生产,因为他们实际上在解决问题,如何组建团队去实现这一目标。明年是我所称的转型之年,人们将开始开发真正改变他们所工作的公司的轨迹的应用程序。”(ZPotentials)