

要闻提示


今日头条 微软官方发长文炮轰谷歌:不遗余力诋毁我们
10月29日消息,微软副总法律顾问Rima Alaily发表一篇长达1500字的文章,公开指责谷歌利用不正当手段打击微软,称谷歌通过误导竞争监管机构、政策制定者和公众来诋毁微软。Alaily列举了谷歌多次试图诋毁微软的例子,并揭露谷歌即将启动一个新的“影子”组织来进一步攻击微软的云业务,“谷歌不遗余力地混淆其参与、资金和控制”。
文章指出,谷歌曾提出支付近5亿美元,以此阻止微软和欧洲云基础设施服务提供商协会(CISPE)达成协议,不过最终双方仍解决了彼此之间的分歧。然而,谷歌并未就此罢休,正在英国和欧盟成立“开放云联盟”来进行游说活动,该联盟由谷歌指导并主要由谷歌资助,旨在攻击微软在英国和欧盟的云计算业务。
微软还提到,谷歌仍在直接或间接地游说全球各地的竞争监管机构,对大型云服务提供商,特别是微软和AWS,施加限制。而谷歌则试图将自己定位为非大型或小型云服务提供商,以避免受到监管。
此外,微软还揭露谷歌今年早些时候分发了一份“情况说明书”,试图引起人们对微软在中国市场做法的担忧,微软声称该文件具有误导性,充满了不准确的信息。Alaily还强调,全球至少有24起针对谷歌的反垄断调查正在进行中,认为谷歌应该专注于解决这些问题,而不是花费资源攻击竞争对手。(IT之家)

国内资讯


抖音:严厉打击利用 AI 骗取老年人互动,下架违规视频、处置违规账号
近期,抖音官方发布《抖音严厉打击利用 AI 骗取老年人互动的治理公告》。抖音官方表示,鼓励创作优质内容,包括采用 AI 技术进行辅助创作,但所创作内容必须遵循平台规范。平台对利用生成式人工智能技术创作和发布违背科学常识、弄虚作假、造谣传谣的内容进行持续打击。
近期平台发现,有账号不当利用 AI 技术,生成小和尚、军人、AI 女性等虚拟形象,却不在内容中进行 AI 标注提示,并采用特定话术,引诱老年人点赞、关注、发布评论,甚至进行导流获利,平台进行了严厉处置。典型行为包括:生成小和尚形象、生成军人形象、生成 AI 女性形象等。
抖音官方表示,以上内容严重违反了平台规则。针对使用 AI 生成虚拟人物发布违规内容的行为,平台会对违规视频下架,对违规账号进行取消其投稿和营利权限、封禁账号等处置,并利用模型、技术识别能力等手段,进行长期系统的识别发现和处置。(IT之家)
可灵 AI 收入或破千万,商业化已有阶段性进展,但打平成本还需要时间
据媒体报道,可灵 AI 商业化已有阶段性进展,收入或已达到千万级别,团队内部似有庆祝活动。暂时无法确定可灵 AI 的收入主要来自 C 端还是 API 。
可灵 AI 是由快手大模型团队自研打造的视频生成大模型。可灵 AI 支持 AI 视频、AI 图片等功能,用户可以通过文字描述生成自己想要的图片以及视频内容。据快手数据,自 2024 年 6 月发布以来,可灵 AI 已经吸引了超过 360 万用户,累计生成了 3700 万个视频和超过一亿张图片。
不过,可灵 AI 的收入或许还无法覆盖算力成本。视频生成模相比大语言模型在训练和推理成本上可能更加烧钱。例如,Sora 模型的训练和推理所需的算力需求分别达到了 GPT-4 的 4.5 倍和近 400 倍。(AI Dance)
字节招兵买马,拟在欧洲设立 AI 研发中心
据雷峰网-AI 科技评论独家获悉,字节跳动正在积极筹备在欧洲设立 AI 研发中心。公司目前已开始在欧洲寻觅大型语言模型(LLM)和 AI 领域的顶尖技术人才,力图招募业内专家。此前,字节跳动刚与清华大学人工智能研究院共同成立了可扩展大模型智能技术联合研究中心(SIA Lab),推动大模型的产学研合作,专攻预训练大模型。
欧洲在 AI 领域的人才储备方面具备显著优势,得益于其顶尖大学和研究机构,如英国的牛津大学、剑桥大学、帝国理工大学,瑞士的苏黎世联邦理工学院、洛桑联邦理工学院等。这些机构在机器学习、数据科学和自然语言处理等AI关键领域培养了大量人才。同时,欧洲各国政府推出了专项 AI 人才培养计划,通过研究资助、合作项目和创业扶持来吸引和留住顶尖人才,以应对全球 AI 人才竞争。(更多内容请点击独家丨字节招兵买马,拟在欧洲设立AI研发中心)
阿里巴巴国际站发布首个全流程 AI 产品
10 月 28 日,阿里巴巴国际站发布首个全流程 AI 产品:推出 AI 生意助手 2.0。新产品在发品、接待、营销、合规领域分别为中小企业配备了 4 个专业的 AI Agent,能实现整个外贸经营的全流程托管,为中小企业创造生意增量。据了解,新的 AI 外贸产品还将能关联企业专属知识库,形成更加个性化、更具专业化的服务方案。(36氪)
天津智谱华章科技有限公司成立,注册资本 5000 万
近期,天津智谱华章科技有限公司正式成立,由刘德兵担任法定代表人,注册资本高达 5000 万人民币。
天津智谱华章科技有限公司的经营范围广泛,涵盖了人工智能基础软件开发、人工智能应用软件开发、数据处理和存储支持服务、信息技术咨询服务、人工智能理论与算法软件开发、数字内容制作服务以及大数据服务等多个前沿领域。天津智谱华章科技有限公司的背后股东为智谱AI关联公司北京智谱华章科技有限公司,后者以其全资持股的方式。(观点新媒体)
英诺天使基金李竹:智能终端及机器人产业会引领 AI 的落地和应用
英诺天使基金创始合伙人李竹在柳州市智能终端及机器人产业发展合作大会上表示,智能终端和机器人方向,代表了新质生产力,是人工智能领域具身智能的重点应用,是目前的前沿科技方向,发展前景广阔。
该产业方向既可以To B,也可以 To C;既可以通过无人驾驶、泛化工作服务和提升工业企业效率,也可以通过 AI 眼镜、家用机器人(康复、家务等)、无人驾驶汽车提供新一代的终端。这个产业会引领 AI 的落地和应用,替代手机等终端。(财联社)
Jumio:面对生成式 AI 带来的欺诈风险,用 AI 对抗 AI 是唯一解决之道
近日,Jumio 举办中国媒体见面会。Jumio 方面表示,面对生成式人工智能带来的欺诈风险,用AI对抗AI是唯一解决之道。据介绍,Jumio利用自动化、生物识别、人工智能/机器学习、活体检测和无代码编排等技术,结合数百个数据源,确保真实客户能够快速完成开户和登入流程。
据介绍,Jumio 利用自动化、生物识别、人工智能/机器学习、活体检测和无代码编排等技术,结合数百个数据源,确保真实客户能够快速完成开户和登入流程。自2010年成立以来,Jumio已累计处理10亿多笔交易,业务覆盖200多个国家和地区。(36氪)
许正宇:AI 政策宣言既管控风险亦促进发展
10 月 28 日,财经事务及库务局局长许正宇表示,政府发表有关在金融市场负责任应用人工智能的政策宣言,背后的重点是负责任。他指出,人工智能 (AI )发展和应用,正以前所未有的速度改变我们的生活。在金融业的应用尤其广泛,由聊天机械人到识别可疑交易和防止欺诈,由改善投资组合到管理退休金,AI 几乎无处不在。现时香港金融机构的 Gen AI 使用率达 38%,远高于全球平均 26% 水平。
他又指,AI 是一把双刃剑,既有庞大潜能,也隐藏风险。在 AI 时代,这股力量难以逆转,政府的金融政策不单要与时俱进,更要走在最前,确保在促进发展 AI 技术的同时,有效应对网络安全、数据私隐及知识产权保障等潜在挑战。这份政策宣言确立了双轨模式,在机遇及风险之间作出平衡,将与监管机构和行业持份者携手合作,提供明确的监管框架,协助业界抓紧机遇,负责任地采用 AI。(金融界)
创新中国 AI 电影技术!全国首家 AIGC 电影研究院在沈阳沈北新区成立
10 月 27 日,“人工智能时代微短剧、微电影创作与行业发展研讨会暨中国电影剪辑学会短片短视频艺术委员会第二届理事会成立大会”在辽宁传媒学院举行。会上,全国首家 AIGC 电影研究院–“辽宁传媒学院 AIGC 电影研究院”在大会上举行了揭牌仪式。
大会举行了中国电影剪辑学会短片短视频艺术委员会第二届理事会换届仪式,发布“中国首届 AI 微电影创作大赛”。本次大赛面向全国征集 AI 微电影作品,旨在激发创新活力,推动 AI 技术在电影领域的应用与发展。业内人士表示当日揭牌的辽宁传媒学院 AIGC 电影研究院将为 AI 电影领域的发展起到积极的推广和促进作用,为行业研究、人才培养和技术创新提供有力支撑。(中国新闻网)
金蝶发布企业管理领域国内首款 AI 原生移动应用
近期金蝶集团 2024 全球创见者大会在北京举办,并发布了自主研发的 AI 管理助手的移动形态“苍穹 APP ”,成为国内企业管理领域首款 AI 原生移动应用。
据介绍,苍穹 APP 的开发基于金蝶自研大模型和 AI agent 技术架构,能够在自然语言交互中理解用户意图,不仅能提供财务通识问答,比如公司注册、财税优惠政策解读等智能问询,而且能提供企业财务制度、差旅制度、法务政策等企业知识问答及智能分析服务,更能够连接 SaaS ,覆盖财务诊断、指标分析、员工服务等多个企业级 AI 应用场景。(媒体滚动)
自动驾驶也要玩“元宇宙”? 极佳科技用 AI 脑补,让 4D 场景重建更丝滑
近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D 。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。
DriveDreamer4D 框架利用世界模型的先验知识提升 4D 驾驶场景重建效果,解决传统方法在复杂路况下容易翻车的问题。实验证明 DriveDreamer4D 在处理复杂路况时效果优于传统方法,提高重建图像保真度和准确性。虽然仍处于研究阶段,但未来有望成为自动驾驶领域不可或缺的一部分。(机器之心)
“ AI 四小龙”依图科技:回归聚焦智能城市与安防赛道,AI 大模型将加速安防数智化
在近期举行的 2024 中国国际社会公共安全产品博览会上,AI 公司依图科技推出再升级的“天问大模型”、小明智能体、以及全新的“依图万象”合作伙伴业务品牌等诸多产品。
依图科技总裁段爱国表示,在如今 AI 2.0 时代,大模型使长尾算法生产的边际成本趋近于 0,促使 AI 技术能够加速商业落地。“用极致性价比产品,用大模型的先进思想、理念和工具全方位赋能合作伙伴,助力伙伴转型成为场景大模型方案的提供商与运营商。”段爱国谈及依图万象合作伙伴业务定位时表示,基于依图训推一体 +Agent 架构、算法、算力的大模型产品赋能伙伴,帮助客户实现数据、应用与服务的闭环,从而开发和持续运营场景智能化应用。(钛媒体AGI)

国际资讯


苹果公开苹果 AI 背后技术,邀请研究人员访问
苹果公司官方近日正式公开了一项名为 Private Cloud Compute(PCC)云端 AI 模型,并邀请所有安全和隐私研究人员访问和研究。苹果现已开放一本《PCC安全指南》,该指南包括有关 PCC 各组件的全面技术细节,以及它们如何协同工作,为云中的人工智能处理提供突破性的隐私保护。苹果表示,这将帮助其他研究人员更好地了解 PCC。
PCC 技术可以满足Apple Intelligence 的计算密集型请求,同时提供了突破性的隐私和安全保护,是苹果Apple Intelligence 得以实现的基础之一。苹果公司声称,Private Cloud Comput 是云端最先进、最安全的 AI 计算架构。
此外,苹果公司还将“抓虫”漏洞奖励扩展至 Private Cloud Compute,获得“抓虫”奖励的研究人员可获得 5-100 万美元(当前约 35.6 – 712.8 万元人民币)的奖金。(IT之家)
Sierra融资1.75亿美元:估值45亿美元,OpenAI董事长联合创办
10月29日消息,据外媒报道,由 OpenAI 董事长 Bret Taylor 共同创立的人工智能初创公司Sierra在一轮融资中筹集了1.75 亿美元,该初创公司的估值为 45 亿美元。Sierra 由 Taylor 和谷歌资深高管 Clay Bavor 共同创立,专注于向 WeightWatchers 和 Sirius XM 等品牌销售人工智能客户服务聊天机器人。
聊天机器人领域当然不乏竞争。但 Sierra 声称其技术不太容易受到幻觉的影响,幻觉是人工智能模型偶尔会吐出的虚构事实。Sierra 还允许客户根据其企业品牌定制其 AI 的个性,使用来自 OpenAI、Anthropic 和 Meta 等公司的生成 AI 模型“星座”来完成任务并检查准确性。
Sierra 最新一轮融资的投资者包括 ICONIQ 和 Thrive Capital。据Crunchbase 称,Greenoaks Capital 领投了此轮融资,使 Sierra 的总融资额达到 2.85 亿美元。(鞭牛士)
Meta正在开发人工智能搜索引擎
10月28日消息,据外媒报道,当Meta Platforms试图跟上OpenAI在人工智能开发方面的步伐时,这家Facebook所有者正在开发种搜索引擎, 该搜索引擎会抓取网络数据,为使用其Meta AI聊天机器人的人们提供有关时事的对话答案。
据一位与搜索引擎团队交谈过的人士称,Meta希望通过此举降低对谷歌搜索和微软必应的依赖,这两家公司目前为使用Meta AI的用户提供有关新闻、体育和股票的信息。据一位参与该战略的人士称,如果谷歌或微软退出这些安排、这也可能为Meta提供备用选项。(鞭牛士)
真开放式游戏,谷歌造出首个无限人生模拟游戏 Unbounded
谷歌开发了首个无限人生模拟游戏 Unbounded,借助大型语言模型和视觉生成模型,游戏世界由 AI 生成,可随着游戏推进无限延展和演进。玩家可以定制角色外观和个性,游戏根据玩家行为生成新场景、故事和挑战,创造个性化和无限的游戏体验。
Unbounded 的核心特性包括角色个性化、游戏环境生成、开放式互动和实时生成。游戏还采用了潜在一致性模型和区域 IP 适配器,以实现实时交互和保持角色与环境的一致性。Unbounded 的设计理念源于詹姆斯·卡斯的著作,旨在创造一个目标是让游戏继续下去的无限游戏,突破传统视频游戏的限制。(机器之心)
控制电脑手机的智能体人人都能造,微软开源 OmniParser
微软最近开源了 OmniParser,这是一个基于大模型的屏幕解析工具,能够将 UI 截图转换成结构化元素。OmniParser 的界面解析能力达到了行业领先水平,甚至超越了 GPT-4V 。这个工具使得普通用户也能创建自己的计算机控制智能体。OmniParser 通过解析用户任务和 UI 截图,输出带有边界框和数值 ID 的解析截图。它还能与其它行动模型如 GPT-4V 和 Llama 3.2 等结合,创建出能理解并控制计算机的智能体。
OmniParser 的开发始于创建两个数据集:一个用于检测可交互区域,一个用于描述图标。它使用两个互补模型进行微调:一个用于检测可操作区域,一个用于提取元素的功能语义。(undefined)
丹麦首台 AI 超级计算机 Gefion 推出,由 1528 个英伟达 H100 GPU 驱动
丹麦推出了该国首台 AI 超级计算机,以丹麦神话中的女神 Gefion 命名,旨在推动量子计算、清洁能源、生物技术等领域取得突破,英伟达首席执行官黄仁勋与丹麦国王一同出席了揭幕仪式。
Gefion 是一台由 1528 个英伟达 H100 Tensor Core GPU 驱动的英伟达 DGX SuperPOD 超级计算机,使用英伟达 Quantum-2 InfiniBand 网络进行互连。目前,丹麦气象研究所(DMI)正在进行试点,希望更快地提供更准确的天气预报。与传统方法相比,Gefion 有望将预测时间从几小时缩短到几分钟,同时大幅降低能耗。哥本哈根大学的科研人员正在利用 Gefion 超级计算机对量子计算机电路进行大规模分布式模拟。Gefion 超级计算机使模拟系统能够从 36 个纠缠量子比特增加到 40 个,这使其接近所谓的“量子霸权”,或者说在使用较少资源的情况下,性能会大大优于传统计算机。(IT之家)
因使用生成式 AI 制作恶意软件,日本一 25 岁男子首次被判有罪
据外媒报道,日本一名 25 岁林(Hayashi)姓男子因滥用生成式 AI 制造电脑病毒,被东京地方法院判处有期徒刑三年,缓期执行四年,标志着日本首次有因滥用生成式 AI 作出刑事定罪的案例。
据判决书等资料显示,去年 3 月 31 日,该男子左右在川崎市的住所中利用电脑和智能手机,通过生成式 AI 获取的恶意程序设计图(源代码)制作了类似勒索软件的电脑病毒。此外,他还冒充他人骗取了手机通信卡等物品。判决称:“被告为了获取金钱而制作病毒,其行为自私且刑事责任重大。”同时,考虑到该男子已承认起诉事实并表示反省,法院决定给予缓刑。
本次案件也反映了另一个现实 —— 哪怕没有 IT 专业知识,也可以利用生成式 AI 制作病毒。根据检方的开场陈述,被告林某使用“非官方版的 ChatGPT”,创建了对特定文件进行加密并使其无法使用,以及要求支付加密货币“比特币”的程序源代码。据称,他通过修改并合并上述代码来完成病毒的制作。(IT之家)
Meta 开源长视频 LLM 项目 LongVU :可过滤重复帧,高效精准理解长视频内容
最近,Meta AI 团队开源了 LongVU,这是一种新颖的时空自适应压缩机制,旨在提升长视频的语言理解能力。传统的多模态大型语言模型(MLLMs)在处理长视频时面临着上下文长度的限制,而 LongVU 正是为了解决这一难题而诞生。
LongVU 的工作原理主要通过过滤重复帧、跨帧token压缩等方法来高效使用上下文长度,能够在保持视频视觉细节的同时减少视频中的冗余信息。此外,LongVU 还针对帧间的时间依赖性进行了空间令牌的压缩这一创新的压缩策略使得 LongVU 能够在有限的上下文长度内,有效地处理大量的帧,并且几乎没有视觉信息的损失。
在 LongVU 的应用示例中,用户可以通过简单的问题获取视频的详细描述。例如,用户询问 “这段视频的情况如何?”LongVU 能够准确描述视频中的场景、角色及其互动过程。无论是简单的询问视频中的物体,还是复杂的情节描述,LongVU 都能够迅速并准确地提供反馈。
斯坦福开源学术研究神器 STORM 再进化,AI 智能体像人一样进行圆桌讨论
斯坦福大学最近推出了 Co-STORM,这是其之前发布的学术研究辅助工具 STORM 的升级版。Co-STORM 通过模拟专家对话和协作对话机制,使用轮次管理策略来进行流畅的 AI 学术研究。它能够模拟不同角色,如主持人和多个领域的专家,就特定主题进行深入讨论。
Co-STORM 利用大语言模型生成答案和后续问题,同时结合外部知识来源,以实现更全面的对话。用户可以通过Co-STORM 的网站免费体验这一服务,该工具在 GitHub 上的 Star 量已超过 12k。Co-STORM 的推出进一步增强了STORM 的功能,使其更擅长处理需要大量研究和引用的写作任务,并且能够以圆桌讨论的形式提供更丰富、多角度的内容。(新智讯)
谷歌 DeepMind 推出两种思维模式的 Talker-Reasoner 框架,可令 AI 助理同时进行快 / 慢速思考
谷歌 DeepMind 公布了 Talker-Reasoner 框架,相关论文发布于 ArXiv。该框架采用“双系统”设计,能让 AI 助理同时进行快速和慢速思考。系统 1 Talker LLM 负责快速、直觉和合成的语言回应,与用户交谈;系统 2 Reasoner LLM 负责解决复杂问题,从外界获取信息增强知识以提升系统 1 回应的准确度及逻辑性。其目的是增强 AI 响应速度,系统 1 可基于现有知识提供直觉回应,系统 2 能以更准确严谨的方式响应用户后续回答。
DeepMind 团队用 Gemini 1.5 Flash 打造测试模型,在测试中担任睡眠指导顾问,发现系统 1 回应流畅但内容较无用,系统 2 激活后模型能回应合理内容。研究人员称这是世界首个拥有两种思维模式的 AI,未来将持续改进该框架,提升模型响应速度和输出内容准确程度。(ITSoul)
AI 模型揭露美国地下水污染:超 7100 万美国人的饮用水可能含有致癌物
美国《科学》杂志日前刊登一项应用 AI 模型的新研究指出,有害人体健康的“永久性化学物质”由于长期且广泛使用,已污染美国各地作为饮用水水源的地下水,受影响人口可能高达 7100 万至 9500 万。
“永久性化学物质”主要指全氟和多氟烷基物质(PFAS),可以在环境中存在数十年,通常与癌症、肝脏和心脏受损以及婴儿和儿童免疫和发育受损等相关。虽然美国环境保护局已引入新的监测要求来解决大型公共供水系统中的 PFAS 问题,但并未覆盖绝大多数较小的供水系统或家庭水井。
美国地质调查局研究人员使用了一种叫作“极限梯度提升算法”的机器学习模型,利用该机构 2019 年至 2022 年从各种水井网络采集的大量地下水样本来训练这一模型,用来预估用作饮用水的地下水源中 PFAS 分布情况。结果显示,美国本土约有 7100 万至 9500 万人可能使用含有可检测 PFAS 浓度的地下水作为饮用水。(央视新闻客户端)
英国 AI 技术 Aire 助力心脏病风险预测,预测患者死亡风险
英国国民健康服务体系( NHS )正在试用一项名为 AI-ECG 风险评估( Aire )的 AI 技术,该技术通过分析心电图结果,能够检测出医生可能忽略的心脏问题,并预测患者的死亡风险。
Aire 模型经过近 19 万名患者的 116 万份心电图数据训练,准确识别未来 10 年内的死亡风险、心力衰竭、严重心律不齐和心脑血管疾病的概率分别为 78%、79%、76% 和 70%。目前,该模型正在英国帝国理工学院医院等进行临床试验,未来有望广泛应用于心电图检查,辅助医生发现潜在风险,提高心脏病预防和干预的效率。(AI薛Teacher)
越南 Vingroup 设立 1.5 亿美元基金,支持 AI 等领域初创企业
10 月 28 日,越南企业集团 Vingroup 宣布,正在启动一只 1.5 亿美元的基金,以支持东南亚地区专注于人工智能、半导体和云计算等领域的科技初创企业。该公司表示,Vingroup 将从之前的一个投资组合中划拨 1 亿美元,为这个名为 VinVentures 的基金提供融资。据 Vingroup 称,该公司创始人、越南首富潘日旺将从个人财富中逐步向该基金再追加 5000 万美元。
声明称,VinVentures 最初将以越南初创企业为目标,然后扩大范围,支持新加坡、印尼和菲律宾等国的公司。Vingroup 在声明中表示,在向科技企业集团转型的过程中,投资科技初创企业是该公司的“战略重点”。该公司表示,Vingroup 通过旗下的 Vingroup Ventures 和 VinTech City 基金投资了许多科技初创企业。(新浪财经)