
要闻提示



今日头条


传快手AI芯片业务独立运营,凌川科技与多家互联网大厂达成合作或正在测试
10 月 21 日消息,据报道,快手将异构计算与芯片事业部孵化为凌川科技独立运营,专注于下一代 AI 大模型训推一体芯片,目前快手只占据 24.12% 的股权。凌川科技的自研 VPU(Video Processing Unit,视频处理单元)和 NPU 芯片主要围绕视频在线转换和处理功能,目前已与多家互联网大厂达成合作或正在测试。
知情人士透露,分拆时已经有产品量产并在快手内部大规模使用,据称帮集团节省了十几亿元。但芯片项目在集团内部只能从节省成本上做测算,很难做财务方面的统计或者独立计算,难保产生效益的数据有水分。基于这个重要考虑,快手选择将芯片项目独立出来运营。在继续维持内部供应的基础上,面向市场客户。
消息称目前快手内部已经没有芯片项目团队,全部团队转入凌川科技,团队规模已从最初的 30 余人发展至 100 余人,正在进行 VPU 方面的融资工作。(新流研究、IT之家)

国内资讯


台积电:2nm 比 3nm 更受欢迎,A16 工艺对 AI 服务器极具吸引力
据媒体报道,台积电董事长兼首席执行官魏哲家最近确认了人工智能(AI)的需求是“真实的”,表示未来五年内,台积电有望实现连续、健康的增长。客户对于 2nm 的询问多于 3nm,看起来更受客户的欢迎。
据统计,在 2024 年第三季度里,3nm、5nm 和 7nm 工艺的出货量分别占台积电总收入的 20%、32% 和 17%,主要增长动力来自于 3nm 工艺的收入推动。目前 3nm 显示出强劲的出货势头,占比相比第一和第二季度的 9% 和 15% 有较大幅度攀升。
在主要客户的支持下,3nm 的贡献在明年会继续上升,到了 2026 年仍然是台积电收入的主要驱动力。按照台积电的说法,2nm 不但能复制 3nm 的成功,甚至有超越的势头。有市场研究机构表示,苹果、英伟达和 AMD 等科技巨头都将成为台积电 2nm 的首批客户。(快科技)
智源发布原生多模态世界模型 Emu3,实现图像、文本、视频大一统
10 月 21 日,智源研究院正式发布原生多模态世界模型 Emu3。智源研究院表示,Emu3 模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。Emu3 提供了一个强大的视觉 tokenizer,能够将视频和图像转换为离散 token。这些视觉离散 token 可以与文本 tokenizer 输出的离散token 一起送入模型中。
与此同时,该模型输出的离散 token 可以被转换为文本、图像和视频,为 Any-to-Any 的任务提供了更加统一的研究范式。而在此前,社区缺少这样的技术和模型。Emu3 在图像生成、视频生成、视觉语言理解等任务中超过了 SDXL 、LLaVA、OpenSora 等知名开源模型。
中国移动上海产业研究院:金融领域 AI 大模型渗透率过半,系行业最高
在 2024 金融街论坛年会“AI + 金融赋能数字金融新篇章”平行论坛上,中国移动上海产业研究院副总经理陈豫蓉介绍,金融领域是大模型渗透率最高的行业,渗透率超过 50%。智慧销售、智能问答和智能风控是现阶段金融行业最热门,也是应用成熟度最高的 AI 大模型应用场景。
从报道获悉,金融业具备大规模、高质量的数据资源和多维度、多元化的应用场景,被视为大模型技术应用的最优行业之一。国家金融与发展实验室理事长李扬表示,AI 的能力构成了各个基础学科、各个行业的能力,从而构成了各个国家能力的基础。“毫无疑问,今后金融的发展必将被 AI 全面渗透并被全面改造。”
但原中国银监会主席尚福林认为,大模型具备不透明、不可预知等方面的风险。工商银行首席技术官吕仲涛提出,要加强 AI 潜在风险研判、防范,“大模型技术的应用存在‘双刃剑’,大模型技术提升工作效率,同时生成伪造内容、数据泄露等安全风险也日益突出。”(IT之家)
北京新增 12 款已完成备案的生成式人工智能服务,快手可灵 AI 等在内
截至 10 月 21 日,北京市新增 12 款已完成备案的生成式人工智能服务,累计已完成 94 款生成式人工智能服务备案。这次备案的新增服务可以为广大用户带来更多的选择与便利。根据发布的名单显示,北京快手科技公司的可灵 AI、昆仑万维科技股份有限公司的天工图像均在本次新增备案名单内。(AIbase基地)
百度投资理工科助教编程大模型HiBug,持股8.33%
近日,北京一平方科技有限公司发生工商变更,新增北京百度网讯科技有限公司为股东,公司注册资本由约 119.5 万人民币增至约 130.3 万人民币,同时新增两位董事。北京一平方科技有限公司成立于 2020 年 11 月,法定代表人为刘春江,经营范围含计算机系统服务、基础软件服务、应用软件服务、数据处理等,由刘春江、天津圆梦平方科技合伙企业(有限合伙)、宁波风和股权投资合伙企业(有限合伙)等共同持股。
该公司是一家致力于自然语言处理技术和大模型的关键技术研发的企业,其产品 HiBug,通过自研大模型为程序开发人员提供高效的 AI 编程工具。天眼查融资历程信息显示,自成立以来,HiBug 先后获得风和投资和奇绩创坛两轮融资。(亿欧网)
阿里达摩院开源DocOwl1.5文档处理模型,无需OCR,高效“读懂”文档
阿里巴巴达摩院与中国人民大学近日联合开源了一款名为 mPLUG-DocOwl1.5 的文档处理模型,该模型主打无需 OCR 识别即可理解文档内容,并在多个视觉文档理解基准测试中取得了领先的性能。
现有的多模态大型语言模型 (MLLM) 虽然具备文本识别能力,但缺乏对富文本文档图像的通用结构理解能力。为了解决这一问题,mPLUG-DocOwl1.5 强调结构信息在视觉文档理解中的重要性,并提出了 “统一结构学习” 来提升 MLLM 的性能。该模型的“统一结构学习”涵盖了 5 个领域:文档、网页、表格、图表和自然图像,包括结构感知解析任务和多粒度文本定位任务。(AIbase基地)
美的集团成立新公司:含 AI 硬件销售业务
近日,美的(珠海横琴)电子商务有限公司成立,法定代表人为朱垂才,注册资本 1000 万元,经营范围包含:半导体照明器件制造;物联网设备制造;智能家庭网关制造;半导体照明器件销售;人工智能硬件销售等。
美的集团在内部发文,把 AI 列为集团战略发展方向。美的集团副总裁兼 CDO 张小懿称,AI 基础设施方面,美的软件工程院已经上线第一版算力平台,而在算法平台方面,美的的策略是不做底层的大模型。“我们去用好开源的也好、闭源的也好、买进来的也好、自己训练的模型也好,根据不同的场景进行使用,所以算法平台和接入平台非常关键,要解决服务化和信息安全的问题,现在算法平台也已经上线并正在使用。”(证券时报、钛媒体AGI)
比 Java 快 15 倍!国产编程语言 MoonBit 发布原生后端
近日,国产编程语言 MoonBit 推出了其原生后端,使得 MoonBit 能够直接编译到机器码,在硬件上运行,而不再依赖虚拟机。这不仅意味着性能的显著提升,也使得 MoonBit 成为适合嵌入式和 IoT 开发的理想选择。MoonBit 是一种为云及边缘计算设计的 AI 云原生编程语言,其语言设计吸收了 Rust 和 Go 的优秀设计理念。
此外,MoonBit 的内存管理性能也优于 Java 和 Swift,MoonBit 的自动内存管理系统在性能和内存占用上均表现优秀,这对于资源受限的嵌入式和 IoT 设备来说是一个巨大的优势。同时随着对 RISC-V 开源指令集的支持,MoonBit 将能够直接与硬件交互,为嵌入式、IoT 以及系统编程等领域带来更多可能性。(快科技)
清华开源混合精度推理系统 MixQ:大模型近无损量化并提升推理吞吐
清华大学计算机系 PACMAN 实验室发布开源混合精度推理系统:MixQ。MixQ支持 8 比特和 4 比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。
MixQ 同时量化权重和激活,使用低精度张量核心(INT8/INT4 Tensor Core)实现推理加速;同时,MixQ 提取激活中少量的离群值,使用高精度张量核心(FP16 Tensor Core)保持推理准确性,通过系统优化掩盖高精度访存开销。除此之外,研究团队提供了基于 VLLM 和 Tensorrt-LLM 的混合精度推理,用户可以方便地一键部署模型。MixQ 已支持多个主流大模型 LLaMA3,Qwen2,Baichuan2,ChatGLM 等。据了解,目前 MixQ 开源技术已被清程极智等 AI 行业公司应用在实际产品中。(量子位)
国专小巨人“网思科技”宣布完成亿元级 A+ 轮融资
国家专精特新小巨人企业网思科技宣布完成由范式基金独家投资的 A+ 轮融资,累计融资金额超亿元。此轮资金的注入,将助力网思科技进一步深化技术研发,推动其在更多数字化解决方案领域的应用拓展,促进人工智能产业上下游的融合发展。
网思科技最新研发的 AI 大模型管理平台(MaaS,Model as a Service),包括数据管理、微调训练、推理部署、应用开发和服务调度等大模型纳管和服务功能,利用智能体(AI Agent)和检索增强生成(RAG)等技术及开发工具,结合行业领域知识,能够快速构建营销、运维、办公等领域大模型应用,实现自动化、智能化高效作业。先进的 MaaS 平台作为服务新范式,大幅削减了开发成本,加速了大模型的行业应用,为数智化转型注入了新的活力与动力。(新浪财经)

国际资讯


苹果内部员工自揭其短:生成式 AI 研发竟已落后两年多
彭博社知名记者 Mark Gurman 称,Apple Intelligence 的首批功能并不令人满意,而更令人印象深刻的功能将在之后推出。在苹果网站上的 iPad mini 营销中,该公司重点介绍了四项功能,其中三项要到 12 月至 3 月之间才会推出。一开始,标志性功能将是通知摘要。如果准确的话,这些功能会非常有用,但它们缺乏竞争对手产品的惊艳之处,与谷歌、OpenAI 和 Meta 的最新产品相比,苹果的人工智能仍然远远落后。
Gurman 通过研究发现,OpenAI 的 ChatGPT 比苹果的 Siri 准确率高出 25%,能够回答的问题多出 30%。事实上,苹果的内部员工认为,至少到目前为止,其生成式人工智能技术落后于行业领先者两年多。(华尔街见闻)
AI 需求狂热,芯片巨头 Marvell 宣布全线产品提价,打响涨价第一枪
美国网通及光通信芯片大厂 Marvell 近期发出通知,宣布全产品线将于 2025 年 1 月 1 日起涨价,在光通信领域涨价潮中率先行动。Marvell 全球销售资深副总裁 Dean Jarnac 在涨价通知函中提到,为应对全球对加速运算与 AI 需求的激增,公司将持续创新并加大投资力度,以提供客户尖端产品与技术。
Dean Jarnac 表示,为因应投资金额的增长,Marvell 将对所有产品调涨价格,并尽可能降低涨价幅度,以减轻对客户的冲击,他还提醒客户依交期下单,并提供准确的需求预测。Marvell 上季的财报与财务预测主要受惠于 AI 需求的高涨,带动数据中心业务强劲成长。其中,800G PAM、400ZR 数据中心互连(DCI)等光通讯产品成为重要增长引擎,推动数据中心营收年增超过 90%。(快科技)
假装被马斯克裁员的整活鬼才,现在 AI 创业融资 500 万美元
近日,一名名叫Daniel Francis的年轻创业者,因其在推特上的特殊经历而走进公众视野。他不仅因“假装被裁员”而引起马斯克的关注,更靠着一款辅助警察完成文书工作的AI应用成功融资3500万人民币,开创了自己的事业。
据悉,在马斯克收购推特后大裁员的当天,Daniel Francis(当时化名 Johnson)和另一名小哥(化名 Ligma)一起到推特大楼下,冒充被裁的员工整活。当时两人向围观的媒体疯狂卖惨,结果被证实查无此二人后,之前报道的媒体又疯狂删稿,还遭到了马斯克的贴脸嘲讽。对于两个整活的小哥,马斯克也是不按套路出牌,在之后的推文中,马斯克与两人亲切合影,还发推文说“裁掉他们是一个错误”。
而这次事件之后,Daniel 被聘为了 Twitter 工程师。不过后来,由于一段亲身经历,Daniel 选择离开并创立 Abel Police。YC 的 CEO Garry Tan 也表示,为 Daniel 所做的事感到非常骄傲 ——在他的产品出现以前,警方往往需要花费四分之一的时间用在文书工作上,现在只要 2%。(IT之家)
微软与英国政府签署五年人工智能合作协议
微软官方宣布,微软与英国皇家商业服务局代表英国政府签署了一项为期五年的协议,旨在让英国政府能够享受微软人工智能产品和服务组合带来的增值服务。
该协议将于 11 月 1 日生效,将使符合条件的公共部门组织能够通过其选择的采购途径,实现其数字化转型和创新目标,通过节省 Microsoft 365、Azure 云平台、商业应用程序以及首次推出的 Microsoft 365 Copilot 的成本。Microsoft 365 Copilot 将生成式人工智能嵌入到 Microsoft 的生产力应用程序套件中,从而实现重复任务和内容生成的自动化,增强协作,提高效率并改善公共服务。
英国政府还计划建立新一代云服务,以帮助其进行数字化转型,微软将通过 AI 技术等来提供支持。微软英国首席执行官 Clare Barclay 对此表示:“AI 技术为改变公共服务和推动英国经济增长提供了独特的机会。”(鞭牛士、IT之家)
研究发现 AI 工具对学生来说是“双刃剑”,需谨慎使用
瑞典研究人员对人工智能工具的使用与学龄儿童的执行功能之间的关联进行了调查。研究发现,人工智能工具的使用对学龄儿童的学习既有潜在的好处,也有潜在的风险。该研究重点关注人工智能工具在学校作业中的使用与执行功能(EF)之间的关系。执行功能是指规划、抑制和灵活性等认知过程,这对于学业成功至关重要。
研究人员针对不同年龄的学生进行了两项独立的研究,结果显示,不同年龄组对人工智能工具的使用存在显著差异。只有 14.8% 的年龄较小的学生使用人工智能聊天机器人来完成作业,而年龄较大的学生的比例则为 52.6%。
研究人员警告称,AI 工具的使用方式至关重要。如果学生仅将其视为辅助工具还好,但如果完全依赖于 AI 完成任务,则可能引发道德问题,并导致对 AI 生成内容的不加批判的接受。值得注意的是,研究未发现 AI 工具的使用与学生学业表现之间存在显著的相关性。(IT之家)
有望改写 AI 未来,NVIDIA 全新 nGPT 使训练速度暴增 20 倍
据媒体报道,NVIDIA 的最新研究可能彻底改变 AI 的未来,其研究团队提出了一种名为归一化 Transformer(nGPT)的新型神经网络架构。这一架构在超球面(hypersphere)上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,最高可达 20 倍,同时保持了模型的精度。
nGPT 架构的核心在于将所有向量,包括嵌入、多层感知机(MLP)、注意力矩阵和隐藏状态,归一化为单位范数。这种归一化处理使得输入的 token 在超球面表面上移动,每一层模型都通过位移来贡献最终的输出预测。实验结果表明,nGPT 在训练时所需的步骤比标准 Transformer 模型减少了 4 到 20 倍,具体加速效果取决于序列长度。(快科技)
索尼、本田合作的全新纯电动汽车将搭载 AI 智驾功能,2026 年推出
近期,索尼集团和本田将在双方共同开发的纯电动汽车中引入 AI 自动驾驶辅助功能,这是日本车企首次公开引入该功能的计划。双方的合资公司“索尼本田移动出行(Sony Honda Mobility)” 2026 年将在美日两地推出高端纯电动轿车 Afeela,实现 AI 智驾上车。
自动驾驶的性能将随着 AI 的学习而不断提高,AI 控制功能将分阶段引入,并以每年一到两次的频率升级功能,预计最初将配备在高速公路等特定条件下无需驾驶操作的 L3 等级上。(IT之家)
新加坡投资 1.5 亿美元用于公共卫生 genAI 的采用
新加坡卫生部将在未来五年投资 2 亿新加坡元(1.5 亿美元),在其整个卫生系统中实施人工智能技术。这项投资支持技术创新的开发和测试,包括到 2025 年在整个公共医疗保健系统中自动更新记录的生成性人工智能项目。
此外,该部将验证用于乳腺癌检测的医学成像 AI,旨在从 2025 年起逐步在国家补贴筛查计划中采用。这与政府正在进行的将 genAI 模型和应用程序整合到新加坡卫生系统中的举措相一致。(动脉网)
最新研究爆出大模型惊人偏见:边缘群体关键词更容易攻破 AI 防线
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。这项名为“Do LLMs Have Political Correctness?”的研究探讨了人口统计学关键词如何影响越狱尝试的成功几率。
研究发现,使用边缘群体术语的提示比使用特权群体术语的提示更有可能产生不需要的输出。研究人员指出:“这些故意的偏见导致 GPT-4o 模型在非二元性别和顺性别关键词之间的越狱成功率相差 20%,白人和黑人关键词之间相差 16%,即使提示的其他部分完全相同。” Theori Inc 的 Isack Lee 和 Haebin Seong 解释说。
研究人员将这种差异归因于为确保模型的道德行为而引入的故意偏见。越狱的工作原理是,研究人员创建了“ PCJailbreak ”方法,以测试大型语言模型对越狱攻击的脆弱性。这些攻击使用精心设计的提示来绕过 AI 安全措施并生成有害内容。(AIbase基地)
Cognizant Neuro AI 平台升级,集成多智能体 AI 编排功能
Cognizant 宣布对其 Cognizant Neuro AI 平台进行重大升级,旨在帮助企业快速发现、进行原型设计,以及开发能够改善决策的 AI 应用案例,从而提升公司业绩并创造新的收入机会。研究数据显示,大多数企业希望利用 AI 创造新的收入来源,但在实施和扩大跨企业的应用案例时遇到了困难。Neuro AI 升级解决了这些问题,企业领导者可以识别需要解决的业务问题,生成合成数据或导入自己的匿名化数据,并开始创建 AI 模型。
增强后的 Cognizant Neuro AI 平台现已向 Cognizant 客户开放,并拥有多项专利支持。它几乎可以应用于任何涉及数据分析的行业或业务挑战,包括库存管理、动态定价、减少欺诈和优化员工配置等方面。这些功能升级是 Cognizant AI 研究实验室首个集成到商业产品中的成果。Cognizant 在 Neuro AI 的升级中集成了强大的新功能,包括 Opportunity Finder 多智能体发现工具,以及一套由大语言模型助理组成的强大 AI 决策引擎。(全球TMT)