23日AI资讯：AI公司波形智能解散，主创团队集体入职OPPO；微软亚研院前首席研究经理谭旭加入月之暗面；商汤CEO内部信曝光丨AI情报局-百合树AI写作-专业学术论文写作助手

23日AI资讯：AI公司波形智能解散，主创团队集体入职OPPO；微软亚研院前首席研究经理谭旭加入月之暗面；商汤CEO内部信曝光丨AI情报局

要闻提示

1.AI创业公司波形智能解散，曾获千万融资，主创团队已入职OPPO

2.传字节跳动旗下BytePlus考虑在泰国新建数据中心，专攻人工智能

3.中国首个UI大模型研发商称其模型性能超越了美国OpenAI、苹果的AI模型

4.商汤 CEO 徐立内部信曝光，确定“三位一体”新 AI 战略

5.库克：苹果 AI 不求最先但求最好

今日头条

微软亚研院前首席研究经理谭旭加入月之暗面，研发类似 GPT- 4o 的端到端语音模型

据报道，微软亚研院前首席研究经理谭旭于 8 月加入大模型创业公司月之暗面，主要负责研发端到端语音模型。据了解，月之暗面的整个多模态研究在 2023 年 10 月就开始了。在受市场关注的视频生成大模型上，接近月之暗面的人士称，月之暗面目前有十人左右的团队在研发视频模型，为确保产品更具差异性，对外发布计划仍在推迟。

据谭旭个人主页，他在离开微软研究院前担任首席研究经理，方向是生成式人工智能、语音/音频/视频内容生成，论文引用量达上万次，他也曾担任 NeurIPS 等学术会议期刊的审稿人；其多项语言、语音、音乐、视频生成成果已应用在 Azure、Bing 等微软的产品与服务中。

谭旭加入后，主要目标之一是可能是帮月之暗面打造类似 GPT-4o 的语音体验。今年 5 月，OpenAI 发布多模态大模型 GPT-4o，其语音交互效果大幅提升：延时更低、可随时打断，这些变化就来自端到端语音技术。（晚点LatePost）

国内资讯

AI创业公司波形智能解散，曾获千万融资，主创团队已入职OPPO

10 月 22 日，有媒体援引波形智能内部人士消息称，该公司将被手机厂商 OPPO 收购，CEO 姜昱辰将入职 OPPO。OPPO 方面表示：“目前暂无更多信息。”“我们只是被收购，产品仍在正常运营，不是网传的关张。”上述波形智能内部人士表示。

此前，波形智能推出新一代中文内容创作大模型 Weaver ，专为长文本生成设计，应用于小说创作、营销文案设计、短视频脚本撰写等领域；基于 Weaver 大模型的 AI 写作助手蛙蛙写作，支持多类型、风格和主题的创作，提供高效的专业写作功能。姜昱辰曾向媒体表示，Weaver 大模型专为创作而生，最大特点是 50B tokens 高质量中文内容进行预训练，再加上工程师不断调整，使得该大模型的写作内容更有“人味”。

今年初，波形智能曾宣布完成千万元级 Pre-A 轮融资。该轮由蓝驰创投领投，西湖科创投、蚂蚁金服董事长井贤栋、知名天使人费革胜、老股东藕舫天使跟投。（凤凰网科技）

传字节跳动旗下BytePlus考虑在泰国新建数据中心，专攻人工智能

10 月 22 日，一位熟悉字节跳动的消息人士透露，字节跳动旗下的 BytePlus 部门正考虑于 2025 年在泰国建立一个数据中心，提供基于云和人工智能（AI）的服务。该消息人士表示，泰国是字节跳动东盟扩张计划的一部分，该国的电子商务具有巨大的增长潜力，特别是在拥有众多追随者和顶级（OTT）参与者的大型零售品牌方面。

媒体报道称，BytePlus 最近通过委任泰国公司 Light Up Total Solution Public Co Ltd（LTS）为其独家经销商，在泰国市场推出技术解决方案，包括实时商务解决方案，旨在利用当地价值约 25 亿美元（当前约 178.11 亿元人民币）的社交电商行业。根据协议，LTS 将作为 BytePlus 在泰国的独家经销商和营销商，为企业提供 BytePlus 的技术解决方案。这些解决方案包括 BytePlus Effects、BytePlus Recommend、BytePlus Live、BytePlus Video On Demand（VOD）、BytePlus CDN、ByteHouse 和 BytePlus Cloud。

BytePlus 企业（泰国）负责人 Monticha Kongthavee 曾表示，通常来说，通过采用 AI 推荐引擎，企业将能够将其商品总价值提高 30%。（IT之家）

中国首个UI大模型研发商Motiff称其模型性能超越了美国OpenAI、苹果的AI模型

在日前举行的 2024 QCon 大会上，看云控股集团旗下 AI 设计工具平台 Motiff 妙多公布其研发基于整合专家模型架构的国内首个 UI 大模型最新技术进展。Motiff 妙多 AI 负责人赵薇表示，目前其国内首个 UI 大模型—— Motiff 妙多大模型在 UI 领域的效果和能力上已经超越 GPT-4o 和苹果的Ferret UI模型技术，并追平了训练数据多 40 倍的Google ScreenAI大模型。

“基于自研大模型，我们能以较低成本快速孵化 AI 应用。”赵薇表示，公司通过增加知识密度和加入基于专家模型生成的合成数据，构建了一批高质量、具有专业知识的 UI 数据。而相比ScreenAI在训练时用了近 4 亿条训练数据，Motiff 妙多大模型所用的训练数据不到其 2%，因此在更精准、质量高的数据驱动下，使得训练出的模型具备解决复杂问题的能力。(钛媒体AGI)

商汤 CEO 徐立内部信曝光，确定“三位一体”新 AI 战略

商汤科技董事长兼首席执行官徐立于近日发内部信，首次提及公司最新确立的“大装置-大模型-应用”的三位一体战略，同时宣布将围绕战略和核心资源，将构建更加集中和高效的组织架构，加快组织和管理的轻盈化进程。

徐立阐述了自己对于传统 AI 1.0 和生成式大模型 AI 2.0 的理解，在传统的 AI 1.0 时代，模型生产的主要成本在于研发人员的投入。而在生成式大模型 AI 2.0 时代，模型生产的成本主要在于算力资源的投入。徐立还表示在生成式大模型 AI 领域，商汤的核心战略是实现算力大装置、大模型和应用的无缝集成，以应用驱动模型，以模型带动算力的优化。确立“大装置-大模型-应用”的三位一体战略，旨在通过数量级级别的优化，提升算力资源的使用效率，服务好客户。商汤科技将致力于成为最懂算力的大模型服务商，和最懂大模型的算力服务商。（新浪科技）

荣耀申请基于 AI 模型的定位方法专利，可获取准确的最终定位结果

国家知识产权局信息显示，荣耀终端有限公司申请一项名为“一种基于 AI 模型的定位方法、设备及存储介质”的专利，公开号 CN 118764819 A。

专利摘要显示，一种基于 AI 模型的定位方法、设备及存储介质，涉及通信技术领域。终端设备利用 PRS 和环境参数组合确定匹配的一个或多个 AI 模型索引并发送至向 LMF 网元，以获取对应的 AI 模型。终端设备利用环境参数组合确定各 AI 模型输出的定位结果的权重，并利用 PRS、各 AI 模型以及各 AI 模型对应的权重确定最终定位结果。

此外，也可以由 LMF 网元确定 AI 模型索引，也可以由 LMF 网元确定最终定位结果，并将最终定位结果发送至终端设备。该方案可以利用多个当前的环境参数匹配程度较高的 AI 模型进行定位并根据权重对定位结果进行融合，以获取准确的最终定位结果，适用于现实环境复杂多变，或者 AI 模型训练不充分的区域。（金融界）

诺基亚与联想达成合作，将共同开发 AI 数据中心解决方案

10 月 22 日，诺基亚宣布与联想建立战略合作伙伴关系，共同打造全面的数据中心网络和自动化解决方案，为 AI、机器学习和其他计算密集型工作负载的计算、存储和传输需求提供支持。这些方案将为企业、电信公司以及数字基础设施和云服务提供商量身定制，满足其日益增长的需求。

此次合作将整合联想的 ThinkSystem AI-ready 高性能服务器和存储产品系列与诺基亚的数据中心网络解决方案，其中包括数据中心网络架构、IP 路由及 DDoS 安全产品组合，同时结合诺基亚近期推出的事件驱动自动化平台 (Event-Driven Automation，EDA)。据介绍，这些结合的解决方案将有助于满足现代工作负载对处理和网络性能的高要求。

据介绍，该架构将使 AI、机器学习及计算密集型任务的自动化更加顺畅，同时增强了对动态环境的适应性，提高了可观测性、可编程性和可扩展性。此外，诺基亚和联想的解决方案还内置了安全功能，能够实时检测并抵御安全威胁。（IT之家）

AI 助力物质探索，有“谱”了！上海 AI 实验室发布书生·言普 AI 谱学大模型

近日，上海人工智能实验室（上海AI实验室）发布 AI 谱学大模型“书生·言普”（InternSpect），通过构建一系列谱学专业模型，助力研究者更高效、更精准地探索微观世界，从而推动物质科学的研究创新。

书生·言普“家族”中首个亮相的是全球首个应用于解析电子顺磁共振谱（EPR）的大模型 IS-EPR。该模型由上海 AI 实验室与武汉大学联合推出，依托智能自动谱图解析系统和前沿海量的顺磁物种数据，解谱准确率可媲美人类专家，解谱速度从数小时压缩至秒级。

在产业应用方面，书生·言普现已搭载于国产 EPR 设备投入试用，IS-EPR 以其具备的谱图解析、文献关联能力，在药物设计、自由基检测、结构分析和过程控制等领域发挥关键作用；在科学研究方面，书生·言普还将推出更多应用于质谱、晶体结构解析等领域的大模型，探索谱学研究新范式，以人工智能驱动“格物究理”。（上海证券报）

清华 8 比特量化 Attention，两倍加速于 FlashAttention2，各端到端任务均不掉点

清华大学计算机系的研究团队提出了一种新的 8 比特量化 Attention 机制，名为 SageAttention，它能显著提高大模型中注意力运算的效率。这项技术实现了比 FlashAttention2 快 2 倍、比 xformers 快 2.7 倍的即插即用推理加速，而且在使用于视频、图像、文本生成等大模型时，没有造成端到端任务的精度损失。

SageAttention 通过简单的代码替换，就能在保持模型性能的同时，实现显著的加速效果。例如，在开源视频生成模型 CogvideoX 上，使用 SageAttention 能实现 35% 的端到端加速，同时生成的视频质量无损。这项研究为提升大模型的运算效率提供了一种有效的解决方案。(新智讯)

谷歌 &MIT 何恺明团队：视觉大模型像 LLM 一样高效扩展

谷歌和 MIT 的何恺明团队近期发布了一项重要研究成果，展示了如何使视觉自回归模型像语言模型（LLM）一样高效扩展。这项研究突破了传统视觉生成模型的两大瓶颈：离散 token 和光栅顺序。

团队训练了一个名为 Fluid 的模型，该模型基于连续 token 和随机顺序生成。当扩展到 100 亿参数时，Fluid 在 MS-COCO 30K 数据集上的 zero-shot FID 分数达到了 6.16，在 GenEval 基准测试中获得了 0.69 的整体得分。另外，随着参数量和训练轮数的增加，模型在验证损失、FID、GenEval Score 等指标上表现出良好的可扩展性，类似于语言模型的 Scaling 现象。(新智讯)

智谱与高通合作，GLM-4V 多模态技术落地骁龙端侧

10 月 22 日，高通在骁龙峰会上宣布与智谱合作，将 GLM-4V 多模态视觉大模型深度适配于骁龙8至尊版移动平台，推动多模态生成式 AI 在终端侧的部署和推广。此次合作旨在赋能更加情境化、个性化的终端侧智能体验。

高通表示与智谱共同致力于推动生成式 AI 在边缘终端上的应用和普及，并已经在手机、PC、汽车等领域展开了紧密合作。通过与骁龙 8 至尊版的深度适配，ChatGLM 支持三种终端侧交互方式：实时语音对话、照片上传对话和视频上传对话。智能助手可在家庭、出行、工作和教育等多个场景提供丰富的应用，例如获取穿搭建议、实现智能导航、识别遗留物品和解析画作风格等。（硬AI）

国科微投资 AI 硬件企业 ThingX 物启科技，加速 AI 商业部署

日前，国科微宣布旗下全资子公司完成对 AI 硬件企业 ThingX 物启科技的投资，共计 1200 万港币（约合 1097 万人民币），加速公司在 AI 赛道的商业部署。ThingX 物启科技由来自香港中文大学 AIoT 实验室的教授及博士一手创办，专注于智能健康 AI 硬件的研发。

国科微注入 ThingX 物启科技的资金将用于提升后者在多模态传感器大模型及端侧大模型部署的研发能力，推进现有产品的市场化，并加速 ThingX 即将发布的消费端新品的量产。（每日经济新闻）

国际资讯

因在 Cybercab 发布会中使用 AI“致敬”《银翼杀手》，马斯克遭制作公司起诉

10 月 22 日，《银翼杀手 2049 》的幕后公司 —— 洛杉矶 Alcon Entertainment（下文简称 Alcon）对特斯拉、马斯克及华纳兄弟探索公司提起诉讼，后者被指控使用 AI 图像生成器为“We, Robot”活动制作了宣传图片，并模仿了 2017 年科幻电影《银翼杀手 2049》中的镜头。

根据 Alcon 的说法，Alcon 拥有《银翼杀手 2049》的版权，而特斯拉和华纳兄弟探索公司在发布会举行数小时之前，才临时向 Alcon 申请使用该影片的影像。Alcon 的法律和许可部门知晓此事后，便立即向相关方发出了明确的拒绝，特斯拉却不顾拒绝，仍然将《银翼杀手 2049》中的镜头输入 AI 图像生成器，制作出“轻度风格化的虚拟剧照”，并在“We, Robot”发布会上进行了显著展示。

Alcon 的诉状中如是说：“任何严谨的品牌在考虑与特斯拉合作时，都应慎重考虑马斯克那被过度放大、带有强烈政治色彩、变化无常，甚至偶尔涉及仇恨的言行。”据悉，Alcon 的诉状没有详细说明索赔金额。（IT之家）

库克：苹果 AI 不求最先但求最好

苹果 CEO 蒂姆·库克在接受媒体采访时表示，尽管业界普遍认为苹果在 AI 领域落后于竞争对手，但他强调，苹果更注重为用户带来最佳的体验，而不是争夺市场的先行者地位。库克坦言：“我们在 AI 方面并非第一个，但我们以最适应客户的方式来做。”他指出，苹果并不介意在某些领域不是先行者，因为公司更重视产品的完善度。

对于苹果的人工智能技术 Apple Intelligence，库克分享了自己的使用体验，他表示，现在大量依赖 AI 提供的电子邮件收件箱摘要，这显著改变了他的日常工作效率。库克相信，随着 Apple Intelligence 在未来几个月内逐步推出，它将为用户提供深远的影响。（快科技）

美国限制投资中国 AI 法案即将出台，或成为总统大选的拉选票工具

根据美国政府最新发布的信息，美国即将出台限制某些针对中国人工智能投资的新规，该规则要求美国投资者在涉及人工智能及其他敏感技术的某些投资中，须向财政部进行申报。公告指出，这些规则将重点限制美国对中国人工智能、半导体、微电子和量子计算领域的对外投资。目前，规则已提交管理和预算办公室审查，通常情况下，这意味着相关政策可能在一周内公布。

前财政部官员、现任华盛顿阿金·甘普律师事务所的律师劳拉·布莱克表示财政部通常会在此类新规生效前提供至少 30 天的准备期。她预测最终规则将进一步明确人工智能技术的具体管控范围及有限合伙人的投资门槛。

初步草案中，针对某些特定用途的人工智能交易被禁止，尤其是涉及使用大规模计算能力进行训练的系统。对于不被直接禁止的 AI 系统或半导体开发交易，规则要求进行通知。拟议的例外条款包括公开交易的证券（如指数基金或共同基金）、某些有限合伙投资和特定的联合债务融资等。（Z Finance）

Meta 重启面部识别技术，打击“假名人”诈骗

10 月 22 日，在因隐私和监管压力于三年前关闭 Facebook 的面部识别功能后，Meta 目前宣布正在重新测试该服务，以打击“名人诱饵”诈骗。

Meta 计划在全球范围内招募约 5 万名公众人物参与此次试验。该服务将自动比对这些公众人物的 Facebook 头像与疑似诈骗广告中的图像。若图像匹配，并且 Meta 判断该广告存在诈骗嫌疑，系统将自动阻止这些广告的发布。参与此次试验的公众人物将收到相关通知，并有权选择退出。Meta 内容政策副总裁 Monika Bickert 表示：“我们的目标是尽可能为这些公众人物提供保护。虽然他们可以选择不参与，但我们希望提供一种简便的保护方式，使他们能够免受此类诈骗的侵害。”

此次试验计划将于 2024 年 12 月正式启动，但部分国家和地区，包括英国、欧盟、韩国以及美国的得克萨斯州和伊利诺伊州，由于监管审批问题，将不纳入此次试验范围。（IT之家）

人工智能芯片初创公司 Kneron 寻求 10 亿美元估值融资

据知情人士透露，人工智能芯片初创公司 Kneron Inc. 正在洽谈其最新一轮融资 3 亿美元，这可能使这家台美公司的估值达到约 10 亿美元。一位投资者介绍，Kneron 希望利用这笔资金进行产品创新和扩张，包括在沙特阿拉伯开设地区办事处。Kneron 此前曾获得高通创投、红杉资本中国（现名为红杉资本）、iPhone 制造商鸿海精密工业股份有限公司和香港亿万富翁李嘉诚旗下的 Horizons Ventures 的资金支持。

Kneron 成立于 2015 年，创始人为前高通工程师 Albert Liu，总部位于圣地亚哥和台北。该公司生产的 AI 处理器可用于驱动监控摄像头和汽车等消费品，无需连接互联网或使用云端系统。Kneron 的芯片由台湾半导体制造公司生产，用于鸿海精密的电动汽车以及韩国公司韩华视觉的监控摄像头。该公司的芯片已成为训练 OpenAI 的 ChatGPT 等高级工具的抢手硬件，但越来越多的初创公司瞄准了在所谓的边缘设备上运行经过训练的人工智能模型的市场，包括智能手机、个人电脑、相机、汽车、无人机和机器人。（鞭牛士）

微软携手英伟达“撒钱”，海量 AI 资源助推医疗、健康领域突破

10 月 21 日，有报道称微软和英伟达两大巨头联手，放出海量资源扶持健康和生命科学领域的人工智能（AI）初创企业。

微软方宣布启动“ Microsoft for Startups ”计划，为符合条件的初创企业提供最高 15 万美元的 Azure 信用额度，持续四年。这些企业可以接入多种 AI 大型语言模型，包括 Azure OpenAI Service、Meta 的 Llama 和 Phi。除此之外，初创企业还将获得价值最高 20 万美元的 Microsoft 365、Visual Studio 和 GitHub 等生产力服务的使用权限。他们还将享有免费的技术支持和优先接入 Pegasus 计划（使用微软的销售团队）的机会。

英伟达则推出“ Inception ”计划，为 AI 健康领域的创企业提供 10000 个 ai.nvidia.com 推理积分，以便通过 NVIDIA 管理的无服务器 API 运行 GPU 优化的 AI 模型。该计划还包括对 NVIDIA AI Enterprise 的优惠定价，涵盖 NVIDIA Clara 医疗和生命科学计算平台的完整套件。初创企业将有机会提前访问新的 NVIDIA 医疗产品，并通过 Inception VC Alliance 与投资者连接。

两家公司均表示，未来可能会扩展这一支持计划，涵盖其他商业和技术领域的公司，进一步促进 AI 技术的广泛应用。（IT之家）

微软推出 10 款 AI 代理，与 Salesforce 竞争加剧

10 月 21 日，微软公司宣布推出一系列新 AI 工具，旨在提升企业内部团队的工作效率。这些自主代理工具作为 Dynamics 365 的扩展，能够自我学习并应用公司现有数据来执行多样化任务，如 IT 支持、新员工入职辅导、销售辅助及供应链管理自动化等。用户可通过 Copilot Studio 个性化定制这些 AI 应用，预计下月进入公开测试阶段，标志着生成式 AI Copilot 的进一步升级。

微软强调，这些自主代理依靠生成式 AI 的推理能力，结合现有数据库和软件资源，能够自主完成固定任务，无需人工干预。此举与 ServiceNow、Workday、HubSpot 及 SAP 等公司的 AI 代理开发趋势相呼应，显示了 AI 在企业自动化领域的广泛应用前景。

市场竞争方面，微软面临着来自谷歌和 Salesforce 等公司的激烈挑战。Salesforce 近期推出的 Einstein Copilot 及其 Agentforce 工具已引起关注，而微软则需通过持续创新和优化其 AI 服务来保持竞争力。随着财报季的到来，科技公司 AI 支出和盈利增长的表现将受到投资者密切关注。（乐居财经）

英伟达将 Blackwell Ultra 产品更名为 B300 系列，预计 2025 年将推动 CoWoS-L 增长

10 月 22 日，外媒发文称英伟达近期将其所有 Blackwell Ultra 产品更名为 B300 系列，预估明年将策略性主推 B300 和 GB300 等采用 CoWoS-L 的 GPU 产品，这将提升对先进封装技术的需求量。

CoWoS（Chip On Wafer On Substrate）是一种 2.5D 的整合生产技术，由 CoW 和 WoS 组合而来。CoW 就是将芯片堆叠在晶圆上 (Chip on Wafer)，而 WoS 就是基板上的晶圆 (Wafer on Substrate)，整合成 CoWoS。CoWoS-L 是 CoWoS 其中一种类型，使用小芯片（Chiplet）和 RDL 作为中介层。

此外，英伟达股价于 10 月 21 日继续飙升，创下新的历史高点。该股收涨 4.14%，至 143.71 美元，总市值一举突破 3.525 万亿美元（当前约 25.11 万亿元人民币）大关，英伟达股价今年迄今已上涨 190.2%。（IT之家）

IBM 推出 Granite 3.0：最佳企业 AI 模型，为智能体 AI 夯实基础

10 月 21 日，IBM 发布全新的 Granite 3.0 系列 AI 模型，在学术和行业基准测试中可以持平或超越同等规模的模型。IBM 表示，Granite 3.0 的 8B 和 2B 模型是企业 AI 的最佳选择，具备更强的稳健性和可靠性，能够处理更广泛的任务。这些模型在检索增强生成（RAG）、分类、总结、实体提取和工具使用等任务中表现优异。

新模型现已在 HuggingFace 平台上以 Apache 2.0 许可证提供下载；Granite Guardian 3.0 的 8B 和 2B 模型也可通过 IBM 的 watsonx 平台进行商业使用。（品玩快讯）

霍尼韦尔与谷歌云合作，将生成式 AI Gemini 引入工业领域

10 月 21 日，霍尼韦尔（Honeywell）宣布与谷歌云（Google Cloud）进行合作，将生成式人工智能 Gemini 引入工业领域。霍尼韦尔是一家多元化高科技和制造企业，其业务涉及：航空产品和服务、楼宇、家庭和工业控制技术、汽车产品、涡轮增压器以及特殊材料等。霍尼韦尔首席执行官表示，人工智能可以帮助该公司解决劳动力短缺问题。谷歌表示，霍尼韦尔正在探索如何使用 Gemini Nano 在网络边缘（the edge of the network，直接在扫描仪、传感器和控制器等设备上）提供 AI 服务，以便它们即使在未连接到互联网时也可以自主运行。

Gemini 的多模态功能支持理解文本、代码、图像、视频和音频，使霍尼韦尔设备能够处理各种数据类型，涵盖从扫描到基于语音的引导式工作流程。据悉，使用谷歌云 AI 构建的首批解决方案将于 2025 年提供给霍尼韦尔的客户。（IT之家）

Midjourney 将上线新图像编辑器：让“二创”AI 图片变得更简单

10 月 21 日，Midjourney 首席执行官 David Holz 在 Discord 平台宣布，将于下周将推出全新的 AI 图像编辑器工具。用户上传图像后可展开包括放大、缩小、调整角度等多种操作，这些操作不再需要 Discord，只需简单命令即可完成；用户可以使用数字画笔进行修补，进行更精细的修改。

此外，该 AI 图像编辑器还可以基于上传图像的深度信息生成新图片，保留原始构图和内容不变的情况下，彻底改变纹理、颜色和细节。Midjourney 希望做个突破者，通过元数据进行识别。Holz 表示，为了确保新功能的安全使用，公司将限制其部署范围，并增加人类审核机制。（IT之家）

马斯克的 xAI 正式发布 API，开发者可将 Grok 集成到其他应用

10 月 21 日，人工智能公司 xAI 正式发布了其应用程序编程接口（API），允许开发者将 Grok 集成到其他应用程序中。此前，马斯克曾在 8 月份确认将为 Grok 提供 API 的计划，并在 3 月份开源了该软件的权重。

要查看和使用 API，用户必须登录他们的 xAI 账户，并在个人资料设置中选择“Request Access”来申请访问 PromptIDE 和 API。目前，API 只有一个模型，名为“grok-beta”，其价格为每百万输入 token 为 5 美元，每百万输出 token 为 15 美元。API 还允许用户执行函数调用，以便 Grok 可以与数据库、搜索引擎和其他外部软件工具集成。（IT之家）

德企宣布成立“欧洲数据中心”助力 AI 模型训练

10 月 21 日，德国企业在峰会上宣布成立“欧洲数据中心”，为人工智能（AI）模型训练提供数据支持。该数字化平台由德国施瓦茨数字公司和德国铁路公司宣布成立，吸引了来自工业、科技、媒体等领域的众多合作伙伴参与。据平台媒体介绍，来自工业和媒体的海量数据将被汇集和整理到这一平台上，以供算法处理。

该平台旨在为本地企业提供在安全平台上训练 AI 模型所需的数据，并让欧洲摆脱对海外数据提供商的依赖。据介绍，德国云服务提供商Stack IT、人工智能初创企业阿勒夫-阿尔法公司、德国人工智能研究中心和达姆施塔特工业大学已成为该平台合作伙伴。后两家机构在全球 AI 领域享有较高声誉，在复杂数据处理技术方面处于领先地位。

德国联邦数字化和交通部长福尔克·维辛表示，“欧洲数据中心”可为 AI 模型训练提供高质量数据，填补“欧盟的一个关键空白”，希望这一合作能够结出硕果，并吸引更多合作伙伴。（新华社）

Rhymes AI 开源视频生成模型 Allegro：文本秒变高清视频

近日，人工智能公司 Rhymes AI 正式开源其先进的文本生成视频模型 Allegro。Allegro 允许用户将简单的文字描述转换为高质量的短视频片段，为人工智能生成视频领域的创作者、开发者和研究人员开辟了新的可能性。

Allegro 可以根据用户提供的文字提示生成 6 秒、15 帧/秒、分辨率为 720p 的高质量视频，涵盖了各种电影主题，从人物和动物的特写到各种场景的动作，几乎可以实现任何基于文本描述的场景。其核心技术包括大规模视频数据处理、将原始视频压缩为视觉 token 以及扩展视频扩散Transformer。

Rhymes AI 表示，Allegro 只是开始，团队正在积极开发更先进的功能，包括图像到视频的生成、运动控制以及对更长、基于叙事的、故事板风格视频生成的支持。（AIbase基地）

韩即时通信巨头 Kakao 推出生成式 AI 助理 Kanana

韩国即时通信巨头 Kakao 发布了其最新的生成式 AI 助理“Kanana”，其侧重点在于为用户提供便捷易用的 AI 服务。据 Kakao 公司 CEO 郑新雅（音译）介绍，Kanana 不仅仅是传统 AI 助手，它的定位是“AI 伴侣”，能够在对话中记住关键信息，并根据上下文为用户提供回应。其具备理解群组对话的能力，并能提供相应的智能回应。

据悉，Kanana 分为两个部分：作为群聊 AI 助手的 Kana 和作为个人 AI 伴侣的 Nana。Nana 能记住用户的个人对话和群组对话内容，如帮助用户记住在群组讨论中的会议日程或提醒准备事项、总结群聊的要点，支持文字 / 语音互动，同时也可理解各种格式的文档，并生成摘要。Kana 主要负责记住群聊内容，帮助用户解决实际问题，如可以在学习群里发布测验，并提供评分、解答，或者在情侣之间的对话中建议约会计划。

此外，Kanana 还将提供车载模式，用户可以在驾驶时通过语音操作与 AI 互动。据悉，Kakao 计划将 Kanana 作为独立应用推出，年内开启内测以完善功能。（IT之家）

今日热门视频

文章内容来自于网络，由百合树AI整理，如有侵权，联系删除。如需开始AI写作请返回主页。

23日AI资讯：AI公司波形智能解散，主创团队集体入职OPPO；微软亚研院前首席研究经理谭旭加入月之暗面；商汤CEO内部信曝光丨AI情报局

相关推荐

发表回复 取消回复

发表回复取消回复