转自公众号:猎户星空OrionStar
http://mp.weixin.qq.com/s?__biz=MzU3MjU3MTY3Mw==&mid=2247495668&idx=1&sn=9c6cb2083b2b43488ad025fbc1a4d040
编辑|星奈
媒体|AI大模型工场
11月27日,猎户星空联合聚云科技举办了题为《Data Ready for Al,MoE大模型发布暨商业闭环分享》媒体见面会。会上,猎户星空正式发布了自主研发的Orion-MoE8×7B大模型,并携手聚云科技推出了基于该大模型的数据服务产品——AI数据宝AirDS(AI-Ready Data Service)。AI大模型工场认为,这两项重要成果的发布,不仅标志着猎户星空在AI技术领域的又一重大突破,更为AI行业商业化进程注入新动能。


Orion-MoE 8×7B-Base:
引领多语言大模型新潮流
猎户星空首席科学家韩堃出席会议,首先对Orion-MoE8×7B大模型进行了详细介绍。AI大模型工场知悉,这款大模型是猎户星空自主研发的开源混合架构专家大模型,拥有8×70亿参数,采用了生成式混合专家的设计,涵盖了中文、英语、日语、韩语等多种语言,展现出卓越的性能。
早在2024年年初,猎户星空隆重发布自研“为企业应用而生”的百亿参数大语言基座模型Orion-14B。为什么要在2024年底发布MoE大模型?
猎户星空在探索AI应用场景过程中,一方面以客户视角为出发点,模型既要效果好又要速度快;另一方面从大模型技术发展来看,相比稠密模型的“通才”、一群“专家”的MoE能更高效专业地完成企业复杂任务,而且在不显著增加计算成本的前提下大幅增加模型容量。AI大模型工场表示,这款极具性价比的Orion-MoE 8x7B大模型是“为匹配企业客户需求而生”。
AI大模型工场了解到,在主流的公开基准评测中,Orion-MoE8×7B与同规模参数级别的基座大模型对比,各项评测指标均表现优异,特别是在多语言能力方面展现出强大实力。此外,在推理速度方面也表现抢眼,显著高于同等参数规模的稠密模型。

AI数据宝AirDS:
开启大模型商业化闭环
猎户星空基于研发MoE大模型对数据训练的认知理解和能力积累,携手猎豹移动旗下聚云科技共同推出大模型数据服务产品——AI数据宝AirDS(AI-Ready Data Service),为全球化企业提供更为高效、精准的AI数据服务支持,助力其在AI应用落地过程中实现“最后一公里”的突破。
据AI大模型工场从猎户星空首席科学家韩堃处了解到,近年来,由于计算能力的提升、大规模数据集的可用性以及算法的改进,AI大模型进入爆发增长期,算力、算法、数据,是大模型发展的关键三要素。然而,相比于算法和算力,在大模型商业闭环中,数据明显成为最直接影响其在垂直行业落地效果的关键。
“捅破AI行业窗户纸,百模大战靠数据”,AI数据宝AirDS提供全方位的大模型数据服务,涵盖数据收集、清洗、标注、提示词工程以及评估等环节。AI大模型工场发现,在实际应用中,该业务已服务包括移动通信终端、互联网娱乐、新能源汽车等多个领域的中国领先出海品牌,帮助客户显著提升AI应用的效果与效率,助力全球市场竞争。

猎豹移动整合集团优势,
加速转向 ToB
AI大模型工场观察到,作为中国第一批成功出海的互联网企业,猎豹移动的战略在近年来,逐渐从传统ToC业务转向以AI和大模型为核心的ToB业务,并通过整合旗下不同公司的不同业务,进一步加强在AI服务机器人和AI大模型领域的布局。
比如在获取客户需求上,猎豹移动通过旗下聚云科技,对外赋能、服务中国企业出海,拥有了一大批实践案例,掌握了客户在云端的GenAI应用需求;在AI数据服务能力上,旗下的猎户星空又对通过提升数据质量来改善大模型效果有着充分的实践经验。AI大模型工场总结道:集团下两家公司互补,聚合了大模型的数据收集、清洗、标注、提示词工程和评估等全方位服务,共创了AI数据宝AirDS(AI-Ready Data Service),相对于传统的数据标注公司而言,其拥有了AI数据服务能力上划时代的技术优势,是大模型业内对外开放数据能力的唯一厂商。
AI大模型工场在会上还了解到,除了发布Orion-MoE8×7B大模型和AI数据宝AirDS外,猎户星空还宣布与香港大学计算与数据科学学院签订了合作协议,双方将联合研发用于课程教学场景的AI应用教育工具,并开展“专注具身智能相关的课程项目”,共同推动AI技术在应用领域的普及与应用。
Orion-MoE8×7B线上体验参考链接:
GitHub:
https://github.com/OrionStarAI/Orion-MoE
https://huggingface.co/OrionStarAI/Orion-MoE8x7B
ModelScope:

■ 商汤日日新、腾讯,昆仑万维 ▍ 金融大模型案例
■ 盘古大模型,中国电信,医联 ▍医疗大模型案例
■阅文大模型,腾讯音乐大模型 ▍ 文娱大模型案例
■知乎,360大模型,火山引擎 ▍ 教育大模型案例
■ 网易,金山办公大模型 ▍ 更多行业大模型案例
上次介绍从预训练转向推理,大模型厂商寻找新的Scaling Law
本文由大模型领域垂直媒体「AI大模型工场」
原创出品,未经许可,请勿转载。
/
欢迎提供新的大模型商业化落地思路