通义App推出“局部风格化”功能,让地标建筑换新装
通义App近日上线了“局部风格化”新功能,用户可以通过上传照片,对图中特定对象进行风格化处理。令人惊艳的是,北京天坛、上海武康大楼、杭州六和塔等地标建筑仿佛在一夜之间“穿上”了彩色毛衣。用户可在通义App的频道页点击万相AI生图,体验到针织、毛绒、冰雕、陶瓷等七种风格模板的魅力。
Kimi数学版正式上线,具备博士级智力
科技自媒体沃垠AI报道,Kimi全量上线了其k0-math数学模型,推出了“Kimi数学版”。该版本采用Self-play RL强化学习和Cot思维链技术,擅长解决数学和推理问题,智力程度可与博士相媲美。Kimi数学版能够理解模糊表达,进行推理与运算,实测在多个问题上表现出色,MATH测试得分高达93.8,超过了o1-mini和o1-preview。
书生InternThinker开放体验,展现强大的推理能力
上海人工智能实验室正式开放了强推理模型书生InternThinker的试用体验。该模型具备自主生成高智力密度数据和元动作思考能力,能够在数学、代码、推理谜题等复杂任务上展现出色的推理能力,并能自我反思和纠正。实验室通过通专融合路径,提升了模型的深度推理与专业泛化能力。
Anthropic推出Claude,AI写代码的新时代
Anthropic公司推出的AI模型Claude现在可以作为服务器,直接连接GitHub,实现代码编写、仓库创建和代码推送等功能。Claude背后的MCP(Model Context Protocol)通信协议旨在标准化AI与外部数据源和工具的集成,提高回答质量和相关性。Anthropic计划将MCP发展为行业开放标准,进一步推动AI Agent与互联网生态的融合。
吴恩达开源aisuite,统一调用多种AI模型
AI专家吴恩达近日开源了名为aisuite的Python包,支持开发者通过统一接口调用OpenAI、Anthropic、Google等多个AI提供商的大型语言模型。用户只需更改一个字符串即可轻松切换和测试不同模型。当前,该包支持聊天补全功能,未来将扩展到更多应用场景。
英伟达推出Fugatto,音乐制作的“瑞士军刀”
英伟达推出了AI音频生成模型Fugatto,被誉为AI音频领域的“瑞士军刀”。该工具能够根据文字描述或音频输入生成音乐片段和音效,调整人声口音和情感,甚至创造全新声音效果。Fugatto为音乐艺术家提供了歌曲主唱分离、乐器添加、旋律改编等功能,极大丰富了音乐创作的可能性。
邬贺铨院士:AI正向“智能体”发展,具身智能不等于AG
中国工程院院士邬贺铨指出,AI技术正在从模型层面向“智能体”发展,但具身智能并不等同于AG(人工通用智能)。他认为,上云是大模型落地的重要环节,但并非唯一的环节。若终端具备自我生成文本、图像和视频的能力,将推动手机等设备的更新迭代。
关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!