-
架构师必修之项目篇:基于ASR+GPT4.0+TTS实现全双工智能语音助手
收录于话题 #Agent开发 转自公众号:搜易开源http://mp.weixin.qq.com/s?__biz=MzI0NzU3NzI2OA==&mid=2247483922&idx=1&sn=348767362ac0198ec44dd6e252aab7eb 系统架构设计 1.1 ASR模块设计 ASR(Automatic Speech Recognition)模块是全双…
-
原来各种换皮小游戏都是零代码做的啊?
原来各种换皮小游戏都是零代码做的啊? 无意间发现了一个宝藏项目——GDevelop。 这个名字是不是一看就有点正经?别被吓到!其实它是一个非常人性化的开源游戏开发工具,主打“人人都能做游戏”。而且,不需要写代码,完全靠拖拖拽拽+事件编辑器,你就能做出一个像模像样的游戏! 这个工具厉害在哪儿? 首先,GDevelop支持2D、3D甚至多人游戏!是的,3D都给你安排上了。用它可以做小清新风、赛博朋克风…
-
武汉大学提出多模态大语言模型DriveMLLM: 用于自动驾驶中多模态大语言模型空间理解的基准
点击下方卡片,关注“Ai fighting”公众号 作者| xiandan guo 编辑| Aifighting 本文只做学术分享,如有侵权,联系删文 Abstract 自动驾驶需要对三维环境的全面理解,以促进运动预测、规划和建图等高级任务的实现。在本文中,我们提出了DriveMLLM,一个专门设计用于评估多模态大语言模型(MLLMs)在自动驾驶中空间理解能力的基准…