纽约的一家 B 轮初创公司兼 AI 研究实验室 Hume AI 正在通过其 Empathic Voice Interface (EVI) 与 Anthropic 的 Claude AI 模型相结合,开发具备情感智能的语音交互。这一合作旨在提升人机沟通能力,让 AI 系统能够理解并响应人类语音中的情感细微差别。
EVI 2 的关键功能与优势
Hume AI 的 EVI 2 是一款全新的语音对语音 AI 模型架构,具备快速流畅的对话能力,使其在现有的顶级 AI 聊天机器人中脱颖而出。其特点包括:
-
语音识别与情感生成
-
能够理解用户的语音语气,并生成任何所需语气,包括模仿多种个性、口音和说话风格。
-
通过分析语音的语调、节奏和音色,确定合适的回应时机,并生成具有同理心的语言与语调。
-
灵活的应用场景
-
可替代或整合大型语言模型(LLMs),为需要情感智能语音交互的应用程序提供更多开发选项。
-
已在 200 多万分钟的语音 AI 对话中投入使用,显示了其扩展性和影响力。
Anthropic 的支持与技术优化
-
Anthropic 的高级提示缓存技术(Prompt Caching)帮助将成本降低 80%,延迟减少 10%。
-
Claude 3.5 Sonnet 模型的集成进一步提升了 EVI 的性能,该模型具备先进的推理能力,可以执行复杂的认知任务,如:
-
分析多种静态图像。
-
实时多语言翻译。
-
协助调试和代码编写。
人机互动的新标准
通过结合 Hume 的情感智能技术与 Anthropic 的高级 AI 模型,双方的合作标志着构建更自然、更具同理心的人机对话系统迈出了重要一步。这一合作的目标是设立人机交互的新标准,让技术更加响应并贴合人类的情感需求。
Hume AI 创始人指出,EVI 2 的开发是为了推动数字创意的可能性边界,同时满足利用 AI 技术的各行业需求。
行业影响与未来展望
-
提升用户体验
-
EVI 可实时处理语音输入并生成更人性化的回应,适用于多样化的应用场景,包括教育、医疗和客户服务。
-
技术生态开放
-
Hume 的情感大语言模型(eLLM)使开发者可以轻松扩展其功能,满足行业对语音交互技术日益增长的需求。
关注公众号【真智AI】
TOP AI模型智能问答|绘图|识图|文件分析
每天分享AI教程、赚钱技巧和前沿资讯!