Meta发布了一个“开放”的实现,复刻了谷歌NotebookLM中流行的生成播客功能。
这个项目名为NotebookLlama,使用的是Meta自家的Llama模型进行大部分处理,这并不令人惊讶。与NotebookLM类似,它可以生成上传文本文件的互动式播客风格摘要。
NotebookLlama首先从文件中创建一个转录本——例如,一篇新闻文章或博客帖子的PDF文件。然后,它会添加“更多戏剧化”和插入点,然后将转录文本输入开放的文本转语音模型。 然而,结果的音质远不如NotebookLM。在我听过的NotebookLlama样本中,声音明显带有机械感,且在某些时刻彼此交谈的情况很奇怪。
但负责该项目的Meta研究人员表示,随着更强大的模型的出现,音质可以得到改善。
“文本转语音模型是决定其听起来自然程度的限制因素,”他们在NotebookLlama的GitHub页面上写道。“[此外,]另一种编写播客的方法是让两个角色辩论感兴趣的话题并撰写播客大纲。目前我们使用的是单一模型来编写播客大纲。”
NotebookLlama并不是首次尝试复制NotebookLM的播客功能。一些项目的成功程度各不相同。但没有一个——甚至NotebookLM本身——能够解决困扰所有AI的幻觉问题。也就是说,AI生成的播客必然会包含一些虚构的内容。