NotebookLM的实际体验更适合科研学习场景
而这次最新更新是增加了多模态输入功能。用户在以上输入功能的基础上,现在可以上传MP3音频文件,或者直接输入YouTube在线视频的网址。
在输出方面,NotebookLM的主要亮点是可以把输入文档直接输出成两人对话聊天的音频文件,目前仅支持英语音频。此外,NotebookLM还提供了常见的AI内容总结模板,例如摘要、学习指南、简报、知识问答等,同时继续支持用户自行提问。
因此,从我实际使用体验来看,NotebookLM更适合的是科研学习场景。例如学生可以上传上课录音快速总结知识点、研究者可以把论文转成听书文件对外宣传、老师可以根据在线教学视频生成知识点和考题等。
NoteBookLM的多模态新功能其实并非首创
NoteBookLM这次更新的多模态新功能其实并非首次出现。在谷歌实验室的其它产品中已经出现过YouTube在线视频总结功能,而不久前的GoogleIlluminate产品也发布过将PDF学术文档转成两人对话音频文件的功能。
特别是在NoteBookLM此次更新多模态功能后不久,新加坡政府科技局(GovTech)的GabrielChua很快在HuggingFace上推出了开源版OpenNoteBookLM,使用了开源模型Llama3.1-405B和文本转语音框架MeloTTS,实现了将PDF转成对话音频文件的核心功能,而且在生成音频的语言风格和时长方面提供了更多选项,且能够支持中、英、法、日、韩、意等多种语言。
THE END