思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.宠物行业市场分析20112015年中国宠物行业市场分析与...博思数据研究中心发布的《2011-2015年中国宠物行业市场分析与行业调查报告》共十三章。首先介绍了宠物行业相关概述、中国宠物产业运行环境等,接着分析了中国宠物行业的现状,然后介绍了中国宠物行业竞争格局。随后,报告对中国宠物行业做了重点企业经营状况分析,最后分析了中国宠物产业发展前景与投资预测。您若想对宠物产业有...https://www.bosidata.com/qitaxiuxian1101/9338271T9E.html
2.宠物近五年来的国家鼓励政策行行查行行查为用户提供海量行业研究数据和报告:宠物近五年来的国家鼓励政策 ,包含 政策法规大消费,宠物 等相关数据,本数据编号为 1289586,搜索行业数据和行业报告就来行行查(www.hanghangcha.com)。https://www.hanghangcha.com/hhcQuestion/detail/1289586.html
3.探索智能养宠新时代——吉雅其PetGPT正式发布,开启智慧宠物生活基于数据资源与数据库管理,吉雅其PetGPT可以提供丰富的宠物行业数据与趋势分析,帮助把握市场动态和客户需求,为客户提供更准确、更个性化的服务。 宠物智能诊疗 宠物健康指导 “它来啦”及APP,作为吉雅其宠物生态产品的重要一环,汇集AI智能助手服务、宠物社交属性、宠物百科、宠物陪伴、专家问诊及处方开具、爱宠好物等诸多...https://www.jufair.com/information/92581.html
4.2019中国宠物行业白皮书(可编辑).doc中国宠物行业年度必读大数据2019 年中国宠物行业白皮书消费报告 ta nww 亚洲愛场履应会Editors NoteEditors NoteEditors NoteEditors Note最后,我们希望中国宠物行业白皮书成为中国宠物行业的https://www.renrendoc.com/paper/245894599.html
5....吗/拆解逆势增长的宠物消费行业数据精华金融频道本文内容精选自财新高端订阅产品“财新数据通”。内容涉及的金融数据库和专享财经资讯完整版本,可通过文内和文末链接订阅“财新数据通”后畅享。 【特别推荐】 10万亿元化债资源是“火箭炮”吗?财政部在10月中旬曾公布一揽子增量政策,市场重点聚焦加力支持地方化债。部长蓝佛安当时表示,每年会在新增专项债限额中专门...https://finance.caixin.com/2024-11-08/102254964.html
6.2024亚太杯亚太赛APMCMC题数学建模竞赛宠物行业及相关产业...第一个问题是:请基于附件 1 中的数据以及你的团队收集的额外数据,分析过去五年中国宠物行业按宠物类型的发展情况。并分析中国宠物行业发展的因素,预测未来三年中国宠物行业的发展。 第一个问题:分析中国宠物行业按宠物类型的发展情况及未来预测 1. 过去五年中国宠物行业发展情况分析 根据附件1中提供的数据,过去五年中国...http://www.mynw.cn/ai/20122.html
1.宠物美容应用程序市场调研报告,全球行业规模展望2024从全球视角下看宠物美容应用程序行业的整体发展现状及趋势。重点调研全球范围内宠物美容应用程序主要厂商及份额、主要市场(地区)及份额、产品主要分类及份额、以及主要下游应用及份额等。 本文包含的核心数据如下: 全球市场宠物美容应用程序总体收入,2019-2024,2025-2030(百万美元) 全球市场宠物美容应用程序前五大厂商市场...https://www.marketmonitorglobal.com.cn/reports/725022/pet-grooming-apps
2.2025中国宠物行业的发展时间较短,只有十几年的时间,但随着中国经济的快速增长,宠物行业发展迅速。 近年来,人们对于宠物陪伴的精神需求日渐凸显。2024年我国宠物(犬猫)消费市场规模仅有337亿,根据《2024年中国宠物行业白皮书》的数据显示,2024年我国城镇宠物(犬猫)消费市场规模达到2490亿元,比2024年增长20.58%,增速已恢复至疫...https://www.chinairr.org/report/R08/R0802/202411/29-628142.html
3.2025年中国宠物行业白皮书正式发布:24年市场规模超3000亿数据鲁宠协消息:2024年11月28日,由全国伴侣动物(宠物)标准化技术委员会、中国畜牧业协会宠物产业分会、中国兽医协会指导,派读宠物行业大数据平台出品的《2025年中国宠物行业白皮书(消费报告)》在现场正式发布。 据官方介绍,本次消费报告以更全面、更多维度的数据,与从业者们一同回顾2024年中国宠物消费市场变化,探索宠物行...https://www.petdhw.com/show-46108.html
4.2024年中国宠物行业研究报告(附下载)DIGITOWN展示了宠物行业的上中下游企业/品牌,包括宠物繁育、交易、食品、用品、医疗、服务等环节。 市场规模: 预计2024年中国宠物市场规模将突破3400亿元,其中宠物食品市场规模最大。 这份报告为宠物行业提供了全面的市场分析和未来发展趋势的预测,对行业参与者和投资者具有重要的参考价值。https://www.shangyexinzhi.com/article/23508000.html
5.《宠物行业白皮书》:宠物消费规模首破3000亿元,动能正在转换就整体而言,郝波认为,宠物消费市场规模超过3000亿元,宠物数量超过1亿只的数据变化,作为行业者应该居安思危,在当前行业驱动力转化的同时,及时的调整自己的思路,去寻找新的更有增长潜力的策略,改变过去粗放式增长,简单挣快钱的想法和做法,做好准备提升生产力的质量,去拥抱更大的机会。https://www.lanfucaijing.com/read/119686
6.数据库设计宠物商店管理系统宠物行业数据库4.3 数据库关系图 4.4 索引 4.5 存储过程 4.6 函数 5 测试与运行实例 结论 参考文献 附录 TSQL语句 1 问题的提出 随着中国经济的增长,宠物行业得到了迅猛的发展,人们饲养宠物已经由单纯的赏玩而转变成人们精神的一种寄托,宠物的角色也悄然发生着变化,已经日益成为人们生活的伴侣...https://blog.csdn.net/m0_57532432/article/details/139627965
7.巨量算数:2023巨量引擎宠物行业白皮书(44页).pdf在线下载中美宠物行业市场规模单位:亿元;%中美日每户家庭宠物平均消费力单位:元/户2022年847美国中国467418-22 CAGR15%美国中国8%23-27 CAGR10%美国中国4 9、%数据来源:欧睿国际PASSPORT数据库,2018-2027E数据来源:欧睿国际PASSPORT数据库、国家统计局,2018-2027Ehttps://www.sgpjbg.com/bgdown/124583.html
8.我们向ChatGPT提了100个保险问题,留给保险人的时间不多了?第二个问题在于,ChatGPT背后没有数据库,缺少结构化的体系。它的知识来自于输入的大量文本等资料,对一些概念会混淆,也就无法给出我们期望的答案,这个缺点在惠民保、医保等问题上都体现了出来。 ChatGPT毕竟不是垂直于保险行业的机器人,还没有对它进行非常精细化的保险专业训练,所以在回答更复杂的保险问题时明显很“...https://insurance.hexun.com/2022-12-09/207463306.html
9.智能宠物用品行业全球市场入口壁垒及应对方法每周策略随着科技的发展和宠物经济的兴起,智能宠物用品行业在全球范围内呈现出快速增长的趋势。 据市场研究机构报告显示,2022年全球智能宠物产品市场规模为33.698亿美元,预计到2028年调整后规模将达到107.3亿美元,回顾期内复合年增长率为21.3%。 全球核心智能宠物产品厂商包括Radio Systems Corporation(Petsafe)、Petkit等,排名前二...https://www.10100.com/article/59701
10.木兰职业形堂答案汇总木兰职业形堂今日答案最新1月23日:过年家家贴窗花,猜猜以剪纸为职业的行业艺人出现在哪个朝代?宋代 1月22日:过年除旧迎新,想要收拾家中杂物,可以咨询以下哪种专业人士?整理收纳师 1月21日:“打树花”是传统过年民俗,需要表演者?胆大心细有力气 1月20日:节假日期间的热门职业“伴宠师”是做什么的?帮助照看宠物 ...https://app.ali213.net/mip/gl/888001.html
11.产品研究68款宠物APP产品分析:宠物行业的巨浪淘沙(网经社讯)作者将宠物相关的APP产品进行分类,并选其类型的代表进行分析,让我们了解了宠物行业在不同领域中的发展及业务情况。 在继上一篇68款宠物APP分析(上)文章后这次推出完整版,该文章内容有21478字,篇幅过长请小伙伴们安排好时间。 需要重申该文章并不是一份详细的竞品分析,其目的是了解宠物行业,以及宠物相应...https://maimai.cn/article/detail?fid=1368921073&efid=jmMz1_nUCqB92B3wjI5FXg
12.智能宠物用品行业全球市场入口壁垒及应对方法我们再来看一下智能宠物用品,详细的按照产品类目大概会有哪些产品? 在我们前面介绍这些细分类目的市场细分及规模时,可能内容会比较枯燥,但是也希望各位读者能耐心看完,因为这些数据对于进入市场的决策至关重要。 1.核心产品一:智能可穿戴设备 宠物智能可穿戴设备是指可以安装在宠物身上,用于监测宠物健康、行为、位置等信...https://www.qizansea.com/37956.html
13.数据宠物食品行业品牌数据报告01行业大盘 淘宝2024年3月 02品牌销售排行榜 淘宝2024年3月 数据解读 本次将2024年3月与2023年3月数据进行对比,得出上升幅度较大的5个品牌: 1.hipidog/嬉皮狗 - 2024年3月排名14,交易增长幅度为87.84%,而2023年3月排名未在前50名内,因此可以认为其排名增速非常高。 https://cloud.tencent.com/developer/news/1348187