思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.宠物行业用户画像分析宠物行业的用户画像分析是一个复杂而细致的过程,它涉及到对宠物主人的年龄、性别、收入水平、生活方式、消费习惯等多方面的数据收集和分析。根据上述提供的参考信息,我们可以得出以下关于宠物行业用户画像的详细分析: 性别与年龄分布:宠物主人以女性为主,占比达到80%。同时,19-30岁的青年人是宠物市场的主要消费者。这...https://www.sgpjbg.com/task/2725741.html
2.2024年宠物电商行业现状与发展前景宠物电商市场近年来在全球范围内蓬勃发展,尤其是中国,随着养宠人群的增加和消费升级,宠物电商市场规模迅速扩大。宠物电商不仅提供了宠物食品、用品、医疗保健等商品的在线购买,还拓展了宠物美容、培训、寄养等服务,满足了宠物主人的多元化需求。此外,宠物电商通过数据分析、用户画像等技术,实现了精准营销,提升了用户粘性和...https://www.cir.cn/0/52/ChongWuDianShangHangYeXianZhuang.html
3.2023巨量引擎宠物行业白皮书巨量算数2023板块现状:猫狗食品及用品引领发展,多赛道蓄势待发 06 竞争态势:食品竞争愈发激烈,用品持续分散化 15 03 抖音宠物行业增长指南 3C策略框架:人群 · 货品 · 内容三向协力,抖音阵地经营提效 30 品牌最佳实践:立足抖音阵地,达成品效销三收 Consumer-人群策略:聚焦三类主体用户,精准传递核心价值 ...http://www.360doc.com/document/23/0826/13/1837523_1093945236.shtml
1.宠物食品市场变革:头部集中度提升与国产替代强势进行宠物食品行业作为宠物消费市场中的重要组成部分,近年来随着人们生活水平的提高和宠物文化的普及,呈现出快速增长的态势。根据欧睿数据,2008-2023年,中国宠物食品市场规模从不足百亿元增长至509.78亿元,占宠物消费总市场规模的56.84%。宠物食品市场不仅包括主食、零食,还涵盖了保健品等多个细分领域,市场潜力巨大。然而,随着...https://www.vzkoo.com/read/2024111386b6fd16f066fee17a8d67b6.html
2.未来五年宠物食品规模或达1500亿元,年轻女性是消费主力!一月花费上千、智能陪护出现、寄养也现“共享”……宠物经济火热的背后是喂养理念的悄然改变,年轻人正成为新增养宠人群的主力军,宠物们也纷纷迎来吃喝玩乐的“消费新升级”。未来五年宠物食品规模或达1500亿元,年轻女性是消费主力! 中国是全球最具吸引力的宠物食品市场之一,并将持续增长。高端及天然粮越来越受到消费者...https://www.gonerve.com/?p=11234
3.宠物饲料:2023年,中国宠物饲料行业市场规模达到约1562亿元,把握...宠物饲料广泛应用于宠物犬、猫等常见宠物的日常饲养中,同时,随着宠物种类的多样化,如鸟类、鱼类、小型哺乳动物等,宠物饲料的应用领域也在逐步拓展。在细分市场方面,干粮、湿粮、零食和功能性食品等不同类型的饲料,满足了宠物主人对宠物营养、口感和健康的多样化需求。此外,针对不同年龄、体型和健康状况的宠物,饲料市场也...https://www.qyresearch.com.cn/news/18430/pet-food
4.“铲屎官”撑起千亿规模!96页数据PPT,解读宠物经济消费市场发展状况1-14 2020中国养宠人群用户画像分析 第二章2020H1中国宠物经济产业链重要环节分析 2-1 2020中国宠物经济产业图谱全景分析 2-2 2020年中国宠物交易市场概况分析(一) 2-3 2020年中国宠物交易市场概况分析(二) 2-4 2020年中国宠物食品市场概况分析(一) https://www.iimedia.cn/c800/75708.html
5.宠物经济发展趋势研究报告ppt课件(带内容)20230111.ppt01产品端更加注重安全健康属性把握原肉鲜造、新鲜天然、健康营养等趋势宠物用品可以用颜值提升产品吸引力,进而促进宠物主贩买决策宠物救健品应推出针对不同阶段的与业化产品,以满足宠物全生命周期管理的健康需求宠物食品03用户画像注重数字化手段的运用,加快数字化转型,深度挖掘各环节的数据,进而优化内部管理、提高企业...https://m.renrendoc.com/paper/236826992.html
6.宠物类app用户画像分析案例资讯随着人们生活水平的提高和生活方式的改变,越来越多的人开始养宠物。宠物成为许多人生活中不可或缺的一部分,为了更好地管理和照顾宠物,宠物类app应运而生。而了解用户画像对于开发宠物类app以及提供个性化服务至关重要。本文将以一个宠物类app用户画像分析案例为例,探讨不同类型用户的特点和需求。 https://www.appzzgs.cn/newsinfo.php?id=736
7.宠物食品行业市场分析②宠物零食占比增幅明显: 宠物零食在细分行业市场消费规模占比,增幅明显,由12%增值到20.4%,增长规模达8.4%。 3.3 结论 行业处于高速发展阶段,宠物食品市场规模也持续扩大,其中国产宠物食品品牌的市场份额正在逐年上升。 四、微观个体分析 4.1 用户画像 (1)人口属性: ...https://www.jianshu.com/p/4138f95d52d5
8.宠物食品行业私域电商平台的发展与未来宠物食品跨境私域首先,如何保证宠物食品的质量和安全是首要问题。毕竟,宠物的健康直接关系到消费者的信任度。因此,企业需要在供应链管理、产品检测等方面下足功夫,确保每一款宠物食品都符合国家标准和消费者的期望。 其次,私域电商平台的运营需要具备一定的技术和人才支持。例如,数据分析、用户画像、社区运营等都是私域电商平台的核心能力...https://blog.csdn.net/steven_zhangxue/article/details/136801628
9.PetSmart,价值百亿美金的宠物零售巨头的启示宠物医院:公司部分控股的宠物医院 Banfield 在850多家PetSmart商店内提供全套的宠物医疗服务。 宠物领养慈善会:为爱宠人士免费领取宠物。 宠物美容美发、洗浴护理等服务。 PetSmart网站 03.用户画像 第一梯队用户(核心用户):平均年龄46岁的女性,她们的平均收入比全美平均水平高出30%,宠物支出高出78%。这些消费者每年...https://m.36kr.com/p/1722996637697
10.2020年中国宠物产业白皮书表18-1 中国宠物产业二级市场情况,2020年 图20-1 中国养宠人群用户画像,2020年 图21-1 中国宠物行业消费洞察(1/3),2020年 图22-1 中国宠物产业消费者洞察(2/3),2020年 图23-1 中国宠物行业消费洞察(3/3),2020年 图25-1 宠物食品分类(按功能分类) ...https://www.leadleo.com/report/details?id=5fd7101a15c236374848af52