思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.宠物行业数据库宠物行业数据库专注于宠物行业的数据分析和研究,包含资讯库,品牌库,产品库,宠物行业公司和渠道库,宠物行业分析报告,宠物行业排行榜等模块。以全维度行业数据为基础,为行业决策者提供全行业宏观数据支持,为销售人员提供线上线下客户和渠道查询,为运营者提供小红书,https://www.petslib.cn/
2.宠物行业市场分析20112015年中国宠物行业市场分析与...博思数据研究中心发布的《2011-2015年中国宠物行业市场分析与行业调查报告》共十三章。首先介绍了宠物行业相关概述、中国宠物产业运行环境等,接着分析了中国宠物行业的现状,然后介绍了中国宠物行业竞争格局。随后,报告对中国宠物行业做了重点企业经营状况分析,最后分析了中国宠物产业发展前景与投资预测。您若想对宠物产业有...https://www.bosidata.com/qitaxiuxian1101/9338271T9E.html
3.折叠式宠物笼中国食品行业专利数据库摘要本实用新型涉及一种折叠式宠物笼,包括二长边框架、四宽边框架、一上盖及一底网,四宽边框架以二宽边框架相接的型态分设于笼体的二宽边,藉由二相接宽边框架间以及长边框架与宽边框架之间设置复数旋接端子,使宽边框架及长边框架可折叠收合呈扁平状,以方便搬运或移动,且利于空间利用,同时可简化其组装程序;...http://patent.foodmate.net/show-173207.html
4.宠物近五年来的国家鼓励政策行行查行行查为用户提供海量行业研究数据和报告:宠物近五年来的国家鼓励政策 ,包含 政策法规大消费,宠物 等相关数据,本数据编号为 1289586,搜索行业数据和行业报告就来行行查(www.hanghangcha.com)。https://www.hanghangcha.com/hhcQuestion/detail/1289586.html
5.2019中国宠物行业白皮书(可编辑).doc中国宠物行业年度必读大数据2019 年中国宠物行业白皮书消费报告 ta nww 亚洲愛场履应会Editors NoteEditors NoteEditors NoteEditors Note最后,我们希望中国宠物行业白皮书成为中国宠物行业的https://www.renrendoc.com/paper/245894599.html
6.2024亚太杯亚太赛APMCMC题数学建模竞赛宠物行业及相关产业...第一个问题是:请基于附件 1 中的数据以及你的团队收集的额外数据,分析过去五年中国宠物行业按宠物类型的发展情况。并分析中国宠物行业发展的因素,预测未来三年中国宠物行业的发展。 第一个问题:分析中国宠物行业按宠物类型的发展情况及未来预测 1. 过去五年中国宠物行业发展情况分析 根据附件1中提供的数据,过去五年中国...http://www.mynw.cn/ai/20122.html
7....吗/拆解逆势增长的宠物消费行业数据精华金融频道本文内容精选自财新高端订阅产品“财新数据通”。内容涉及的金融数据库和专享财经资讯完整版本,可通过文内和文末链接订阅“财新数据通”后畅享。 【特别推荐】 10万亿元化债资源是“火箭炮”吗?财政部在10月中旬曾公布一揽子增量政策,市场重点聚焦加力支持地方化债。部长蓝佛安当时表示,每年会在新增专项债限额中专门...https://finance.caixin.com/2024-11-08/102254964.html
1.源码+文档基于SpringBoot+Vue的宠物咖啡馆管理系统随着信息技术的广泛应用,各行业逐步向数字化、信息化方向发展。传统的宠物咖啡馆管理方式往往依赖纸质记录或人工操作,不仅效率低下,还容易导致数据丢失或错误。因此,设计并实现一个基于Spring Boot的宠物咖啡馆管理平台尤为必要。本系统旨在通过信息化手段优化宠物和客户管理流程,提高管理效率,为顾客和管理员提供便捷的服务...https://blog.csdn.net/2402_84485123/article/details/144021870
2.智能宠物美容创业:自动化宠物护理51CTO博客宠物美容 智能护理 自动化技术 人工智能 创业策略 摘要: 本文深入探讨了智能宠物美容行业的发展现状、核心技术、产品设计与开发、创业策略以及未来趋势。通过详细分析自动化宠物护理系统的构建,本文为智能宠物美容创业提供了全面的技术指导,助力读者了解并把握市场机遇。 https://blog.51cto.com/universsky/12684870
3.宠物服务APP开发全解析:功能设计与用户体验宠物服务APP的开发是一个综合性的过程,旨在通过数字化手段提升宠物主人的养宠体验,并整合宠物行业的各类服务资源。以下是对宠物服务APP开发的全解析,包括功能、设计与用户体验三个方面。 一、功能设计 宠物档案管理: 用户可以在APP中创建宠物的个人档案,记录宠物的品种、年龄、性别、体重、疫苗接种情况、健康状态等基本...https://guangzhou031261.11467.com/news/8991752.asp
4.专业知识库构建数据预处理至模型训练全流程指南在人工智能项目中,构建一个高效的知识库是至关重要的。这不仅包括了数据的收集、清洗和整理,还包括了模型训练和部署过程中的所有步骤。首先,我们需要明确项目目标和需求,这将帮助我们确定所需的技术栈和资源。 数据采集与获取 接下来,根据项目需求,我们需要采集或获取相关数据。这种数据可能来自于数据库、API调用或者...https://www.yoocn.cn/shu-ma/569171.html
5.我们向ChatGPT提了100个保险问题,留给保险人的时间不多了?第二个问题在于,ChatGPT背后没有数据库,缺少结构化的体系。它的知识来自于输入的大量文本等资料,对一些概念会混淆,也就无法给出我们期望的答案,这个缺点在惠民保、医保等问题上都体现了出来。 ChatGPT毕竟不是垂直于保险行业的机器人,还没有对它进行非常精细化的保险专业训练,所以在回答更复杂的保险问题时明显很“...https://insurance.hexun.com/2022-12-09/207463306.html
6.木兰职业形堂答案汇总木兰职业形堂今日答案最新11月12日:非遗小知识青花瓷的蓝色花纹是怎么生成的高温变色反应 11月9日:以下哪类人专门做旅拍测评,避免消费者踩坑?旅拍测评达人 11月8日:你知道吗?飞鱼“飞” 出水面时,通常是?借助风力滑翔 11月7日:以下哪个职业是能源行业的“杂家”,既要懂技术又要懂市场?综合能源服务员 ...https://app.ali213.net/gl/888001.html
7.上海宠萌找货(亚宠展)怎么样(1)云发布--全网发布*媒体矩阵;(2)云学习—行业从业者进修增值平台;(3)云交流--宠物行业社群裂变;(4)云逛展--企业 365*24H 在线展示及获客;(5)云营销-- 共享全球宠物百万级别数据库。更有全年5次宠物行业*具影响力的展会(亚洲宠物展览会、北京宠物用品展览会、成都国际宠物博览会、华南宠物用品展览会、...https://www.jobui.com/company/17262304/
8.宠物航空公司范文12篇(全文)近期宠物行业不少上市公司陆续发布了业绩快报。据统计数据显示,佩蒂股份,中宠股份,瑞鹏股份,悠派科技四家上市公司20营收保持稳健增长,其中瑞鹏的增长幅度最大,高达55.78%。1. 年中宠股份实现营业总收入10.15亿元2017年,中宠股份实现营业总收入10.15亿元,同比增长28.37%;营业利润1.12亿元,同比增长10.16%;利润总额1.10亿元...https://www.99xueshu.com/w/ikey2q2d90hn.html
9.程杨:开放一切资源,助力行业「共生成长」长城宠物展官网平均月独立访客过万,累计行业数据库30多万条,定期发送EDM并与国际合作媒体进行新闻互推。 国际社交媒体 长城展Facebook,Twitter10多万粉丝量,在宠物行业遥遥领先。 PETS International线上创新产品展示区 每周推送15,500份邮件,精准触达10万+国际买家。 https://www.cipscom.com/ShowNews/23529.htm
10.宠物店创新创业项目计划书(通用7篇)建立客户数据库,记录客户购买历史和宠物信息。 定期回访客户,收集反馈意见,不断改进服务质量。 七、财务规划 1、初始投资预算 包括店铺租金、装修费用、设备采购、首批货品采购、人员招聘与培训、营销费用等,预计总投资xx万元。 2、收入预测 预计开业后的前几个月为市场培育期,收入逐步增长。随着品牌知名度的提高和客...https://www.ruiwen.com/chuangyejihuashu/4839518.html
11.产品研究68款宠物APP产品分析:宠物行业的巨浪淘沙随着养猫狗等宠物数量的增加,宠物行业的市场规模也在急剧扩大,2019年中国城镇宠物犬猫消费市场规模达2024亿元,照比去年同比增长18.5%,如图1-2所示;其中宠物犬消费市场规模为1244亿元,同比去年增长17.8%,宠物猫消费市场规模为780亿元,同比去年增长19.6%。 图1?2 全国宠物市场规模及增长率 数据来源:《中国宠物行业白...https://maimai.cn/article/detail?fid=1368921073&efid=jmMz1_nUCqB92B3wjI5FXg
12.statista全球统计数据库Find statistics, consumer survey results and industry studies from over 22,500 sources on over 60,000 topics on the internet's leading statistics databasehttp://www.statista.com/
13....院课程接入宠业家app,上千课程服务数万付费学员培训平台工作人员会实时对接沟通。 目前,宠业家app×宠习院联名会员卡也已上架,您可享受除美容造型类以外的其他直播活动限免权益,同时还包括宠业家指数报告数据库及宠物行业参考资料库的付费报告限免权益。 详细查阅方法 长按下图识别二维码,进入话题页 ?下载或打开宠业家app即可...https://www.petdhw.com/show-43109.html
14.包头市人民政府办公室关于印发包头市宠物产业发展三年行动计划的...近年来,我国宠物行业高速发展,围绕宠物已经形成从出生到死亡的完整产业链,覆盖宠物繁殖饲养、宠物食品、宠物用品、宠物医疗、宠物美容、宠物保险、宠物驯养以及宠物善终等。随着人们生活水平的提高,宠物市场迸发出巨大潜力。综合历年《中国宠物行业白皮书》的有关数据,2017年我国宠物市场规模为1340亿元,到2021年围绕宠物行业...https://www.kdl.gov.cn/detail/cid/1884/aid/110368
15.智能宠物用品行业全球市场入口壁垒及应对方法每周策略随着科技的发展和宠物经济的兴起,智能宠物用品行业在全球范围内呈现出快速增长的趋势。 据市场研究机构报告显示,2022年全球智能宠物产品市场规模为33.698亿美元,预计到2028年调整后规模将达到107.3亿美元,回顾期内复合年增长率为21.3%。 全球核心智能宠物产品厂商包括Radio Systems Corporation(Petsafe)、Petkit等,排名前二...https://www.10100.com/article/59701