思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.头条文章一句话介绍:高效的可编程专用传感AIC(模拟信息转换)芯片项目简介:维纳芯致力于驱动数字空间对物理世界进行更多维的信息传感,赋能可穿戴、医疗、汽车、机器人、数字农业、智慧工厂等数字化场景。产品基于首创的架构和高性能模|数混合电路能力,将算法的灵活性与 Robust融合入模拟芯片,产出更高效且灵活的专用物理信息转换器...https://m.weibo.cn/ttarticle/p/show?id=2309404841203345523019
2.微波集成电路芯片通用标准本专题涉及微波集成电路芯片通用的标准有74条。 国际标准分类中,微波集成电路芯片通用涉及到集成电路、微电子学、半导体分立器件、航天系统和操作装置、分析化学。 在中国标准分类中,微波集成电路芯片通用涉及到微电路综合、混合集成电路、、半导体集成电路、电子技术专用材料、膜集成电路、电子制造业工程、航天器综合、基础...https://www.antpedia.com/standard/sp/1034244.html
3.第十章RID标准.ppt第十章 RID标准.ppt,第十章 物联网RFID标准 Internet之所以能够在全球范围内实现软硬件以及信息资源共享,是因为实现了各种网络设备的软硬件及数据交换标准的统一。随着物联网的迅猛全球化和国际射频识别日趋激烈的竞争,物联网RFID标准体系已经成为各个企业和国家参与国际https://max.book118.com/html/2019/0211/7126154000002006.shtm
4.国民经济行业分类与代码(GB/T47542017)标准6121 经济型连锁酒店 指以客房为唯一或核心产品,以连锁为经营模式,统一装修风格,统一服务标准,面向大众、价格经济、满足消费者在外出住宿时对安全、卫生、便捷等方面基本要求的并具有国际接待水准的有限服务型住宿企业 6129 其他一般旅馆 613 6130 民宿服务 指城乡居民及社会机构利用闲置房屋开展的住宿活动和短期出租...http://www.abler.cn/Policies/html/80352.html
5.2023年5月7日事业单位联考B类《职业能力倾向测验》试题“鱼、肉、菜七十二陌”,这一标准的使用范围相当于菜市场,属于“行陌”之一,这一行业的交易有如下特点:频繁发生,但数量通常不会很大;买主基本上是普通市民,手中货币存量有限;交易活动为民生所必需。 “珍珠、雇婢妮,买宠物、雇佣奴婢以及花鸟虫鱼等宠物交易、这类交易通常不会发生在普通市民之间,不是基本生活所...http://www.chinagwy.org/html/stzx/qt/202306/98_591412.html
6.关于Nation(国民技术):公司简介产品系列代理商热门型号2015年 TPM2.0国际标准配合国家成功推动由国民技术参与制定的,支持商用密码算法体系的TPM2.0标准正式成为ISO/IEC标准2013年 深圳密码芯片攻防重点实验室我国首个企业独立安全芯片攻防技术实验室,2013年经深圳科创委认定为深圳市企业重点实验室2013年 深圳市商密行业协会在深圳市密码局指导下,发起成立全国首家商用密码行业...https://www.icspec.com/news/article-details/2367138
7.3+3重点产业标准信息公共服务平台中国标准分类 : A80 标志、包装、运输、贮存综合 国际标准分类 : 55.020 货物的包装盒调运综合 适用范围 : 本标准规定了包装储运图示标志的名称、图形符号、尺寸、颜色及应用方法。本标准适用于各种货物的运输包装。 引用了下列标准 采用了下列标准 ISO 780-1997 包装 货物搬运的图形标志 代替了...http://www.ntbiaozhun.com/zdcybzxx/standard_toStandardDeatil.do?id=1BBEECE9A90943E8873D0168AEDA62FC
1.橙色云资讯●首个自动驾驶公交车标准发布,百度牵头 ●京台高速部分路段为智能网联车测试道路 ●广州首条L4级无人驾驶公交线路上线运营 ●极氪L4级自动驾驶车计划于2024年发布 ●北京现代拟于2024年在华投放L4级车型 ●集度汽车机器人搭载英伟达芯片明年上市 ●零束科技与高通合作银河全栈3.0智能座舱 ...https://news.orangecds.com/zixun/119252_16337.html
2.“搭积木”,能否给中国芯片蹚出新路?在先进芯片工艺制程上,我们在短期内难以缩短与国际芯片巨头的差距、且领先者困于“摩尔定律”放缓也难以进一步拉大差距的僵持之下,更需要借助封装技术上的创新,一点点缩短我们与领先者之间的距离。 也许,弯道超车谈不上,但好歹能够打破僵局,中国企业借助拥有自主创新、自主标准的先进封装技术,在成熟制程工艺下实现接近先...https://www.iyiou.com/analysis/202301171040861
3.嵌入式系统为了提高嵌入式系统中的软件5.嵌入式软件开发要想走向标准化,就必须使用多任务的操作系统。嵌入式系统的应用程序可以没有操作系统直接在芯片上运行;但是为了合理地调度多任务、利用系统资源、系统函数以及和专家库函数接口,用户必须自行选配RTOS(Real-Time Operating System)开发平台,这样才能保证程序执行的实时性、可靠性,并减少开发时间,保障软件质...https://blog.csdn.net/SQSXTJF/article/details/7720272
4.标准产业结构(精选十篇)起草小组首先从航模器材产业联盟标准研制目的及可行性入手,确定了联盟标准制修订的方向。国际上有关航模器材的专业标准为零,国内既没有相关的行业标准和国家标准,也没有省市级的地方标准,在产业标准空白的情况下,单一的企业标准涉及面太窄,薄弱的力量难以承担标准推广的重担,而如果直接跳到地方标准或行业标准层面,又显...https://www.360wenmi.com/f/cnkeyk73e13s.html
5.材料学院承办国际芯片大会日程安排大会主题:构建自主可控和开放的芯片产业 (1)研讨在中国建立自主可控和开放的芯片产业的战略和政策; (2)研讨芯片前沿技术和软硬件系统生态; (3)研讨开源芯片及软硬件生态; (4)研讨数据中心热点技术; (5)联合发布芯片及智能芯片评测标准; (6)BenchCouncil智能芯片和开源芯片大赛颁奖; ...https://cmo.ucas.ac.cn/index.php/zh-cn/sy/xyxw/1168-2019-12-8
6.前瞻医疗器械产业全球周报第20期:腾讯京东新增医疗器械业务...园区将凸显应急医疗器械产业特色,立足产业基础,聚焦优势品牌,坚持高标准规划引领,高起点谋划发展,加快培育形成一批带动能力强、技术水平高、拥有自主知识产权和品牌优势、具有国际影响力的大型企业集团,逐步形成以个人防护用品为基础,医药制剂、医疗器械等领域为重点的优势特色产业集群。https://ecoapp.qianzhan.com/detials/200410-d9b5ab99.html
7.沙蚕毒素草酸盐标准品新闻仪器信息网沙蚕毒素草酸盐标准品专题为您提供2024年最新沙蚕毒素草酸盐标准品价格报价、厂家品牌的相关信息, 包括沙蚕毒素草酸盐标准品参数、型号等,不管是国产,还是进口品牌的沙蚕毒素草酸盐标准品您都可以在这里找到。 除此之外,仪器信息网还免费为您整合沙蚕毒素草酸盐标准品相关的耗材配件、试剂标物,还有沙蚕毒素草酸...https://www.instrument.com.cn/zhuti/c-332349/news.html
8.实时PCR检测科研检测机构丨中析研究所「分析检测中心」发布日期:2015-02-09 国际标准分类号:67.050 实施日期:2015-09-01 技术归口:国家认证认可监督管理委员会 代替标准: 主管部门:国家质量监督检验检疫总局 标准分类:食品技术出入境检验检疫食品试验和分析的一般方法 内容简介: 行业标准《实时PCR检测食源性病原微生物的通用要求》由国家认证认可监督管理委员会归口上报,主管...https://www.yjsba.com/jcxm/qita/14610.html
9.自动驾驶标准与认证:标准化体系助力高阶自动驾驶落地和汽车出海...但在中国自动驾驶标准体系中,仍有部分项目尚未形成我国的自动驾驶标准,包括人机交互中的驾驶交互;电磁兼容;评价体系和工具中的评价及审查能力、管理及开发流程、测试设备及工具、测试场景;产品与技术应用中资源管理与应用的车用软件、车用芯片等。随着我国芯片产业及电磁行业的发展,预计到2025年前相关标准将会发布。 https://www.dongchedi.com/article/7287083632894673423
10.2023中国最全的行业分类标准大全1522 瓶(罐)装饮用水制造 指以地下矿泉水和符合生活饮用水卫生标准的水为水源加工制成的,密封于塑料瓶(罐)、玻璃瓶或其他容器中,不含任何添加剂,可直接饮用的水的生产活动 1523 果菜汁及果菜汁饮料制造 指以新鲜或冷藏水果和蔬菜为原料,经加工制得的果菜汁液制品生产活动,以及在果汁或浓缩果汁、蔬菜汁中加入...https://www.winsgx.com/archives/1232
11.工信部:联合集成电路半导体器件等关联行业研究发布汽车芯片标准...7.汽车芯片领域。开展汽车企业芯片需求及汽车芯片产业技术能力调研,联合集成电路、半导体器件等关联行业研究发布汽车芯片标准体系。推进MCU控制芯片、感知芯片、通信芯片、存储芯片、安全芯片、计算芯片和新能源汽车专用芯片等标准研究和立项。启动汽车芯片功能安全、信息安全、环境可靠性、电磁兼容性等通用规范标准预研。 https://m.cls.cn/detail/962404