思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.宠物行业APP市场现状调查与分析经管文库(原现金...docx 203.39 KB0个论坛币 GDP和人均GDP平减说明.xls 27 KB0个论坛币 关键词:调查与分析App ...https://bbs.pinggu.org/thread-12678018-1-1.html
2.头条文章7月12日,据媒体报道,在手机QQ App端打开“QQ小店”小程序会跳出一则通知:由于业务调整,自2023年7月15日起,QQ小店小程序将停止运营,群带货机器人功能将下线,QQ小店注册及小店带货和自购等相关服务将关闭,7月15日前带货产生的相关收益仍会如期进行结算下发。 https://card.weibo.com/article/m/show/id/2309404924792695292040
3.分享一篇关于陌生人社交的竞品分析报告(上)Soul一直以来给人感觉是小众的社交软件,以灵魂社交为卖点,现在再去看soul,会发现里面增加了内容社区,内容社区中有许多新潮的内容,同时,群聊业务人群也渐渐增多,群聊界面还有狼人杀业务正在内测,宠物社交在探索,soul正从社交转为内容社区+社交+游戏的路上的越走越远,可以看出,soul为了提高留存率正在不断的探索,迭代...https://www.niaogebiji.com/article-135709-1.html
1.宠物交易平台(需求文档)课题的研究目的在于为宠物买卖行业提供一个更加规范、便捷和可信赖的交易平台。随着社会经济的发展和人们对宠物的需求增加,传统的宠物交易方式已经无法满足市场需求。因此,建立一个在线平台能够整合宠物供应和需求,提供信息发布、交流、交易等一系列功能,将有助于解决现有宠物交易存在的问题。 https://blog.csdn.net/2401_86117023/article/details/143957952
2.展望A股下半年:从进攻到防御,从成长到价值招商张夏认为,A股下半年将会演绎全球需求改善的基本面驱动阶段向转折期过渡,流动性中性环境面临外部负面影响。市场整体以震荡为主,结构性机会较多。行业选择:从最锋利的矛到最坚硬的盾。风格选择:成长到防御,从中小到大盘。 A股当前正处在内需尚可,外需持续改善的基本面驱动阶段,在流动性中性环境下A股更多是以结构性...https://wallstreetcn.com/articles/3633649
3.互联网加大赛创业计划书(通用14篇)学生自由交易平台;二手书出售;超市在线购物;承包培训机构招生;承包旅游机构组团;商家网上开店;常用型产品出售;广告业务。 4、资金筹集方式 公司运营资金由负责人(周保成、郭慧)筹集也允许公司其他成员的股份的方式中小企业融资。 二、行业特点描述 1、发展背景 ...https://www.fwsir.com/fanwen/html/fanwen_20220607081300_1828822.html
4....盈余单位直接与资金需求单位直接协议的融资活动。(【单选题】资金供应者和资金需求者双方借助于信用工具进行交易而融通资金的市场是( )。 A. 金融市场 B. 货币市场 C. 交易市场 D. 买卖市场 查看完整题目与答案 【单选题】直接融资市场中资金需求者通过发行( )等直接融资工具,向社会资金盈余方筹集资金。 A. 股票、债券、票据 B. 股票、大额可...https://www.shuashuati.com/ti/8cfe5f9ed4be4cb6ba963ba2727a0132.html?fm=bdbds6590d81ac70fc067d6af2e23bed94a97
5.宠物app软件有哪些?58心宠、波奇宠物、宠物驿站、宠物市场、宠物白领、E宠商城、宠物之家等等。 宠物app软件有哪些 百氪解答 宠物app软件涉及领域有:宠物繁殖、宠物交易、宠物物品电商、宠物医疗、宠物保健、宠物寄养、宠物旅游、宠物美容、宠物殡葬等等。目前,宠物app不会仅围绕一点,而是围绕宠物的看、买、养、美、医、葬全链条提供服...https://m.36kr.com/p/1358108201387143
6.深市上市公司公告(5月20日)作者:IPO再融资组/钟文 5月17日,维尔利发布收购公告称,拟以2.33亿元现金收购北京宝旺投资有限公司(下称“北京宝旺”或标的公司)100%股权。标的公司主要资产是中国再生资源开发有限公司(下称“中再生公司”或目标公司)9.6774%的股权。此次交易,标的公司的评估增值率高达2959.97 %,接近30倍。 https://stock.10jqka.com.cn/20220520/c639246863.shtml
7.河狸家天鹅到家再融资,复盘11个O2O到家业态赛道的生与死老师来了(已关闭):2014 年 7 月在杭州成立,2015 年 3 月获得 200 万美元 A 轮投资,通过 C2C 交易模式连接用户与教育机构老师,由平台提供学费担保服务。 神州佳教(已转型):2013 年 6 月在北京成立,用户可基于位置、需求搜索老师和家教机构,运用手机 App 抢单,个人老师以大学生为主,暂未获得融资。目前公司...https://www.thepaper.cn/newsDetail_forward_9323906
8.最惨宠物创业:曾拿下上亿融资,如今却在破产清算创始人钟金俊身边的朋友都是猫奴,每逢春节和小长假期间,他都会帮助暂时外出的朋友喂养猫狗并清理便便等。这些经历让他发现了市场对智能养猫设备的需求,并决定创办有陪宠物来满足这一需求。 二、曾经细分赛道王者 2020年8月,有陪首款产品“猫塔智能猫厕所”发布,定价799元,当时这款产品搭配了手机APP,方便猫主子时刻...http://www.hebxmw.cn/view.asp?nid=42653