思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步财专访股票频道

(原标题:思必驰联合创始人兼首席科学家俞凯:ChatGPT是继AlphaGo之后最大的里程碑进步|财专访)

本期访谈人物:

思必驰联合创始人兼首席科学家俞凯

“GPT是人工智能发展的一个集中式突破,包括对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。”

▍个人介绍

思必驰联合创始人兼首席科学家、上海交通大学教授。

清华大学本科、硕士,剑桥大学博士。

入选国家级重大人才工程,上海市“东方学者”特聘教授。

IEEESpeechandLanguageProcessingTechnicalCommittee委员(2017-2019),中国计算机学会语音对话及听觉专委会副主任,中国人工智能产业发展联盟学术和知识产权组组长。世界顶尖科学家论坛(WorldLaureatesForum)青年科学家委员会委员,全国信标委用户界面分委会委员。

发表200余篇国际论文,获得多个国际研究挑战赛冠军,担任InterSpeech、ICMI等国际会议程序委员会主席和ACL、NAACL、EMNLP等国际会议对话交互领域主席。

曾获中国人工智能学会吴文俊人工智能科学进步奖、中国计算机学会青竹奖、2016年《科学中国人》年度人物。

▍第一标签

引领人工智能领域发展的长期主义者

▍公司简介

Q:在类ChatGPT的对话机器人研发方面,公司目前有何进展?

俞凯:在技术的迭代发展上,ChatGPT本质就是一个统计类的深度学习对话通用大模型。

思必驰应该算是国内最早一批去进行统计类对话模型的产业化研究的公司之一,并且在任务型对话上也取得了很多很好的研究成绩和应用成绩。思必驰已有的语音和语义的通用基础模型,已经达到亿级参数。

在通用基础模型技术方面,目前思必驰使用千块GPU卡量级的超算资源,正在整合扩展资源,在已有算法研究和数据积累的基础上,将亿级参数模型扩展到百亿以上量级。

Q:在类ChatGPT的对话机器人研发方面,公司未来有何计划?

俞凯:现在的ChatGPT还是以文本机器人的形式来出现,我相信这只是一个开始,未来一定会往语音对话机器人去进阶,会逐渐强化对语音和文本的深度融合。在听觉感知技术方面,思必驰能够实现高精度的语音转文字和高质量的声音播报效果;能够解决在人机交互过程中面临的远距离、复杂声场的多噪音干扰、多说话人判断;满足用户对方言、外语的识别及合成的需求。

在聊天机器人方向,融合语音、文本、图像信号的多模态交互技术也有很大机会。以当前新起的虚拟数字人为例,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。在多模态及交互技术方向,思必驰公司在业界率先发布了全双工对话架构,形成了独特的闭环人机对话系统构建的底层综合技术优势,与国际主流先进技术相比,取得声纹验证、语音分离等指标的显著提升。

Q:您怎么看此次ChatGPT火出圈?可能存在哪些原因?

俞凯:ChatGPT可以算是继AlphaGo之后最大的一个里程碑进步。AlphaGo解决的是确定规则情况下的搜索和处理,而GPT在无确定语法规则前提下,部分解决了自然语言交互的问题。我们并不能把GPT简单理解为某一个特定单点技术的突破,而是人工智能发展的一个集中式突破,包括其中的对话智能技术、深度学习大模型技术、工程化能力以及大数据的整体突破。

ChatGPT爆火还有个原因,即产业应用的需求对技术的召唤得到了回应。各种智能硬件发展到现在,功能上逐渐愈发同质化,体验上也很难做出自己的特色。ChatGPT的创作能力则满足了产业应用级的需求,打开了新的空间。

Q:据路透社记者统计,AI、生成式AI、机器学习等词出现在美国科技巨头最新季财报会议中的频率是上一季度的2-6倍。巨头纷纷发力生成式AI,您认为有哪些原因

其次,生成式AI有“创作性”的天然属性:即没有绝对的正确错误之分,甚至有些仁者见仁、智者见智的意味。决策性AI的结果一旦错误,很容易被诟病;而内容创作的多样性结果,则会被欣然接受。比如,现在的ChatGPT,在对一些事实性内容的结果是不太准确的,但大家仍然能够宽容接受,因为它的对话是流畅的、回复是有效的。

Q:您预判未来随着生成式AI能力的提升,将在哪些行业快速渗透

俞凯:短期来看,关于需要基于一定背景知识的创作型产业,以及一切刚需AIGC的场景、重视SOP(标准作业程序)的行业,能够快速突破。比如智能写作、文档管理、代码生成、流程管理、甚至游戏NPC等。

俞凯:中美的差距,其实是在工程化能力、基础架构设置方面,另外还有人员经验的问题、长期信念决心的问题。

ChatGPT的核心是大模型技术和对话智能技术,大模型是指通用基础模型,当参数足够大的时候,比如当有千亿级以上的大模型的时候,不再需要额外的采取数据对各个领域进一步训练。大模型的算法是通用的,而数据量在超过千亿级之后,对比也就不再那么明显。

底层基础的算法是公开的,并且国内外一流的研究机构都有非常不错的研究成果,在算法的迭代创新方面并不存在明显差距。当数据量足够大,微不足道的数据差距影响也没那么明显。

Q:您预判,中国何时能有产品对标ChatGPT

新技术出现的本质,是为了投入应用,而不是停留在技术指标层面的对比。我很期待中国的创业公司能够基于用户需求、产品情况,去探索出更多的类GPT应用,不管是在AI辅助、智慧办公、智能客服,还是在更大层面的产业应用上。

Q:近期围绕着ChatGPT成本、法律与伦理问题有诸多讨论,您认为生成式AI面临哪些主要挑战

俞凯:大模型的训练的确是很昂贵,所以从成本来说,目前只有巨头能负担起高昂的投入,但当大规模应用起来,从长远看,大模型技术反而能够降低机器学习的成本、提高应用效率。

伴随人工智能技术发展的,便一直是“AI有所为、有所不为”的讨论。技术本身是中性的,关键是运用技术的人,应该向善、不作恶。

人工智能,说到底还是人的智能。ChatGPT可以基于上下文理解的基础上,根据对话聊天来不断完善自我学习和进化,但是这种学习进化的机制,本质上也是由人类设计的。当然,为了保证AI的良序发展,我们的确需要去嵌入一些相应的限制手段和规则约束。

Q:近期Google对外指出了AI技术发展迅速而大公司行动缓慢的原因:需要将AI融入现有的产品与服务中,符合公司的业务战略才能展开,并不能如OpenAI这样只需要研发一款最佳模型就可以。对此您怎么看

俞凯:基础AI技术创新,必须最终走入产业,结合场景应用才会变得有价值。

作为新基建一环的AI技术,不能单靠底层原始创新来推动发展,其落地应用需要结合行业认知和客户需求输出整体性、结果导向性的实用解决方案。当然,OpenAI这样的基础模型工具也具有巨大价值。基础研究和应用研究本身就属于不同范畴,商业公司更多的还是要为市场负责,要计算投产比,更倾向于投入应用型研究;但基础性研究却可以更纯粹地去看更底层的算法工具和更前瞻性的技术未来。

近几年,行业也在加强产学研一体化合作,技术型企业和高校之间展开紧密合作,以推动基础研究和应用研究的融合,例如讯飞和中科大,思必驰和上交大。毕竟人工智能发展是一个长期主义,为了将来更稳定、更强的突破,必须重视基础创新和原始创新能力,短期内看研发投入会很高,但长远看却能降低成本、提高整体效率,也有利于建立中国人自己的“AI矿场”,更好地赋能传统百业。

THE END
1.年交易额"三连跳"!跨境电商叫响青岛品牌半岛网青岛新锦桥电子商务有限公司打造了中国第一个基于互联网的进口棉纱电子商务交易平台,公司总经理董云亮手中拿的是将要提供给国内客户的进口优质棉纱。 叫响青岛品牌 假发、花生……十大品牌小镇年出口额过亿美元 作为“品牌之都”,品牌战略始终体现在青岛经济的各个领域,跨境电商也不例外。胶州李哥庄是远近闻名的“假发...http://news.bandao.cn/news_html/201711/20171124/news_20171124_2783703.shtml
2.上游戏服务网3YX交易平台买游戏币卖游戏币代练点卡充值国内...国内安全的网络游戏交易服务平台,提供网络游戏装备交易、游戏帐号交易、游戏币交易、游戏金币交易、点卡、游戏点券交易、游戏元宝交易、各类激活码交易、游戏材料交易、游戏宠物交易、游戏道具交易以及专业的代练服务,并独创了游戏币收货、游戏币换卡业务模式。http://www.3yx.com/
1.“它经济”全链条开花,小宠物撬动大市场澎湃财讯澎湃新闻11月11日,史上最长“双11”进入尾声,各电商平台宠物品牌销售成为亮点。据天猫平台数据,“双11”仅开卖4小时,658个品牌成交同比翻倍,659个品牌订单量同比翻倍。 艾媒咨询数据显示,2023年中国宠物经济产业规模达5928亿元,同比增长20.1%;到2028年,宠物经济市场规模有望达到11500亿元。随着越来越多“毛孩子”进入家庭,一批...https://www.thepaper.cn/newsDetail_forward_29317345
2.网络状况调查报告(精选6篇)主要表现形式有:利用网络交易平台提供商品交易服务(如BtoB、BtoC等),创办行业性网站或企业自主网站推介产品、交换信息、提供咨询、开展交易,以及通过其他独立网站宣传本企业和发布产品等。 本报告所指的网络经济市场主体,是指经工商行政管理部门登记注册并领取营业执照,通过网络从事商品交易及有关服务行为的法人、其他经济...https://www.360wenmi.com/f/filee6sn403l.html
3.深市上市公司公告(11月15日)龙大美食(002726)发布公告,公司拟使用自有资金以集中竞价交易方式回购公司部分已发行的人民币普通股(A股)股份,回购资金总额不低于人民币3亿元(含本数),且不超过人民币5亿元(含本数),回购价格不超过14.41元/股(含本数)。 多氟多非公开发行A股股票申请获中国证监会审核通过 ...https://stock.10jqka.com.cn/20221115/c642929962.shtml
4.长沙市政府门户网站3、统计调查方法采取对一定规模以上企业全面调查、对其他企业抽样调查。一定规模以上企业是指:电子商务应用企业的电子商务销售额200万元以上,第三方电子商务平台企业的平台交易总额500万元或平台运营收入100万元以上,电子商务支撑服务企业的服务收入100万元以上。 http://www.changsha.gov.cn/zfxxgk/zfwjk/gdwxtwj/201601/t20160108_872604.html
5.市值蒸发2000亿,关店2000家?七匹狼董事长发信“sayNO!”云集Q1...一站式国际智慧物流在线服务平台“运去哪”宣布完成1亿美元D1轮融资,融资完成后,运去哪成为国际物流数字化领域内首个完成D轮融资,并且估值达到独角兽级别的中国企业。据了解,运去哪目前拥有近千名员工,预计今年有70万TEU集装箱运货量,营收增长点来自于运输服务类型和运输网络覆盖的增加,已经服务超过2万家客户,包括...https://maimai.cn/article/detail?fid=1629788533&efid=dBapT-oE3NLsDOXr1u0KzA
6.“双十一”临近市工商发布十大网络违法典型案例(图片来源于网络) 青岛新闻网11月5日讯(记者 朱颖) 为维护2018年“双十一”网络集中促销活动期间公平有序的网络市场交易秩序,营造安全放心的网络消费环境,震慑违法分子,确保“双十一”网络集中促销活动的顺利开展,今天下午,青岛市工商局公布了“十大网络违法典型案例”。 https://news.qingdaonews.com/qingdao/2018-11/05/content_20237504.htm
7.近期营销新闻集合聚辉新力8月24日,网易发布2023年第二季度财报。得益于网易严选毛利率提升,网易创新业务Q2毛利率达29.5%,同环比双增长。网易严选淘系渠道销售额同比增长超30%,严选Pro会员规模环比增长70%。其中,严选宠物、家清、办公家具等多个核心品类在618期间,斩获主要电商平台销售冠军。 https://www.juhxl.com/archives/2541
8.www.jxmzxx.com{$woaini}>www.jxmzxx.com{$woaini}跨境电商如同一股强劲的东风,吹遍了中国的每一个角落。在这股浪潮中,临沂以其在物流、仓储、货物品类,正逐步成为跨境电商领域的璀璨新星。 抢抓新机遇跑出“加速度” 1-7月,跨境电商交易额165.7亿元 一排排电脑屏幕上,订单信息不断滚动;一件件商品在仓库被快速打包、装箱;一辆辆货车满载着商品驶向世界各地……...http://www.jxmzxx.com/appnews_20241102/54868732.html
9.元宇宙周刊丨苏富比推出精选NFT平台;美国陆军对VR平台进行测试...【NFT市场OpenSea交易总额达90亿美元 创历史新高】 据DappRader最新数据显示,NFT市场OpenSea交易总额已突破90亿美元(交易者数量为549615),创下历史新高,位列NFT市场交易额排名第一位。值得一提的是,OpenSea在10月7日交易总额达到80亿美元,这意味着该平台最近十天的交易额达到10亿美元。 https://blog.51cto.com/u_15820926/5902419
10.2018年4月自考电子商务案例分析考试真题自考(2)请结合SNS网站的体系建构,分析花瓣网如何打造用户低成本的视觉社交网络平台。(11分) _ueditor_page_break_tag_ 三、综合分析题:本题35分。 24、2010年4月,九城集团倾力推出国内首家专业提供新鲜食品的网上超市一沱沱工社,凭借雄厚的资金实力,九城集团在北京、上海等地投建上千亩有机农场, 整合新鲜食品生产、...https://www.educity.cn/zikao/19713.html
11.中国网络零售市场交易规模达10.32万亿元,增长20.56%界面新闻...网络零售市场交易规模增长日趋平缓,较上一年有小幅增长,增速上涨1.18个百分点。电商平台拼多多、京东、阿里等向低线城市的扩张及国际化步伐的迈进,促进交易规模的增长。 交易额方面,阿里、京东、拼多多位居前列。另外短视频平台快手、抖音在电商方面也有较快发展,其中快手电商2019年交易额约为350亿元。 https://www.jiemian.com/article/4542119_foxit.html
12.数说零售十大数据带你读懂2015年零售行业概述:2015年,天猫双十一最后成交交易额逾912亿元,加上京东、国美等诸多电商平台的交易额,双十一全行业全网的交易额突破千亿元。 解读:这次双11最明显的特色是从天猫扩散到全电商平台,演变为全产业链的较量。线上线下企业的合作,全渠道销售在双11大促中发挥了巨大作用,巨头之间的合作、整合发挥协同效应,比如阿里苏宁,京...https://www.iyiou.com/p/24138/
13.2016新沂电子商务交易额竟然达到119亿元,“互联网+”正改变着你我...同时,推动餐饮、住宿等个体商户利用电商平台开展O2O销售,实现转型发展。加快电商平台与文创产业融合,推动文化产业转型。加快建设网上图书馆、画廊、收藏馆等,运用互联网平台传播新沂厚重的文化底蕴。 2016年,全年电子商务交易额118.95亿元,增长71%,网络零售额88.7亿元,增长76%,各类网店2.3万家,直接从业人数8.6万人,带动全...https://www.ourjiangsu.com/wap/a/20170318/1489817547617.shtml