搜狗大数据总监Polarr联合创始人关于深度学习的分享交流架构师小组交流会七牛云

第四期小组交流会邀请到了Polarr联合创始人宫恩浩、搜狗大数据总监高君、七牛云AI实验室负责人彭垚,对深度学习框架选型、未来趋势展开了交流。

Polarr宫恩浩:网络压缩有几部分。

一部分首先找一个最适合的架构,这部分我个人觉得还得根据具体的应用、性能要求来定。

第二个部分是网络压缩,在不改变模型效果前提下尽量减少模型参数。我一个同学在做这方面工作叫DeepCompression,然后我也和这个同学一起参与一些新的深度学习算法研究,基于在DeepCompression来进一步优化模型。最近一些研究发现一个深度模型可以压缩甚至压缩到几十倍几百倍,那说明整个有很大的冗余性,基于这个我们能不能选择一些适当的模型tradeoff,在保持模型体积基础上性能比原来显著提升,比如它本身网络是DenseNetwork,压缩到SparseNetwork,然后再长成DenseNetwork可以一步步进行优化。可以想像这个Network一会胖,一会瘦,最终达到一个体积和性能更好的状态,我个人主要在做的是这个方法的统计分析。

Polarr宫恩浩:我说一下,首先我觉得并不是模型越小它就越快,这可能跟架构有关。我觉得可以拿一些简单的例子试一下。可以先看一下别人已经被验证过更小更快的模型。看一下基于那个做会不会合理,是否能达到你的需求。然后不行的话,牺牲一些精度,还得看你的具体精度各方面性能大概多少可以用。

Polarr宫恩浩:运算能耗的话,如果你直接用它的Framework的话,其实是一样的。但是你可以再hack一些东西他就能提高。比如可以用低精度的乘法。我觉得iOS的Metal很好。比如AlexNet大概能手机上,能30到42fps,然后inception模型,大概是10fps。同时他们出一些刚刚优化,所以我觉得未来移动端的深度学习,会有很多的公司用移动端解决问题,很有前景。

Polarr宫恩浩:其实用挺多的,iOS上肯定用它的MetalFramework。然后其他的就是后端,很多都会去用,Caffe,Tensorflow都有过一些接触。

七牛彭垚:其实我这边也有用过CPU跑过一些测试的。之前在有客户也用过我们的鉴黄系统,一开始他们说采购不了GPU机器,我就用CPU给他们测了一轮,他那个效率就很低,大概单个GPU和CPU比的话,就20倍了。

搜狗高君:我还有一个小问题,不知道大家在多机并行做深度学习会处理到多大的集群问题。至少我们在做一些多机并行的时候,是从Tensor迁到了MXNet上,然后我们发现Tensor的效率似乎有点问题,我不知道业内在多机多卡这件事上,有没有更好的,能有效地提升加速的问题。宫博士,在美国那边,在并行问题上,你了解到有没有一些新的进展?

七牛彭垚:之前有去调研过多机多卡,包括Tensorflow、Caffe。Tensorflow它本身并没有提供好的paramterserver设计。框架提供你根据应用情况更好的去设计参数服务器。倒是觉得Caffeposeidon提供了一好Paramterserver的设计,包括它矩阵同步的时候,怎么去传输,把矩阵就是做变换变小,能够更高效的去做同步。

搜狗高君:遇到过,而且在多机上面差距非常大,所以我们还把传统里边一部分,涉及到多级并行策略的做了一小部分修改,改的地方不多,但是在CPU的基础上,我们当时看了一下,效果还不错。

七牛彭垚:有没有人用过Torch,因为我听一些朋友说Torch在跑同样的数据集和网络情况下,和Caffe比,收敛率和准确率都要好一点,可能是他在底层算法上有一些tricky的地方。

Polarr宫恩浩:我之前做DSD研究,就用了Torch,是基于resnet的Torch。对Torch的感觉,首先是太麻烦了,因为用的人太少了,有什么问题也不太好问。但是他有一些好处,比如说我想改一些regularization和迭代过程中修改weights,在Torch上改,它就相对方便很多,因为它很多底层的操作更expose一些,比在Caffe改更方便一些。比如我们想每一步做一个调整,和获得最新的调整,我们就可以通过Torch。相对来说和Python类似,是比较好实现的,这是一个感受。

七牛彭垚:内容的审核,就比方说鉴黄,就是鉴别黄色视频这种,大量简化了鉴黄师的工作。有一些内容标签,特别是对社交网站,我们会给社交网站,直播,短视频,打一些标签,帮助客户理解图像视频的内容。

七牛彭垚:举个例子,根据客户的需求,我们做了一个人脸检测,审核上传的照片到底有没有头像。如果他上传的照片里一个头像都没有,那这个用户其实是一个baduser。在比如,我们把某个社交网站的图片收集起来,实际上这些图片是杂乱无章的,那么我们做一个应用,帮所有的图片打上标签,还包括做了人脸的聚类、场景的识别,社交客户就可以根据我们的标签应用做相册归类,这样就可以做一些数据分析,分析网站上每个用户的自拍的数量等。就是从图像方面做一些人群分析。

搜狗高君:我今年听过的一个比较有意思的深度学习应用,就是应用在视频推荐,传统的视频推荐使用文本去处理的。快手里是很少文字信息的,完全是用户上传视频,所以他们今年用了深度学习,去理解视频的内容,然后再做推荐,也做的蛮有意思的。

七牛彭垚:我觉得这块就相当于是帮客户的一些非结构化的一些数据,打上标签。然后打上标签以后,其实能做的事情就非常多,就可以做分类、搜索、推荐,能做的事情就很多,我甚至可以对每一个切片,比方说每10秒钟的一个视频的切片打标,然后你就能做很多事情了。比方说新闻片的剪辑,就是对新闻片的每个地方,它会去打一些标签。比方说我这一段新闻,我有我的主持人出现,然后他会去检测下面的主题的那个文字,把文字在OCR出来,他就会把那些新闻一段一段的打上标签,这样能够方便做剪辑、后期处理等。

搜狗高君:七牛的AI是主要是做toB服务,就是帮助一些企业去解决他们内部的需求,用机器学习处理问题吗?七牛彭垚:我们最开始是做鉴黄的内容审核系统,后面才去做各种标签系统,和定制化识别应用等。

搜狗高君:七牛AI的这种模式下边,你们会把这种商业模式,当做一个长期的商业模式去运作吗,因为我在北京接触过一些公司,甚至是大公司,比如说招行这个量级的公司,我目前还没有看到很强的付费能力,他们内部很难提出这种需要用机器学习的方法去解决问题,他们也很难形成一个估值,就是估价。我一直对这件事挺好奇,这种模式真的是可以做出一个真正的盈利的模式吗?

七牛彭垚:要看客户的群体的,像鉴黄是帮客户节省了很多成本,原来他们需要很多基础的人力,人力成本非常高的,所以它其实是很乐意做这个事情,而且鉴黄师这个事情特别难做,他都要熟练工,然后那种人他又干个半年一年他就不干了,其实用工成本就很高。还有其他应用,我们都致力于大量节省人力成本的应用。

搜狗高君:我问一个小的开放性的问题,由于深度学习出来以后,亚马逊做了echo的那件事情。会不会在五年以后,真的会出现一个像钢铁侠里的家庭秘书一样,就像原来苹果手机把手机全搞了一遍,会不会五年以后也出现这样一件事情?大家是怎么看这件事儿。

亚马逊的echo现在提供了非常充分的API,将家庭的一些设备等等,或者说你一些App上的功能做对接。那么我自己就是在想,如果未来真是有这样一种趋势的话,那很有可能就会变成家庭必备的设备了。那如果这种场景下,它可以衍生出很多服务,比如说它可以对接摄像头,它本身也有语音,它可以变成无所不能的事。就是我们现在可能做的所有的这个事,都能被它给干掉。因为它能完全改变生活,所以我一直在想这件事会不会发生。

主持人:我觉得这个事情,如果只是一个智能家居,我觉得应该可以。如果你是特别极客,在家里放一些灯,或者机器人在家里,我觉得没有问题。但是很多人可能对隐私保护比较在意,他不一定会乐意放机器人在家里面。这个问题,我觉得小范围推应该没有问题,大范围我觉得还是会有问题。

Polarr宫恩浩:我觉得echo最近比较火,但是我觉得以后每个人手机都可以有这种服务吧,其实就是更直接一些,而现在好像有很多startup搞个人助理,他们主打的想法是变成AI的助理,比如说帮我叫个车,就不用麻烦再自己打车了,手机助理可以和互联网服务通过AI连接。我觉得这都是不久将来可以实现。

搜狗高君:在美国那边做这个方向创业的公司多吗?

Polarr宫恩浩:最近就看见过一些,包括国内,我之前有同学回国做个人助理,最终肯定是想做,就是语音识别的,就是人工智能,现在可能就一开始都是人手人工实现服务,我觉得还是一个刚开始的方向吧,都想往AI上做。

搜狗高君:记得国内也有类似的团队,跟亚马逊echo很像。甚至有做车载的后视镜的,好像也在往这个方向打。我是平常用微软的小冰,有时候会用它来调一些程序,做一点小东西。

主持人:个人习惯吧,从普通大众来说,有多少人会用这些东西,我觉得可能用的也不多。

主持人:我觉得聊天机器人大家可以探讨一下,现在觉得还没有一个特别好的应用,算法上可能还没有特别成熟。

搜狗高君:之前有朋友跟我说过聊天机器人,他跟我提到语料是一个非常麻烦的事儿,我不知道你们那边怎么处理的。

主持人:最核心的就是知识图谱的构建。在聊天机器人上,技术上不是问题,其实就是生产资料的问题,就是你怎样去构建专业领域的聊天知识图谱,这是目前聊天机器人做的好不好的差异化。怎么样去跟行业深度应用,这是一个未来的趋势。技术是没有门槛的,随便几个人,可以创建一家机器人聊天公司。

搜狗高君:如果做一个垂直领域的自动问答,有一个领域级的知识库,可能对这些问题的解决帮助会很大。那比如说做小冰这种很宽泛的,我一直很好奇有个问题,比如说像电影和电视剧里边有大量的对白,那么在这个场景里边真的用这种对白有没有价值能帮助这个聊天机器人的算法会变得更好?如果只是从这种QA的角度来讲,要搜集这种配对关系,这个耗费的人力非常大的。但有的时候聊天机器人可能只是想让大家感觉到它像一个人。所以这样为什么不能从电视剧和电影里边去拿到大量的对白。

七牛彭垚:我觉得其实客服机器人是相对好做的,反而把它做得像人,我觉得是比较难。我之前就接触到一个例子,是让机器人去学习大家平时的聊天内容。比方说“我生病了,我今天不舒服”,然后去做人工去打标,比方说5个回答,它这里面就有一个回答就是“怎么了”。结果它搞了好几组人打标,选“怎么了”的人最多,其实“怎么了”这种说法你在任何场景都是通用的,这个机器人它什么都给你回怎么了。实际上,它还是没有到融汇上下文,能够理解所有东西的地步。

Q:大家可以探索一些新的领域。

七牛彭垚:这种项目一般都非常大,对于这种,其实是解决一些非常通用性的问题,你只要解决一个科室的一些,比方说医学影像,那其实就解决了这个非常通用的问题。

Polarr宫恩浩:国内其实这种病例还是多,主要是医院和学校也可以合作,比如清华就有很多这方面资源,将来如果再想做这事的话,就是从每一个病人开始做起,就现在国内基本上一周多的病人,就跟美国一个月一年的病人的数目差不多那种感觉。

七牛彭垚:对,像清华浙大交大这种医学院研究院,有很多附属医院,数据还是非常多。刚才宫博士也说,是给到某些大学,而大学里面这些影像中心可以流出去,所以这一块其实有很多机会的。问题倒是以哪些病为突破口,这个倒是可以再探索。

Polarr宫恩浩:最近基于CNN的segmentation发展有一定进展,就可以做一些很多医疗方面的应用。

搜狗高君:但是有一点像医学影像,即使就目前来看,就算能拿到很好的数据,它也不太可能变成一个主要的手段吧?我是这么想,毕竟它是有错误率的,如果让一个机器去做主要建议的话,一旦出了事故会比较麻烦,我是这样感觉的。所以我觉得这种工具在未来,也仅仅是给医生做一个参考的作用。我不知道大家会对这件事有更大的期待吗?

Polarr宫恩浩:这些医学伦理和管理方面问题,主要是你不管做的再好,目前你不可能一个机器来给你做这做那,都是最后签字是有人来负责,但是对于医生来说,比如他需要看很多层的图片,很多个不同的层的片,那如果能告诉他,你就看这一层,就是主要的一层,这种减少他的工作量,从实质上来说,非常非常好。前几天我跟一个医学院的老师聊这事,他觉得就需要这方面的东西。

THE END
1.搜狗什么时候成立的搜狗成立时间为2004年8月3日,搜狗的成立主要是为了增强搜狐的搜索业务能力,在搜索业务之外搜狗也推出了输入法和浏览器产品。2015年11月8日,搜狗与知乎的深度合作正式公布,其中搜狗全面接入知乎内容数据。 搜狗搜索引擎主打高效、稳定,2010年搜狐对搜狗进行了重组,并为搜狗引入了阿里巴巴的注资。此前搜狐公司收购图行天下...https://edu.iask.sina.com.cn/jy/jKXE77Lul3.html
2.搜狗的ceo是谁(搜狗公司创始人)本文为大家介绍搜狗的ceo是谁(搜狗公司创始人),下面和小编一起看看详细内容吧。 搜狗ceo是王小川。王小川毕业于清华大学。在成为搜狗ceo之前,王小川是搜狐的首席技术官。王小川在推动搜狐技术驱动文化方面发挥了关键作用。王小川表示,自己最大的心愿就是科技创新改变中国。 http://www.pxhuhao.com/n176301.htm
3.搜狗创始人王小川入场人工智能创业金融行业搜狗创始人王小川入场人工智能创业 团队拥有包括前搜狗、百度、华为、微软、字节、腾讯等知名科技公司以及其他创业公司核心成员在内的数十位顶尖AI人才。 (全球企业动态)搜狗公司创始人王小川正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能,一家研发并提供通用人工智能服务的中国公司,旨在打造...https://www.ceconline.com/finance/ma/8800117358/01/
4.「薛昆」搜狗狗创始人简介联系方式创业感悟「薛昆」简介,薛坤是搜狗狗的创始人。…了解更多薛昆简介,薛昆职业经历,薛昆联系方式,薛昆创业项目,薛昆新闻https://www.trjcn.com/ceo/10876.html
5.甩手网联合创始人甩手网跨境运营中心浏览量:529,时间:2024-11-12 11:01:01,转发量:183,阅读时长:262分钟,米境通跨境电商ERP,一、百度甩手网联合创始人查询;关键词:甩手网联合创始人,搜索量:5,竞争程度:6,百度查询,参考价格2...https://www.oldseoer.com/soft_314622.html
6.王慧文再融16亿!大模型创业百天成独角兽,腾讯押注,快手创始人入股搜狐网络大厦,位于北京海淀清华科技园内东南角,本是搜狗总部所在地。大厦15层的角落,曾经被搜狗创始人王小川用作办公室。 也在光年之外开张的4月,离开搜狗542天的王小川在这栋楼的2层举行了一次小型交流会。 会上,他宣布了自己的新公司百川智能,宣布了自己在大模型创业赛道鸣枪开跑。 https://wallstreetcn.com/articles/3690369
1.搜狐联合新华社推出全球首个站立AI合成虚拟主播据悉。最新推出的站立式AI合成主播将参与2019年全国报道,并将在搜狗搜索、输入法等资讯平台上与用户见面。 早在2018年11月7日第五届世界互联网大会上,搜狗与新华社联合发布的全球首个全仿真智能AI主持人。通过语音合成、唇形合成、表情合成以及深度学习等技术,克隆出的一中一英两位“AI合成主播”入职新华社三个月来...https://www.wd0aacz6.cn/yuan-yu-zhou-zi-xun/58791.html
2.搜狗正式并入腾讯王小川卸任搜狗CEO搜狗正式并入腾讯 王小川卸任搜狗CEO 上月底,搜狗完成私有化交易,宣布将与腾讯合并。今天搜狗正式并入腾讯,搜狗CEO王小川宣布卸任搜狗CEO,并表示,从今天开始,搜狗融入腾讯大家庭,向新而行,共赴山海。 据王小川介绍,经过自腾讯发出初步收购邀约至今的 383 天调整,通过充分优化的整合方案,目前搜狗业务和团队的调整已经基本...https://www.xyvlvfvkr.cn/zhi-neng/314998.html
3.微信张小龙搜狗王小川遥相呼应的两个人张小龙,腾讯系最杰出最有影响力的大神级产品经理;王小川,搜狐系最杰出最有影响力的大神级产品经理。当张小龙遇上王小川,一切都变得备受期待,而实际上,这两个人正在遥相呼应。 刨去腾讯与搜狐的体量不谈,张小龙与王小川给外界的感受非常类似,一个打造了微信,一个创建了搜狗,二者对于各自的母公司的意义都不言自明,...https://www.u72.net/daima/nxkcc.html
4.15个最火APP的创始人。1抖音创始人,张一鸣,1983年出生,南开...15个最火APP的创始人。 1、抖音创始人,张一鸣,1983年出生,南开大学毕业。目前身价3600亿,力压马云,马化腾,成为中国目前最年轻的首富。 2、微信创始人,马化腾,1971年出生,深圳大学毕业。这位“企鹅帝国”的掌舵者,用一只小企鹅改变了中国的社交格局。 https://www.yoojia.com/article/4287915110851292185.html
5.搜狗CEO王小川:搜狗与360不是一种文化→MAIGOO访谈在我国的互联网江湖中,有一个人在11年的时间里,从隐忍到薄发,他的前任老板叫陈一舟,现任老板叫张朝阳,前投资人叫马云,现投资人是马化腾,他的对手,一个叫李彦宏、另一个叫周鸿祎,而这个人就是王小川,27岁就当上了搜狐的副总裁,搜狗公司的创始人和CEO。 https://www.maigoo.com/fangtan/388460.html
6.搜狗创始人王小川的倔强人生搜狗创始人王小川的倔强人生 1978年,安徽省凤阳县小岗村拉开了中国对内改革的大幕。 这一年,走在大街上,少见压抑的灰蓝棉布衣,而是各种新式喇叭裤、披肩发,迪斯科也开始风靡全国,万物苏醒,静待阳光。 也在这一年,沐浴着改革开放的春风,成都学霸王小川出生了,同年出生的还有猎豹移动傅盛,bilibili陈睿等一大批未来的...https://www.digitaling.com/articles/752926.html
7.搜狗创始人王小川入场人工智能创业搜狗创始人王小川入场人工智能创业 搜狗公司创始人王小川正式官宣入场大模型创业,和前搜狗COO茹立云联合创立人工智能公司——百川智能,一家研发并提供通用人工智能服务的中国公司,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。据悉,公司早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。团队拥有包括前...https://www.donews.com/news/detail/8/3447448.html
8.搜狗创始人王小川宣布入场大模型创业新闻上证报中国证券网讯(记者 罗茂林)4月10日,搜狗公司创始人王小川宣布,将投身大模型创业。 王小川表示,他和前搜狗COO茹立云联合创立人工智能公司百川智能,旨在开发中国版的OpenAI基础大模型及颠覆性上层应用。 据悉公司早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。https://news.cnstock.com/news,bwkx-202304-5044037.htm
9.搜狗创始人王小川宣布开启人工智能大模型创业4月10日消息,搜狗创始人王小川今日正式对外宣布开启人工智能大模型领域创业。王小川与前搜狗COO茹立云联合成立人工智能公司百川智能,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。据介绍,百川智能早前已获得5000万美元启动资金,来自王小川与其业内好友的个人支持。“搜索是距离大模型特别近的业务,我们已经有了一个500...https://www.dsb.cn/news-flash/113868.html
10.十三邀第二季分集评分及最佳单集笔记十三邀第二季【S2E11王小川(搜狗创始人)】 【生物和科技】 王:我是搞生物的,如果每个细胞能够非常自由,这个人就瓦解了 许:学习生物的经历对你搞科技有什么影响? 王:生物,让我走出了机械的数学物理。数学物理有很多确定性的推理方式,但困难是,当遇到非线性的、复杂性的过程,数学物理是解不动的,因为有太多微小变化带来绝对的...https://m.douban.com/book/review/12747934
11.季琦(华住集团创始人)华住集团创始人 季琦(1966年10月-),籍贯江苏省如东县,上海交通大学机械工程系硕士学位[1],汉庭连锁酒店创始人,携程旅行网、如家快捷酒店联合创始人[2]。看个人经历 08:25 “创业教父”季琦:10年创办3家上市公司,开创酒店出行新时代 视频解读 8.13万观看 季琦在1999年创办了携程旅行网,任首席执行官、总裁,2002年...https://baike.sogou.com/m/fullLemma?lid=2981073