进入到2020年,互联网红利(ToC)虽然风韵犹存,但影响不如往昔的高光时刻;实体经济(包括工业、农业、服务业等在内的ToB)需要进一步降本增效,信息化、互联网化、自动化、AI化、区块链化是强大的助推器。
原本AI(人工智能,也即ArtificialIntelligence的简称)就摩拳擦掌,在新的十年里准备大展宏图了。在疫情的影响下,由于抗疫的原因,AI有了更大的用武之地。
为了控制疫情的蔓延,在海量的数据当中,实现快速分析、决策和响应成为重中之重。另外,非接触的服务和工作、自动化、快速决策和响应的需求等将会爆发。例如,人脸识别(包括免摘口罩的人脸识别)、AI辅助诊断、应急管理、安防监控、知识图谱、基因研究、医药研发、金融服务、智能配送、各行各业的无人值守(例如零售)、物流运输、个人画像、轨迹追踪、舆情分析等等。另外,疫情趋势预测、风险预警、医疗资源和物质的预测和调配,要做到快速、准确、科学的判断,也需要AI的助力。
2020年4月9日,中国工程院士、浪潮集团首席科学家王恩东在2020年浪潮云数据中心合作伙伴大会(简称IPF2020)上通过“智慧计算源动新基建”的演讲表示,智算中心是智慧时代最主要的计算力生产中心和供应中心。并指出:
"计算力就是生产力,智慧计算改造升级了生产力三要素,最终驱动了人类社会的转型升级。智慧计算将劳动者由人变成了人加上人工智能,劳动者可以呈现指数增长;智慧计算将数据变成了一种新的生产资料,从有形到无形,生生不息,越用越多;智慧计算将计算力驱动的信息化设备变成了生产工具,也是指数增长,生产力得到了前所未有的解放"。
我们可以看到,以AI为核心的技术及其生态,成为新形态生产力发展的决定性因素,且将助力新基建和抗疫的深入。
一、CBInsights简介
二、CBInsights发布2020年全球AI百强榜
2020年的榜单中,共有6家中国公司入选,数量与2019年持平。包括第四范式、追一科技、创新奇智、松鼠AI、蓝胖子机器人、禾多科技等,涉及企业智能、智能制造、自动驾驶、机器人等多元化领域,代表中国人工智能未来发展的方向。另外,还有一家华人创办的AI医学影像公司深透医疗(SubtleMedical)。
CBInsights从2017年开始首次发布AI100榜单,今年AI100是第4届。2017年,榜单上来自中国的企业有4家(碳云智能、出门问问、rokid、优必选);2018年增加到了7家(今日头条、商汤、旷视、英语流利说、出门问问、寒武纪、优必选);2019年则有6家中国企业上榜(商汤、依图、旷视、第四范式、momenta、地平线)。
今年,AI100入选者共有来自13个国家的人工智能初创企业,覆盖了15个前沿行业和跨行业应用,包括:医疗、零售、仓储、金融保险、教育、交通、制造、建筑、媒体等。今年100家入选企业则由CBInsights研究团队从近5000家初创企业(成立不超过10年的非上市公司)中得出。
另外,根据CBinsights此前发布的最新版《全球人工智能投资趋势年度报告》显示,在刚刚过去的2019年,全球范围内AI投融资分布中,美国占比下降,非美国区域投融资比例上升。美国由2014年的占比71%,逐渐下降到2019年的39%。美国以外的比例则对应上升到61%。2019年,美国以外的AI投融资中心地域,中国占比13%,其次是英国的7%、日本的5.3%和印度的4.9%。
三、CBInsights-ArtificialIntelligenceTrends,2019
下面是侯延露的译文《2019人工智能趋势》。这个应该是目前CBInsights
上关于AI趋势的最新报告了,因为我尚未检索到它有关2020的AI趋势报告。如果您有,欢迎留言或私信给我。
2019人工智能趋势
首先,我们使用CBInsightsNExTT框架评估每个趋势。
NExTT框架告知企业了解新出现的趋势,并根据他们对风险的承受能力指导他们的决策。NExTT使用数据驱动的信号,从概念到成熟再到广泛采用,来评估技术,产品和商业模型的趋势。
X轴、Y轴覆盖的区域分成了四个象限:
分别是:
1、必要的(坐标右上角,NECESSARY)
行业和客户的实施/采用情况以及对市场和应用的了解都在不断出现趋势。对于这些趋势,在位者应制定清晰,明确的战略和举措。
2、实验的(坐标左下角,NECESSARY)
功能性产品很少的概念或早期趋势,尚未得到广泛采用。实验趋势已经激发了早期媒体的兴趣和概念验证。
3、威胁的(坐标左下角,THREATENING)
大型可预测的市场预测和显著的投资活动。这一趋势已被早期采用者所接受,并可能即将获得广泛的行业或客户的采纳。
4、过渡的(坐标左上角,TRANSITORY)
趋势正在被采用,但市场机会存在不确定性。随着暂时趋势得到越来越广泛的理解,它们可能会揭示更多的机会和市场。
我们把发现的25个趋势,放入到NExTT框中,得到如下概述图。
按趋势所在的四个象限,共计25个。其中:必要的6个;实验的12个;威胁的4个;过渡的3个。
这25个趋势按场景分:
计算机视觉:7个
自然语音处理/合成:5个
智能预测:6个
架构:4个
基础设施:3个
得益于开源软件,进入人工智能的壁垒比以往任何时候都要低。Google在2015年开源了TensorFlow机器学习库。人工智能的开源框架是双向作用的:它使所有人都能使用人工智能,反过来,像Google这样的公司也从有助于加速其AI研究的贡献者社区中受益。
每月在GitHub上有数百名用户向TensorFlow做出贡献(用户可以在其中进行协作的软件开发平台)。以下是一些使用TensorFlow的公司,从可口可乐到eBay到Airbnb(爱彼迎)。
在与Nvidia,高通,英特尔,微软等公司的研究人员合作创建了一个轻量级的模块化深度学习框架之后,Facebook于2017年发布了Caffe2。该框架可以扩展到云之外,还可以应用于移动应用。Facebook当时还经营PyTorch,一个适用于Python的开源机器学习平台。2018年5月18日,Facebook将两者合二为一,“将Caffe2和PyTorch的有益特性结合到一个包中,并实现从快速原型到快速执行的平稳过渡”。
近几个月来,PyTorch的GitHub贡献者数量有所增加。
Theano是蒙特利尔研究所的另一个开源库学习算法(MILA)。2017年9月,业界领先的AI研究员YoshuaBengio宣布终止MILA对Theano的开发,因为这些工具已经变得更加普及。YOSHUABENGIO,在一项MILA公告中说道:
“支持深度学习研究的软件生态系统发展迅速,现已达到健康状态:开源软件已成为常态;提供了各种框架,满足了从探索新想法到将其部署到生产中的需求;强大的工业参与者正在刺激竞争中支持不同的软件栈”。
今天,有许多开源工具可供开发人员选择,包括Keras,MicrosoftCognitiveToolkit和ApacheMXNet
实时决策的需要将AI推向了边缘。在智能手机,汽车或者可穿戴设备等边缘设备上运行AI算法,而无需与中央云或服务器进行通信,从而使设备能够处理在本地提供的信息,对情况做出更快的反应。
英伟达,高通和苹果以及许多新兴公司都致力于在“边缘”专门为AI工作负载构建芯片。从消费电子产品到电信到医学成像,边缘AI对每个主要行业都有影响。
大型科技公司在2017年至2018年之间在边缘AI方面取得了巨大飞跃。苹果在2017年发布了带有“神经引擎”的A11芯片,适用于iPhone8,iPhone8Plus和X,声称可以每秒执行多达6000亿次操作的机器学习任务。它支持iPhone的新功能,例如FaceID,可在设备本身上运行面部识别以解锁手机。
CBInsights盈利记录分析工具显示了以下内容:边缘AI在2018年的一部分中呈上升趋势
随着政府在监控中增加了一层人工智能,初创企业在为政府提供基础技术方面发挥着关键作用。在CBInsights平台上快速搜索中国的人脸识别初创公司的交易,反映了对该技术的需求。
SenseTime,Face++和最近的CloudWalk等独角兽已经从中国涌现。(这是我们有关中国的详细报告。)但根据CBInsights专利分析工具,即使在美国,对该技术的兴趣也在激增。
但是技术并非没有故障。据报道,亚马逊因误认一些国会议员为罪犯而备受新闻报道。当“笑脸解锁功能”被暂时禁用时,西雅图学校外的智能相机很容易遭到《华尔街日报》记者的欺骗,后者利用校长的照片进入该场所。“笑脸解锁”和其他此类“活动检测”方法提供了额外的身份验证层。
例如,亚马逊获得了一项专利,该专利可以探索更多安全层,包括要求用户执行某些操作,例如“微笑,眨眼或倾斜头部”。然后,可以将这些操作与“红外图像信息,热成像数据或其他此类信息”结合使用,以进行更可靠的身份验证。
早期的商业应用正在安全,零售和消费电子领域迅速发展,面部识别正迅速成为生物认证的一种主要形式。
FDA批准了初创公司Viz.ai的产品VizLVO,以分析CT扫描并通知医疗保健提供者患者中风的可能性。在获得FDA批准后,Viz.ai从GoogleVentures和KleinerPerkinsCaufield&Byers处获得了2100万美元的A轮融资。FDA还批准了GEVentures支持的初创公司Arterys的OncologyAI套件,该套件最初专注于发现肺和肝脏病变。自2014年以来,快速的监管审批为80多家自筹集了股权融资的AI影像和诊断公司开辟了新的商业途径,共计149笔交易。
与专注于工业和能源的AI公司的交易正在增加,其中包括用于IIoT的ML即服务平台。较新的初创公司正在与C3IoT和UptakeTechnologies等独角兽竞争。GE风险投资于2016年成为这里的积极投资者,支持包括FoghornSystems,SightMachine,Maana和BitStewSystems(后来被其收购)在内的公司。GE凭借其Predix分析平台是IIoT的主要参与者。竞争对手包括西门子和SAP,它们已经推出了自己的IIoT产品(Mindsphere和Hana)。印度塔塔咨询公司(TataConsultancy)宣布,它将为能源公用事业公司推出预测性维护和基于AI的解决方案。塔塔(Tata)声称,其“数字孪生”技术的早期版本-以数字格式复制地面运营或有形资产以对其进行监控,帮助发电厂每年每吉瓦节省约150万美元。甚至像Microsoft这样的大型科技公司都在扩展其云和边缘分析解决方案,以包括预测性维护。
亚马逊正专门在其搜索部门招聘150多个职位,包括自然语言理解,混沌工程和机器学习等。
但是仅描述和索引是不够的。许多用户以自然语言搜索产品(例如“没有按钮的洋红色衬衫”),或者可能不知道如何描述他们要寻找的东西。这使得电子商务搜索的自然语言成为一个挑战。
早期的SaaS初创公司正在兴起,将搜索技术出售给第三方零售商。
图像搜索创业公司ViSenze与Uniqlo,Myntra和日本电子商务巨头Rakuten等客户合作。ViSenze允许店内客户在商店中拍摄他们喜欢的东西的照片,然后上传照片以在线查找确切的产品。
它在加利福尼亚和新加坡设有办事处,并在2016年从包括乐天风险投资公司在内的投资者那里筹集了1,050万美元的B轮融资。它于2017年进入联合利华铸造厂(UnileverFoundry),这使东南亚的初创企业可以用其品牌测试试点项目。
另一家为在线搜索推荐开发AI的初创公司是总部位于以色列的Twiggle。
阿里巴巴支持的公司正在开发一种语义API,该API位于现有的电子商务搜索引擎之上,以响应买方非常具体的搜索。Twiggle在2017年的B轮融资中筹集了1500万美元,并于去年加入即插即用加速器。
深度学习推动了当今大多数AI应用的发展。现在,借助胶囊网络,它可能会进行改造。
Google的深度学习先驱GeoffreyHinton早在2011年就以纸质方式提出了一个名为“胶囊”的新概念,认为“目前用于识别图像中对象的方法性能较差,并且使用的方法在理论上并不令人满意。”
Hinton提到的那些“当前方法”包括当今深度学习中最受欢迎的神经网络架构之一,即卷积神经网络(CNN)。CNN在图像识别应用中特别受欢迎。尽管CNN取得了成功,但它也有缺点(更多内容请参见下文)。Hinton在2017年至2018年期间发表了两篇关于“胶囊网络”的替代概念的论文,也称为CapsNet—一种新的架构,有望在多个方面超过CNN。如果不进行处理,CNN在精确的空间关系方面会失败。考虑下面的脸。尽管相对于其他面部特征,嘴巴的相对位置不正确,但CNN仍会将其识别为人脸。
尽管有缓解上述问题的方法,但CNN的另一个主要问题是无法理解新观点。“现在,卷积神经网络已成为对象识别的主要方法,因此有必要问一下是否存在任何指数低效可能导致其消亡。卷积网在推广到新颖观点时遇到的困难是一个很好的候选人。”—胶囊之间的动态布线例如,CapsNet可以更好地识别第一行和第二行中的玩具图像是否属于同一对象,而仅是从不同角度或角度拍摄的。CNN将需要更大的训练数据集来识别每个方向。
(以上图片来自一个名为smallNORB的数据库,其中包含50个玩具的灰度图像,这些玩具属于5个类别中的1个:四足动物,人物,飞机,卡车和汽车。Hinton的论文发现CapsNets降低了错误率与其他算法相比,在此数据集上进行测试时降低了45%。)
Hinton声称,对胶囊网络进行了一些复杂的对抗攻击(篡改图像以混淆算法),并发现其性能优于卷积神经网络。
黑客可以引入一些小变化来欺骗CNN。Google和OpenAI的研究人员已通过几个示例进行了演示。
对CapsNet进行比较流行的示例之一是Google的IanGoodfellow等人在2015年发表的一篇论文。如下所示,人眼不易察觉的微小变化意味着图像会导致神经网络以高置信度将熊猫识别为长臂猿(一种猿类)。
胶囊网络的研究尚处于起步阶段,但可能会挑战当前的最新图像识别方法。
其他论文探索了中间解决方案,例如使用肌电信号(残端附近肌肉的电活动)来激活相机,并运行计算机视觉算法来估计物体的抓握类型和大小。“人工智能假肢挑战赛”是NeurIPS18(领先的年度机器学习会议)中的竞赛项目之一,进一步彰显了AI社区对此领域的兴趣。
2018年的挑战是使用强化学习来预测假肢的表现(本报告以下各节中有关强化学习的更多信息)。研究人员使用一种称为OpenSim的开源软件来模拟人类的运动。上一年的重点是“学习运行”,有442名参与者试图与AWS,Nvidia和Toyota等赞助商一起教AI如何运行。
临床试验中最大的瓶颈之一就是招募合适的患者。苹果也许能够解决这个问题。尽管可以对医疗记录进行数字化处理,但互操作性(跨机构和软件系统轻松共享信息的能力)是医疗保健中的最大问题之一。
这在临床试验中尤其成问题,在临床试验中,将正确的试验与合适的患者进行匹配对于临床研究团队和患者而言都是耗时且具有挑战性的过程。作为背景,仅在美国就有超过18,000个临床研究正在招募患者。如果医生知道正在进行的试验,则患者有时可能会从其医生那里获得试验建议
苹果还与Cerner和Epic等知名的EHR供应商合作,以解决互操作性问题。苹果在2018年1月宣布,iPhone用户将可以通过其iPhone的Health应用程序从参与机构访问其所有电子健康记录。该功能被称为“健康记录”,是AI医疗保健初创公司Gliimpse在2016年被Apple收购之前所做工作的扩展。在易于使用的界面中,用户可以找到所需的有关过敏,状况,免疫接种,实验室检查结果,用药,程序和生命的所有信息。在2018年6月,Apple为开发人员推出了HealthRecordsAPI。用户现在可以选择与第三方应用程序和医学研究人员共享其数据,从而为疾病管理和生活方式监测打开了新的机遇。在使用AI和机器学习进行早期诊断,招募合适的患者群体甚至推动药物设计决策方面,可能性似乎无穷无尽。
试图彼此超越的两个神经网络在创建逼真的图像方面非常擅长。您能识别出其中哪些图像是假的吗?
答案是以上所有。这些高度逼真的图像均由生成对抗网络或GAN生成。(注意:右下图代表“类泄漏”,该算法可能将狗的属性与球混淆,并创建了“狗球”。)GAN是Google研究人员IanGoodfellow在2014年提出的概念,它提出了“人工智能与人工智能”的概念。有两个神经网络:一个生成器,它带有伪造的图像(例如,一只狗),以及一个鉴别器,该鉴别器将结果与真实世界的图像进行比较,并向生成器提供复制图像与真实图像有多接近的反馈。
这在试图彼此超越的两个神经网络之间形成了恒定的反馈回路。上面的图片来自GoogleDeepMind实习生AndrewBrock在9月18日发表的论文,该论文与DeepMind的其他研究人员一起发表。他们在非常大规模的数据集上训练了GAN,以创建“BigGAN”。Brock和团队在BigGAN遇到的挑战之一:例如,一只蜘蛛有“很多腿”。但是“手数”是多少?
CMU的研究人员在“deepfake”视频的这一迭代中将GAN用于“面对面”翻译。在下面的Deepfake示例中,JohnOliver变成了StephenColbert:
华沙理工大学的研究人员开发了ComixGAN框架,使用GAN将视频转换为漫画
佳士得艺术品拍卖行以432,500美元的高价售出了第一幅GAN创作的画作
在有关GAN的最新论文中,Nvidia研究人员使用“基于样式的生成器”来创建超逼真的图像
GAN不仅用于有趣的实验。这种方法还具有严重的含义,包括伪造的政治视频和变形的色情内容。《华尔街日报》已经在培训其研究人员以发现Deepfake视频。随着研究规模的扩大,它将改变新闻,媒体,艺术甚至网络安全的未来。GAN已经在改变我们训练AI算法的方式(有关“合成训练数据”的下一节,将对此进行详细介绍)。
新方法旨在在使用敏感用户数据训练AI时保护隐私。我们与智能手机和平板电脑的日常互动-从选择消息中使用的单词到对照片的反应方式-都会产生大量数据。使用我们独特的本地数据集训练AI算法可以大大提高其性能,例如更准确地预测您要在键盘上键入的下一个单词。正如Google的研究人员在2017年的一篇论文中解释的那样:“聊天和短信中使用语言通常与标准语言语料库(例如Wikipedia和其他网络文档)有很大不同;人们用手机拍摄的照片可能与典型的Flickr照片完全不同。”但是,此用户数据也是个人和隐私敏感的。Google的联合学习方法旨在使用此丰富的数据集,但同时保护敏感数据。简而言之,您的数据保留在手机上。它不会发送到或存储在中央云服务器中。云服务器将算法的最新版本(称为算法的“全局状态”)发送给用户设备的随机选择。您的手机会根据本地化数据对模型进行改进和更新。仅将此更新(以及来自其他用户的更新)发送回云以改善“全局状态”,并且该过程会重复进行。
Firefox对联合学习进行了测试,以对当用户开始在URL栏中键入内容时出现的建议进行排名,并将其称为“主要软件项目中(联合学习的第一个实现)之一。”在联邦学习的另一个应用中,由GoogleVentures支持的AI初创公司OWKIN(专注于药物发现)正在使用这种方法来保护敏感的患者数据。投资者OtiumVenture称,该模型允许不同的癌症治疗中心进行协作,而患者的数据不会离开场所。
一个更具未来感的用例是对医疗生物特征的被动监控。2018年1月,谷歌发布了一项雄心勃勃的专利,该专利旨在从一个人的肤色或皮肤位移分析心血管功能。传感器甚至可以(根据专利说明)放置在患者浴室的“传感环境”中。
人工智能发现模式的能力将继续为新的诊断方法和识别先前未知的危险因素铺平道路。
保险公司和初创公司开始使用AI来计算车主的“风险分数”,分析事故现场的图像并监视驾驶员的行为。阿里巴巴子公司中国蚂蚁金服在其“事故处理系统”中使用深度学习算法进行图像处理。当前,车主或驾驶员将其车辆带到“事故处理人员面前”,该人会检查车辆的损坏并记录详细信息,然后将其发送给汽车保险公司。图像处理的进步现在使人们能够拍摄车辆的照片并将其上传到AntFinancial。然后,神经网络分析图像并自动进行损害评估。Ant采取的另一种方法是创建驾驶员的风险状况,以影响汽车保险的实际定价模型。“大数据和人工智能等技术的发展使保险公司能够进一步利用消费者数据并分析车主可能面临的风险。因此,汽车保险的风险因素可以从“面向汽车”的方法转变为“汽车/所有者组合”。—阿里巴巴云博客
阿里巴巴推出了一种称为“汽车保险积分”的东西,它利用机器学习根据信用历史,消费习惯和驾驶习惯等因素来计算车主的风险评分。规模较小的初创公司也正在涉足保险和理赔流程,但采用了不同的方法。例如,Nexar鼓励驾驶员使用智能手机作为行车记录仪,并将镜头上传到Nexar应用程序。作为回报,车主可以享受保费折扣。该应用程序使用计算机视觉算法来监视道路状况,驾驶员行为和事故。它还提供了“崩溃重现”功能,以重建和分析发生事故的情况,并与保险客户一起处理索赔。总部位于英国的Tractable允许保险公司将损失图片和估算值上传到其理赔管理平台。“AIReview”功能将其与数千张图像进行比较,以相应地调整价格。有趣的是,Tractable还针对生态系统中的其他参与者,例如汽车维修,评估师,供应商和汽车租赁公司。
品牌在两个方面与假货作斗争:在在线世界中,识别并删除侵犯品牌商标(如品牌名称,徽标和标语)的在线列表;
在现实世界中,识别像奢侈品手提包这样的假冒伪劣商品。
网络造假在范围和规模上都是庞大而复杂的。电子商务巨头阿里巴巴因未能在其网站上对假冒商品做足够的努力而备受抨击报道说,该公司正在使用深度学习来持续扫描其平台的IP侵权行为。它使用图像识别来识别图像中的字符,同时使用语义识别来监视网站上列出的产品图像中的品牌名称或口号。
假冒者使用与原始品牌列表非常相似的关键字和图像在假冒网站上出售假冒商品,在合法市场上出售假冒商品并在Instagram等社交媒体网站上推广假冒商品。当一个列表被删除时,假冒者可能会重新发布相同的假冒商品,具有不同关键字字符串的产品。
巴塞罗那的初创公司RedPoints正在使用机器学习技术来扫描网站是否存在潜在侵权行为,并在选择造假者使用的关键字时寻找模式。它拥有化妆品,豪华手表,家居用品和服装行业的客户,包括MVMT,DOPE和PaulHewitt
在物理世界中,发现假货比较棘手,而且更加手动。当卖家发布二手豪华手提包出售或去典当行买卖时,验证过程通常需要认证专家亲自检查袋子,包括品牌,材料和缝制图案。这是eBay和其他公司使用识别专家对一件豪华手提包进行身份验证的费用。
但是随着“超级假货”或“三重假货”的兴起,用肉眼分辨出这种区别几乎变得不可能了。建立假冒和伪造商品的数据库,提取其特征,并训练AI算法来分辨差异是一个繁琐的过程。初创公司Entrupy与身份验证专家合作,建立了一个假货与真实商品的数据库,以对其算法进行2年的培训,而这种过程对于稀有的老式奢侈品来说要困难得多
Entrupy开发了一种连接到智能手机的便携式显微镜,当用户拍摄并上传产品(手提包,手表等)的图片时,人工智能算法会分析每种产品特有的微观特征,并根据已知和真实产品的数据库进行验证。
数据库正在增长,但是市场上没有配套的产品。Entrupty发表的论文重点介绍了其他一些操作假设和局限性。关键思想是,与伪造者将使用的制造过程(非标准化,廉价的批量生产)相比,使用标准或指定方法制造的物体在视觉上将具有相似的特征。其次,该技术可能不适用于纳米制造的电子芯片(Entrupy显微镜无法检测到的尺寸变化)。Cypheme正在采取另一种方法。其基于墨水的技术可以用作产品上的不干胶标签,或直接印刷在标签和包装上。
它使用智能手机摄像头和神经网络进行模式识别,以根据其数据库验证特定产品的墨水图案,这意味着Cypheme必须直接与品牌制造商合作,以确保产品附带示踪墨水。它最近与欧洲领先的包装公司ARPackaging建立了合作伙伴关系,该公司与联合利华和雀巢等食品品牌合作,尽管在包装上印刷油墨可以高效地跟踪制造工厂和整个分销链中的物品,但该技术并没有做到这一点。无法进行二手购买认证。例如,买家可以从奢侈品表的包装中取出Cypheme的贴纸,然后决定在经纪人商店或在线转售。在这种情况下,除非打印是产品本身的一部分,否则无法验证真实性。面向奢侈品牌和其他高风险零售商的解决方案可能会向前发展,那就是在制造场所识别或添加唯一的指纹到实物商品,并在整个供应链中进行追踪。
进入商店,挑选想要的东西,然后走出去几乎“感觉”像是入店行窃。AI可以让真正的盗窃成为过去,而免费零售更常见。
AmazonGo取消了整个结帐流程,使购物者可以拿走物品并走出去。亚马逊尚无公开计划将其技术即服务出售给其他零售商,并且一直对运营,成功和痛点守口如瓶,只是透露它使用了传感器,摄像头,计算机视觉和深入的知识。学习算法。它否认使用面部识别算法。诸如StandardCognition和AiFi之类的初创企业抓住了机会,介入使其他零售商的AmazonGo民主化。“抢购”商店的挑战是向合适的购物者收取正确的费用。
根据全国零售联合会,由于入店行窃和文书错误等原因造成的库存损失在2017年使美国零售商损失了约47B美元。初创公司AiFi的联合创始人兼首席执行官史蒂夫·古(SteveGu)在接受AIPodcast采访时说:“偷东西就是买东西。”他在讨论拿了就走商店背后的技术。
到目前为止,AmazonGo是唯一成功的商业部署,但是成功的参数受到严格控制。当您控制谁进入商店并自动为他们收费时,最大程度地减少了有人入店行窃的可能性。
亚马逊已经建立了Prime会员基础。到目前为止,所有Go商店都仅限于会员,其他零售业务(如Kindle商店)向公众开放,仍然依赖手动结帐流程。较小的酒馆,便利店,甚至几个老牌超市都必须从头开始建立会员基础。史蒂夫·古(SteveGu)在同一播客中暗示,愿意下载该应用程序的人们可能会遇到“抢走”部分,而那些不想下载的人可能会有一个单独的结帐行。尚不清楚商店的基础设施如何同时支持这两种情况。这仍然存在销售点库存减少的问题,例如帐单错误或POS盗窃。中国的YituTechnology和东芝(拥有用于结帐的智能相机)是其中一些分别致力于收缩问题的公司。防止盗窃的复杂性取决于操作的大小和规模以及货架上产品的类型。
AmazonGo商店仅约1,800至3,000平方英尺,并使用数百个摄像头覆盖几乎每英寸的天花板空间。相比之下,传统的超级市场可以达到40,000平方英尺或更高。Go除了在货架上使用重量传感器之外,还使用摄像头进行视觉识别,目前仅提供有限的商品选择,例如预制和包装的饭盒。需要考虑的一些事情是如何利用地板空间,尤其是在拥挤的超级市场中,以确保将摄像机放置在最佳位置以跟踪人员和物品。零散的蔬菜和其他农产品每磅要收费52,这大概是依靠传感器技术,但是多个购物者从同一个纸箱中同时捡拾物品无法单独使用传感器。即使是预包装或切块的蔬菜,从一种包装到另一种包装的价格也略有不同。对于计算机视觉系统来说,服装也特别难以追踪。识别尺寸(S/M/L)并追踪容易折叠和折起的衣服是其中的一些痛点。
初创公司AiFi承诺利用现有的商店基础设施以及传感器和摄像头的组合,但StandardCognition声称完全放弃了传感器,完全依靠机器视觉。StandardCognition宣布与日本最大的CPG批发商PaltacCorporation建立合作伙伴关系,以在2020年东京奥运会之前为日本的3000家商店提供服务。据报道,AiFi拥有约20个零售客户,其中包括与纽约一家主要零售商的合同。在短期内,归结为部署成本和由于潜在技术故障造成的库存损失成本,以及零售商是否可以承担这些成本和风险。
尽管并非所有RPA都是基于ML的,但许多RPA都开始将图像识别和语言处理集成到其解决方案中。例如,WorkFusion可自动执行诸如了解您的客户(KYC)和反洗钱(AML)流程之类的后端操作。UnicornUiPath的服务已在全球700多家企业客户中使用,包括DHL,NASA和HP,涉及从金融,制造到零售的各个行业。AutomationAnywhere是RPA领域中的另一个独角兽。该公司的一项案例研究强调了与一家全球银行的合作关系,以使用机器学习来自动化人力资源管理。“IQBot”从来自多个国家和地区的多种语言的表格中提取信息,清理数据,然后自动将其输入到人力资源管理系统中。尽管RPA的概念已存在多年,但许多行业才刚刚开始克服惯性并尝试使用新技术。在其他领域,需要数字化后才能有预测分析层。
关于该主题的一些研究论文已经发表。但是最近的突破来自Facebook。根据该论文,“多语言NLP的大多数研究都集中在高资源语言上,例如中文,阿拉伯语或主要的欧洲语言,并且通常仅限于几种(大多数情况下只有两种)语言。相比之下,我们学习了93种不同语言的联合句子表示,包括资源匮乏的语言和少数民族语言”。
随着大型科技公司继续致力于改善翻译框架的资源,效率和语言能力将得到改善,并且在各个行业中的采用率将有所提高。
一个有趣的新兴趋势是使用AI本身来帮助生成更多“逼真的”合成图像来训练AI。例如,英伟达使用生成对抗网络(GAN)来创建带有脑肿瘤的伪造MRI图像。“这些结果共同为医学成像中机器学习面临的两个最大挑战提供了潜在的解决方案,即病理发现的发生率很小,以及围绕患者数据共享的限制。”—NVIDIA研究论文
AI.Reverie等早期创业公司正在开发仿真平台,以生成适用于各种行业和场景的数据集。随着技术规模和综合数据能够更准确地模拟现实情况,这将成为无法访问大型数据集的小型公司的催化剂
最近,加州大学伯克利分校的研究人员使用计算机视觉和强化学习来从YouTube视频中教授算法杂技。计算机模拟的角色无需手动注释姿势即可复制视频中的动作。
通过强化学习,模拟角色可以将其技能应用于新环境。例如,如果YouTube视频中的一个人在平坦的地面上进行了后空翻,则模拟角色可以使技能适应在不平坦的地形上进行后空翻。尽管取得了这些迅速的进步,但强化学习的采用尚未起飞,因为与当今最流行的AI范例监督学习相比,它需要的数据要多。
“考虑到当今创造的经济价值,当您从[不同的学习方法]列表中滑落时,将会迅速下降。强化学习是一类技术,与今天的实际部署相比,PR的兴奋性与比例不成比例。”—EMTECH2017年演讲,安德鲁·NG但是,对RL应用的研究正在增加。在美国专利申请的标题和摘要中进行关键字搜索显示,最近两年的活动有所增加。
机器学习的另一个新兴应用是频谱共享。政府在拍卖中将某些电磁频谱的频率许可给了Verizon等公司。美国联邦通信委员会(FCC)裁定3.5至3.7GHz频谱将在不同用户之间共享。这意味着运营商可以根据可用性动态访问共享频率。这将使他们能够根据网络需求扩大和缩小带宽。它还将向未许可自己专用频谱的小型商业用户提供频谱访问。美国海军和其他联邦机构使用3.5GHz频段的一部分。为他们提供了第一层访问权限,如果他们未使用频谱,则将访问第二层和第三层用户。诸如FederatedWireless之类的公司提供安全频谱访问(SAS),以在不同用户层之间动态分配频谱,并确保不干扰联邦信号-并利用机器学习来做到这一点。在2018年,联邦无线获得了使用ML将无线电信号分类到不同类别的专利,例如联邦信号,噪声信号和未知信号。它这样做是在遮盖联邦信号的功能的同时(这样,黑客就永远无法访问军事/国防信号的特定功能或弱点)。
DARPA希望最终从促进频谱共享的SAS播放器转移到基于ML的自动化系统。为此,它在2016年发起了频谱协作挑战赛。竞赛的参与者必须使用ML来为无线电网络提出独特的方式,让无线网络“自主合作,动态地决定如何无线电频率(RF)频谱应按时刻使用”。
DARPA还在2017年启动了一个射频机器学习系统(RFMLS)计划。类似于上述联合无线专利,DARPA希望使用ML来区分不同类型的信号,尤其是发现打算侵入终端设备的恶意信号(例如作为物联网设备)。电信运营商还准备将基于AI的解决方案集成到称为5G的下一代无线技术中。三星收购了基于AI的网络和服务分析初创公司Zhilabs,为5G时代做准备
自主物流-特别是自主的最后一英里交付-对于零售商和配送公司来说是头等大事,并且可能是我们看到完全自主权的第一个领域。自动驾驶汽车可以帮助解决在最后一英里运送货物的昂贵而艰巨的挑战,这加起来几乎是一件商品总交货成本的三分之一。
像亚利桑那州这样的拥有自动驾驶汽车自由法的州正在成为试验台。2018年6月,机器人初创公司Nuro与美国最大的实体杂货店之一Kroger合作交付杂货。Nuro旨在在附近道路上行驶,而不仅仅是像其他已开发的送货机器人和车辆原型那样的人行道。在餐厅领域,诸如Domino和PizzaHut之类的比萨公司一直处于自动驾驶汽车测试的最前沿。福特汽车正在迈阿密试行自动送货,包括比萨饼,杂货和其他商品。OEM于2018年初与包括Domino在内的70多家企业合作。
三种类型的作物监测正在农业中起飞:地面,空中和地理空间。精准农业无人机市场预计将在2021年达到$2.9B。无人机可以为农民绘制田野图,使用热成像仪监控水分含量,并确定虫害作物和喷洒农药。初创公司专注于为第三方无人机捕获的数据添加一层分析,例如塔拉尼斯(Taranis)使用第三方塞斯纳飞机来做到这一点。Taranis去年还收购了agtech-AI初创公司MavrxImaging,该公司正在开发超高分辨率成像技术以侦察和监视领域。
Taranis使用AI将田野图像拼接在一起,并识别农作物的潜在问题。农业设备制造商约翰迪尔(JohnDeere)与其他几家初创公司合作,为约翰迪尔(JohnDeere)寻求潜在的解决方案。迪尔(Deere)一直在通过AI进行自我改造。它以3亿美元以上的价格收购了BlueRiverTechnology,这是一家利用计算机视觉的农业设备公司。除其他事项外,BlueRiver正在研究“智能除草”和“看见并喷雾”解决方案。这种类型的个体作物监控可能会成为农业农药行业的主要破坏者。如果地面耕作设备通过计算机视觉变得更智能,并且仅在需要时喷洒单个农作物,它将减少对杀死附近一切植物的非选择性除草剂的需求。精确喷雾还意味着减少除草剂和杀虫剂的用量。除田间以外,使用计算机视觉分析卫星图像还可以从宏观角度了解农业实践,而地理空间数据可以提供有关全球作物分布方式以及天气变化对农业影响的信息。嘉吉投资了笛卡尔实验室(DescartesLabs),该实验室使用卫星数据为大豆和玉米等农作物开发预测模型。计算机视觉的这种应用也引起了商品交易者和政府机构的兴趣。DARPA正在与笛卡尔合作预测粮食安全。
对网络攻击作出反应已远远不够。使用机器学习主动“寻找”威胁正在网络安全中获得动力。计算能力和算法的进步正在将以前的理论破解变成真正的安全问题。根据全球公共数据泄露数据库BreachLevelIndex的数据,在2018年上半年,全球共有4.5B数据记录遭到泄露(仅供参考,2017年全年为2.6B)。
与AI的其他工业应用不同,网络防御是黑客与安全人员之间的猫捉老鼠游戏,两者都利用了机器学习的先进性来提高他们的游戏水平,并保持领先地位。顾名思义,威胁搜寻是一种主动寻找恶意活动的方法,而不是仅在发生警报或破坏后做出反应
搜寻工作从对网络中潜在弱点的假设开始,然后使用手动和自动工具以连续不断的迭代过程检验假设。网络安全中庞大的数据量使机器学习成为流程不可分割的一部分。在Linkedin上快速搜索“威胁猎人”,可显示70多个工作清单在美国的机构包括Microsoft,Raytheon,Verizon,BoozAllenHamilton和DowJones。虽然这反映了对各种业务类型的威胁猎人的新兴需求,但也表明该称号本身仍然是利基市场。“SANS2018威胁搜寻调查的结果表明,对于许多组织而言,从流程和组织的角度来看,搜寻仍然是新事物,并且定义不清……对600名受访者的调查显示,大多数搜寻组织往往是大型企业或过去一直是主要目标。”-IBM赞助的SANS2018调查。
正如SANS2018的调查所表明的,对于那些差异化因素是获取数据宝藏的大型企业来说,风险更高。
对于分诊(衡量情况的紧急性)很复杂的应用程序(如健康和保险),这仍然具有挑战性。同样,在没有视觉提示的情况下,仅通过基于语音的对话进行购物也是一项挑战。尽管从丝芙兰(Sephora)和雀巢(Nestle)到凯捷(Capgemini)的分析家和CPG品牌都将语音购物视为零售业的下一个大趋势,但它并没有取得成功。除了重新订购特定商品外,它无法提供推动在线商务的关键客户体验。精神保健是聊天机器人似乎具有潜在破坏力的另一个领域。心理健康疗法的高成本以及全天候可用的吸引力正在开创基于AI的心理健康机器人的新时代。早期创业公司专注于使用认知行为疗法(改变负面想法和行为),作为市场上许多情绪跟踪和数字日记健康应用的对话扩展。但是精神健康是一个频谱。症状存在变化,分析存在主观性,需要高度的情感认知和人与人之间的互动。尽管有成本和可及性方面的优势,但这使诸如心理保健之类的领域对于算法而言尤其困难。
随着AI生物技术初创公司的兴起,传统制药公司都在寻求AISaaS初创公司寻求适用于较长药物发现周期的创新解决方案。2018年5月,辉瑞与XtalPi建立了战略合作伙伴关系。这是一家由腾讯和Google等技术巨头支持的AI初创公司,旨在预测小分子的药物特性并开发“基于计算的合理药物设计”。但是辉瑞公司并不孤单。诺华(Novartis),赛诺菲(Sanofi),葛兰素史克(GlaxoSmithKline),安进(Amgen)和默克(Merck)等顶级制药公司最近几个月都宣布与AI初创公司建立合作伙伴关系,以发现可用于治疗从肿瘤学和心脏病学到各种疾病的新药。“我们仍处于早期阶段的最大机会是使用深度学习和人工智能来识别全新的适应症,全新的药物。”—NOVARTIS肿瘤学前首席执行官BRUNOSTRIGINI对这一领域的兴趣正在推动与AI药物研发初创公司进行股权交易的数量:截至2018年第二季度的20笔,与2017年全年持平。
当递归制药(Recursionpharmaticals)等生物技术人工智能公司同时投资人工智能和药物研发时,传统制药公司正与人工智能SaaS初创公司合作。尽管这些初创公司中有许多仍处于融资初期,但它们已经拥有众多制药客户。
在药物配制阶段成功的可衡量指标很少,但是制药公司将数百万美元押注于AI算法上,以发现新颖的治疗药物候选物并改变药物开发过程。