鲲云科技是一家技术领先的人工智能芯片公司,由定制计算芯片领域的国际权威、英国皇家工程院WayneLuk陆永青院士、牛昕宇博士和蔡权雄博士等联合创立,致力于提供高性能、低延时、高算力性价比的下一代人工智能计算平台,加速人工智能技术在智慧城市、智能制造、智能遥感、安监生产、自动驾驶等领域的落地。
鲲云科技聚焦于采用数据流架构的AI计算引擎,依托主创团队自1991年来近三十年的技术积累,其自主研发的CAISA架构在支持深度学习通用算法的同时发挥最高95.4%的芯片利用率,在同等峰值性能下,提供远超于指令集芯片的实测算力,架构效率超过国际芯片水平。针对数据流架构开发的端到端编译工具链RainBuilder在保持高算力的同时,无缝链接TensorFlow、Caffe、PyTorch、ONNX(MXNet)等多种主流框架,简单易用,支持ResNet、YOLO、DeepLab等多种算法模型,通用支持绝大多数主流深度学习算法。鲲云一方面基于自主研发的人工智能芯片,提供一体化计算平台,降低人工智能落地成本。另一方面,鲲云提供与CAISA芯片配套的领域落地方案,降低鲲云计算平台落地门槛与使用难度。
目前鲲云科技已与多家行业巨头达成战略合作,成为英特尔全球旗舰FPGA合作伙伴,在技术培训、营销推广以及应用部署等方面进行合作;与浪潮信息达成战略签约,加速数据流AI计算产业化落地;与戴尔科技集团签署战略合作备忘录,为边缘和数据中心提供更优质的人工智能计算平台解决方案;与山东产业技术研究院共同成立山东产研鲲云人工智能研究院,推动高性能AI计算加速产业的落地和发展。明星产品“星空”、“雨人”加速卡已在航空、航天、电力、安防、教育、工业检测、智慧城市等领域落地。自2016年成立至今,鲲云科技已经完成了天使轮,Pre-A轮、A轮及A+轮融资,设有深圳、山东、伦敦研发中心。2018年成立人工智能创新应用研究院,定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速落地,启动鲲云高校计划,开展人工智能课程培训和科研合作。除与Intel合作进行人工智能课程培训外,鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、北京航空航天大学、天津大学、香港城市大学等成立联合实验室,在定制计算、AI芯片安全、工业智能等领域开展前沿研究合作。
I创始团队
(1)牛昕宇博士
鲲云科技创始人兼CEO,鲲云人工智能应用创新研究院执行院长,中国航天-帝国理工中英人工智能联合实验室常务副主任、帝国理工人工智能定制计算研究组负责人,欧盟FP7和英国EPSRC等专项负责人,中国电机工程学会人工智能专委会委员,全国输配电技术协作网技术专家,深圳市人工智能行业协会专家委员会成员,“中国科学技术协会创新创业科技先锋”“粤港澳大湾区优秀创业青年”“2017年度商业影响力新锐人物”“2018中国商业最具创意人物”“2018新经济年度人物“,2020福田区改革创新大会“先进个人”奖,“中国人工智能年度十大风云人物”。
曾获欧盟科研影响力奖、帝国理工杰出成就奖、桑坦德银行奖,并获得FCCM、ASAP最佳论文提名2项,欧盟HiPEAC委员会最佳论文2项,国际核心期刊和会议论文发表30余篇,发明专利7项,国际专利1项。带领鲲云研发的人工智能芯片“星空”、“雨人”已成功应用到航天、航空、电力、智慧城市等多个领域。
(2)WayneLuk陆永青院士
鲲云科技联合创始人兼CSO、帝国理工学院教授,英国皇家工程院院士、美国电子电气工程师学会(IEEE)会士、英国计算机学会(BCS)会士,中国人工智能产业创新联盟专业委员会主任及鲲云人工智能应用创新研究院院长。
ACMTRETS创刊主编,定制计算领域学术会议FPT、FPL创始人,ASAP、FCCM、FPL、FPT、HEART指导委员会委员,曾任英国皇家工程院杰出访问学者评选委员会委员。作为可重构计算及现场可编程技术领域的国际知名学者,陆永青院士在国际学术期刊、国际学术会议上发表500余篇论文,获得国际专利2项,出版学术著作3册。
(3)蔡权雄博士
曾任IMAGINATION瑞典硬件部门主管,有4次成功的芯片流片经验,包括领导PowerVRWizardGR6500实时光线跟踪GPU设计团队。所有芯片已经产品化。曾任瑞典爱立信芯片工程师,负责5G芯片的顶层设计和实现。曾任Axel异构计算系统架构师和项目负责人,设计64节点FPGA-GPU-CPU大规模异构计算系统的性能状态检测、载荷平衡、硬件性能优化软件。曾任FPGA-Cube项目负责人,研发支持单板卡64颗FPGA芯片,8板卡并行计算图像处理算法。
(4)肖梦秋
鲲云科技联合创始人兼CMO,负责公司整体经营管理和市场战略。负责公司的融资管理,协助公司完成pre-A轮、A轮及A+轮融资,并对接投后管理和新一轮投资人关系。
(5)熊超博士
鲲云科技合伙人兼研发总监,帝国理工博士,主导算法和编译器产品开发。深度学习视觉领域专家,曾任360深度学习算法科学家,师从国家千人计划特聘专家颜水成教授。发表国际会议论文3篇,国际期刊3篇。
(6)王少军博士
鲲云科技合伙人兼COO,鲲云人工智能应用创新研究院副院长,负责整体商务运营和产品化落地。伦敦帝国理工学院计算系访问学者,FPT2016国际会议程序委员会联合主席,PHM2017国际会议出版主席,IEEEACCESS期刊副主编,ACMTRETS期刊客座副主编,多个国际期刊及国际会议的审稿人。
II核心技术
1.定制数据流CAISA架构
(定制数据流CAISA架构)
2.端到端自动编译工具链RainBuilder
要实现更快的AI应用落地,满足不同算法开发的需求,需要一个可以兼容各类算法框架和方便快捷实现算法到硬件写入的编译工具。为了降低使用门槛,鲲云提供端到端编译工具链RainBuilder,它是一款基于CAISA架构的深度学习算法编译工具链,兼容TensorFlow、Caffe、PyTorch、ONNX(MXNet)等主流开发框架,开发者只需两步,即可实现神经网络模型推演在鲲云AI加速卡上的高效部署及运行。依托于CAISA架构的高性能特性,RainBuilder提供从算法模型到芯片级产品部署的一整套开发套件。该套件主要由RainBuilderCompiler、RainBuilderRuntime和RainBuilderDriver三部分组成,其中RainBuilderCompiler包含了一系列命令行接口,支持主流AI开发算法模型的智能解析、自动化量化压缩、节点融合、内存优化,并将模型转化为适用于CAISA架构的中间表达和数据。RainBuilderRuntime以Compiler生成的中间表达和数据为输入,为用户提供了丰富易用的开发接口以完成对底层AI硬件的高效应用,提供性能模型分析、精度验证、自动线程调度等功能模块。RainBuilderDriver支持CAISA硬件架构驱动、硬件模块计算调度以及硬件模型分析,能够自动进行细粒度性能优化及调度。
(RainBuilder端到端自动编译工具链)
RainBuilder通用性高,支持ResNet、YOLO、DeepLab等多种CNN类算法模型,使用过程简单便捷,用户无需对于底层硬件有深入的了解,即可直接通过基于C++/Python的标准开发流程实现算法落地。从训练好的模型文件,只需两步,即可实现整个神经网络的推演。第一步,调用RainBuilderCompiler的命令行接口完成模型的离线准备,对于一个模型,该步骤只需进行一次。Compiler提供了一套端到端的优化流程,包括模型解析、冗余节点裁剪、节点融合、模型量化压缩等。第二步,用户只需编写针对特定算法的前后处理函数,RainBuilderRuntime会自动完成算法模型对于CAISA架构的高效调用。RainBuilderRuntime中包含了大量针对CAISA架构的深层优化,如硬件资源调配、运行时资源调度、软硬件并行、异常处理等。另外,RainBuilder通过支持用户自定义算子实现了对于不同算法的高拓展性。用户只需根据提供的接口即可完成自定义模块的实现,RainBuilder会自动将自定义算子整合进计算图中,并针对其特点完成相应的计算优化。
III核心产品
鲲云科技推出基于自主研发定制数据流CAISA架构的一系列AI加速产品,包括全球首款数据流AI芯片CAISA,以及面向边缘端、数据中心进行深度学习推断的AI专用计算加速的星空加速卡X3和NA-100c。星空加速卡芯片利用率实测高达95%以上,具高性能、低延时、高算力性价比的特性。定位于高性能AI推断加速,星空加速卡兼容TensorFlow、PyTorch、Caffe、ONNX(MXNet)等主流框架,可简单快速实现AI算法模型到硬件上的无缝迁移,充分体现其高算力性价比、高通用性和高软件易用性。目前星空加速卡已应用于航空航天、教育、研发、安防、电力、工业等领域。
CAISA
作为全球首款采用数据流技术的AI芯片,CAISA芯片搭载了四个CAISA3.0引擎,峰值性能可达10.9TOPs,可实现最高95.4%的芯片利用率,满足不断增长的边缘侧和IDC算力需求,为客户提供更高的算力性价比。CAISA芯片具有良好的通用性,可支持所有常用AI算子,通过数据流网络中算子的不同配置和组合,支持ResNet、YOLO、DeepLab等主流CNN算法。
(1)星空加速卡NebulaAcceleratorX3
星空加速卡X3是一款面向边缘端、数据中心进行深度学习推断的AI专用计算加速卡,基于鲲云自主研发的定制数据流架构CAISA3.0,搭载全球首款数据流AI芯片,提供10.9TOPS算力,最高可实现95.4%芯片利用率。星空加速卡X3采用PCIe3.0x8接口,可与X86架构、Arm架构服务器兼容。用户可通过RainBuilder编译工具链将TensorFlow、PyTorch、Caffe、ONNX(MXNet)等框架开发的算法模型无缝部署到星空加速卡X3上,为支持深度学习的数据中心及边缘服务器提供高性能、低延时、高通用性、高算力性价比的计算加速方案。
(2)星空加速卡NebulaAcceleratorNA-100c
星空加速卡NA-100c是一款面向边缘端、数据中心进行深度学习推断的FPGA计算加速卡,基于鲲云自主研发的定制数据流架构CAISA3.0,最高可实现94%的芯片利用率。星空加速卡NA-100c采用PCIe3.0x8接口,无需额外供电。用户可通过RainBuilder编译工具链将TensorFlow、PyTorch、Caffe、ONNX(MXNet)等框架开发的算法模型无缝部署到星空加速卡NA-100c,为支持深度学习的数据中心及边缘服务器提供高性能、低延时、高通用性、高算力性价比的计算加速方案。
IV应用案例
1.智慧城市
鲲云为城市运营监控、安防布控领域提供特种车管理、违规商贩管理、共享单车管理、环卫工人管理、城市人流分析等应用提供高性能AI计算加速,为智慧城市边缘和后端数据中心提供算力支持。
2.智能制造
鲲云为智能制造提供基于深度学习的AI计算加速方案,满足PCB、3C、电子元器件、显示面板、汽车零部件、纺织印染、皮革、太阳能电池板等领域AOI(自动光学检测)设备的AI智能化升级需求,实现复杂外观的缺陷检测、OCR、元件计数和特征定位等典型AI应用落地。
3.智慧电力
鲲云为电力作业场景中鸟巢、绝缘子、三角板、防震锤、杆塔倒伏、园区内安全帽、着装等检测应用提供高性能AI计算加速,提高检测效率。
4.智能安监
鲲云为工地管理提供人员着装、越界动作、异常聚集、危险区域闯入、生产机械运行状态、施工现场火焰、烟雾、消防通道等安全监控所需的高性能AI计算加速,有效预防不规范作业引起的安全事件,保障生产过程中人员和场地的安全。
5.航天
鲲云为遥感领域中语义分割、图像识别等应用提供高性能AI计算加速,在城市规划、森林防火、海域检测等领域发挥作用。
6.航空
V鲲云研究院
深圳市鲲云人工智能应用创新研究院,由人工智能定制计算国际权威、鲲云科技联合创始人WayneLuk陆永青院士发起,旨在通过自主芯片研发,建立全球第一个基于中英国际合作,以人工智能芯片领域最新技术为基础,降低人工智能芯片在应用领域落地门槛的开放平台。研究院定位于建立人工智能产业化技术平台,支持人工智能最新技术在各垂直领域快速落地,填补平台底层硬件支撑空缺。其技术平台将与人工智能应用层的开放平台形成协同作用,提供基础计算资源,加速培育国内自主产权的人工智能生态系统,融合全球顶级高校、人工智能行业领域龙头资源、产业基金,建立研、产、融相结合的一体化人工智能生态平台。鲲云人工智能应用创新研究院已同帝国理工学院、哈尔滨工业大学、天津大学、北京航空航天大学、香港城市大学等成立联合实验室;并在香港大学、香港科技大学等知名高校开展AI暑期学校活动,内容涵盖临床医学、量子力学、深度学习等前沿研究领域;此外,鲲云人工智能应用创新研究院启动的鲲云高校计划CUP(CorerainUniversityProgram)与全球高校实现了AI领域的深度合作。
山东产研鲲云人工智能研究院,是由山东产业技术研究院与深圳鲲云信息科技有限公司合资成立的一家专注于AI产业技术的新型研发机构,主要基于鲲云自主研发的全球首款数据流人工智能芯片与应用技术开展研发推广工作,旨在通过推动数据流计算加速技术在智能遥感、智慧城市、智能制造等领域的落地,推进山东省及国内外制造业与产业技术的人工智能升级,在山东建立人工智能产业生态,加速自主产权的人工智能计算技术应用落地。
鲲云官网:
鲲云社区:
深圳:福田保税区长富金茂大厦14层075588917937
上海:浦东新区纳贤路800号科海大楼3层02160554988
山东:中国(山东)自贸试验区济南片区港兴三路未来创业广场3号楼14层053188994380