全方位解读大数据

大数据和云计算这两个词经常被同时提到,很多人误以为大数据和云计算是同时诞生的、具有强绑定关系。其实这两者之间既有关联性,也有区别。云计算指的是一种以互联网方式来提供服务的计算模式,而大数据指的是基于多源异构、跨域关联的海量数据分析所产生的决策流程、商业模式、科学范式、生活方式和关联形态上的颠覆性变化的总和。大数据处理会利用到云计算领域的很多技术,但大数据并非完全依赖于云计算;反过来,云计算之上也并非只有大数据这一种应用。

云计算的起源可以追溯到2003年末Amazon公司工程师ChrisPinkham提交给CEOJeffBezos的一篇论文中的一个设想:将Amazon内部使用的计算基础设施开放给全世界的开发者。次年11月,Amazon发布了第一版云计算服务:SimpleQueueService。SimpleQueueService再往后发展至2006年,演变成立今天著名的AWS(AmazonWebSercice)。同在2006年,Google公司CEOEricSchmidt首次公开提出了“云计算”(CloudComputing)的这一概念,云计算也在这一年开始变得广为人知。

从数据量的角度来看,在电子商务模式出现以前,传统企业的数量增长缓慢。传统企业的数据仓库中的数据大多数来自于交易型数据,而交易这种行为处于用户消费决策漏斗的最底部,这就决定了交易前的各种浏览、搜索、比较等用户行为数据的都量远远超过交易数据。电子商务模式使得企业可以采集到用户的浏览、搜索、比较等行为,这就导致企业的数据规至少提升了一个数量级。现在日益流行的移动互联网以及将来会流行的物联网又必将使数据量提高两三个数量级。从这个角度来讲,大数据时代是必然会出现的。

从IT产业的发展来看,第一代IT巨头大多是2B的,比如IBM、Microsoft、Oracle、SAP这类传统IT企业;第二代IT巨头大多是2C的,比如Yahoo、Google、Amazon、Facebook这类互联网企业。一个有意思的现象是:大数据时代前,这两类公司彼此之间基本是井水不犯河水,我们很少看见这两类公司的老板们在一起坐而论道;但在当前这个大数据时代,这两类公司已经开始直接竞争。比如Amazon已经开始提供云模式的数据仓库服务,直接抢占IBM、Oracle的市场。这个现象出现的本质原因是:在互联网巨头的带动下,传统IT巨头的客户普遍开始从事电子商务业务,正是由于客户进入了互联网,所以传统IT巨头们不情愿地被拖入了互联网领域。如果他们不进入互联网,他们业务必将萎缩。所以第三代IT巨头可能会是2B与2C融合的IT公司。

2)大数据的核心内涵

大数据概念虽然非常火爆,但少有人真正理解大数据的核心内容。一个普遍而且严重的误解就是:大数据=数据大,即大数据就是量大的数据。事实上,除了数据量大这个字面意义,大数据还有两个更重要的特征:

1)跨领域数据的交叉融合。相同领域数据量的增加是加法效应,不同领域数据的融合是乘法效应

2)数据的流动。数据必须流动,流动产生价值

对于第1)点,百分点推荐系统研究中心实验结果显示:百分点公司有3家客户,分别是从事服装、化妆品和箱包销售的电商,百分点向这3家客户提供个性化商品推荐服务,即:百分点挖掘用户的偏好,不同的用户上同一家电商网站时,向他们展现不同的服装、化妆品或箱包,从而提高电商的转化率和客单价。我们做过两种测试:

a)将每家网站的数据隔离。当每家网站自身的数据量增加到以前的4倍时,推荐效果大约能提高5%;

b)将三家网站的数据在去除敏感信息之后进行某种融合。融合后的数据大致是与单家网站的数据的3倍,比第一种情况数据量还少。但利用融合后的数据进行数据挖掘时,推荐效果能提升30%,而且推荐商品并未发生变化,仍然是:用户上服饰类网站时只看见服装、上化妆品网站时只看见化妆品、上箱包网站时只看见箱包。

解释得详细一点,上述实验说明:对同一个消费者,如果我们要向其推荐服装。第一种方法是我们根据他过去的4次购买服装的行为来预测其下一次可能会购买的服饰;第二种方法是我们根据他过去分别购买服装、化妆品和箱包的各1次行为来预测其下一次可能会购买的服饰。两种方法的基于的用户行数分别是4次和3次,但第二种方法的效果明显更好。

3)大数据的应用领域

大数据的起源要归功于互联网与电子商务,但大数据最大的应用前景却在传统产业。一是因为几乎所有传统产业都在互联网化,二是因为传统产业仍然占据了国家GDP的绝大部分份额。

哪些传统企业最需要大数据服务呢至少有3类企业:

1)对大量消费者提供产品或服务的企业

2)做小而美模式的中长尾企业

3)面临互联网压力之下必须转型的传统企业

第1)类企业都需要利用大数据精准分析不同消费者的偏好,提高营销和服务的质量;第1)类企业都需要利用大数据分析精准定位自己的客户群;第3)类企业主要指哪些正在遭受来自互联网的新玩家冲击的传统企业,此类企业自然都需要利用互联网和大数据作为自我进化的工具。当然,第3)类企业与前2类企业有重叠。

具体来讲,中国最需要大数据服务的行业就是受互联网冲击最大的产业,首先是线下零售业,其次是金融业。

受电商的冲击,国内很多零售巨头都增长严重放缓,甚至遭遇负增长,线下零售已经到了不得不变革的危机关头。我们也看到了银泰百货、王府井百货、万达集团这些具有创新意识的传统巨头开始利用互联网和大数据来改造线下商业。其中银泰百货以手机为载体、利用O2O方式进行双线数据挖掘的创新非常值得借鉴。

而金融行业就更加特殊:金融业并不销售任何实体商品,它自诞生起就是基于数据的产业。由于国家管制,金融业在前几年享受了非常好的政策红利,内部变革动力不足。而目前金融业已经逐渐开始放松管制,新兴的金融机构必将利用互联网以及大数据工具向传统金融巨头发起猛烈攻击。而传统金融机构在互联网方面的技术积累和数据积累都不足,要快速应对新进入者的挑战,必然需要大数据服务。我们也看到了中信银行信用卡中心、招商银行信用卡中心已经在开始利用互联网大数据进行创新。

那么传统产业需要什么样的大数据服务呢这主要包括3层:

1)基于大数据的行业垂直应用。每个行业都有自己的特点,所以自然会存在行业应用的需求;

2)顾客标签与商品标签的整理。不管什么行业,都需要精细化整理自己顾客的属性标签以及商品属性标签,而且这些标签必须能够细化到单个顾客和单个商品。标签是行业应用的基础;

3)企业内部和外部数据的整合与管理。要给顾客和商品打标签,首先必须整合企业内部和外部数据,尤其是日益重要和庞大的外部数据。

图:传统企业需要的大数据服务

第3层和第2层的方法相对比较通用,行业特殊性相对较少。百分点已经在第3层和第2层做出了比较成熟的产品,并且也开始在第1层做出了一些具体的行业应用产品,比如针对服饰行业的时尚服饰搭配系统。

4)大数据的发展方向

大数据产业未来会向什么方向发展随着数据逐渐成为企业的一种资产,数据产业会向传统企业的供应链模式发展,最终形成“数据供应链”。拿钢铁产业来讲,铁矿石公司从矿场中挖出矿石,经过粗加工,卖给钢铁企业;钢铁企业再进行精细一点的加工,将板材、钢条卖给下游制造业公司;这些制造业公司做出汽车、飞机、门窗、电脑等产品卖给下游公司。这个产业链中存在找矿、运输、加工等诸多环节,每个环节都有对应的企业。

图:传统企业的供应链

在“数据供应链”中,存在数据、数据整合与挖掘工具以及数据应用这3大环节。数据就好比矿场的矿石;数据整合与挖掘工具就好比钢厂的冶炼炉;而精准营销、服饰搭配等数据应用就好比汽车、电脑等可以出售给消费者的产品。企业在数据供应、数据整合与挖掘、数据应用等所有环节都需要专业的服务。这里尤其有两个明显的现象:

1)外部数据的重要性日益超过内部数据。在互联互通的互联网时代,单一企业的内部数据与整个互联网数据比较起来只是沧海一粟;

2)能提供包括数据供应、数据整合与加工、数据应用等多环节服务的公司会有明显的综合竞争优势。

5)什么样的大数据企业会胜出

常有大数据从业者以及投资人和我们探讨一个问题:大数据产业中,什么样的企业会最终胜出这是一个很难回答的问题,而且即使回答了,三五年内可能都无法判断其正确性。但从“数据供应链”中的各个环节来分析,还是可以得出一些具有参考价值的结论。

1)数据供应。在互联网没有流行的时代,企业做数据仓库、商业智能、数据挖掘等系统时采用的数据基本都来自于企业内部,企业几乎无法获取外部数据,所以很少有专业的数据供应商。互联网改变了这一局面,将来会有专业的数据供应商。但既然是因为互联网的出现导致了数据供应商的出现,那么反过来数据供应商就必须具有很强的互联网基因;

2)数据整合与挖掘。数据挖掘工具供应商在非互联网时代就早已存在。但互联网时代使得企业的数据量激增、数据类型发生极大变化(不同于传统的来自于单一领域的结构化数据,互联网数据以跨域的非结构化数据为主),传统的数据挖掘工具供应商的技术和方法已经很难适应。要跟上时代的变化,数据挖掘技术与工具应用商必须具备互联网公司的海量数据处理和挖掘的能力;

3)数据应用。具体的行业应用与传统行业的业务关系密切,要做好行业应用,最好需要有服务传统行业的经验,了解传统行业的内部运作模式。这时候仅仅具有2C经验的互联网基因的公司又稍显不足。

综合起来看,如果一家大数据从业公司同时兼备互联网数据获取能力、互联网技术、互联网执行力,又有做2B服务的经验,那么这家公司将比较容易取得领先优势。这个结论其实一点也不奇怪:如本文开篇所述,大数据本来就是互联网与传统产业碰撞时的产物。

用“方兴未艾”这个词来形容大数据产业的发展阶段都还为时过早,目前的大数据产业只能说是小荷才露尖尖角。国内企业在第1代IT产业(硬件和软件产业)中是明显落后国外企业的;在第2代IT产业(互联网产业)中,国内企业已经与国外企业差距不大甚至在很多方面超过了国外企业;希望在第3代IT产业(云计算和大数据)浪潮中,国内企业能够完全赶上并且超过国外企业,我们也认为这是很有可能的。

THE END
1.大数据51CTO.COM51CTO-大数据话题包括大数据相关的最新资讯、前沿技术、使用技巧、应用案例等内容,涉及数据分析、数据可视化、商业智能、Hadoop、Spark、数据湖、数据仓库、等领域。https://bigdata.51cto.com/
2.大数据导航大数据工具导航199IT大数据导航它能整合多种硬件和软件平台,包括Arduino、Raspberry Pi、ioBridge/RealTime.io、Electric Imp、移动和互联网应用、社交网络及MATLAB数据分析工具。除了开源版本外,它还提供一项托管版服务。 GE Digital Augury Samsara 财经&经济大数据 更多 Yodlee Premise Data Plaid System2 ...http://hao.199it.com/
3.国家工业互联网大数据中心基于大数据基础能力,为用户提供拖拽式、可视化、集成化Web IDE界面及程序部署发布、权限配置、任务执行流程编排、任务执行调度等基础能力 数据总线 即席查询 作业仓库 任务调度 立即查看 AI中台 提供了AI平台研发能力,AI服务部署能力等,包含实验平台、Notebook、快速学习、数据标注、模型管理、服务管理、用户与权限管理、运...https://www.caiicloud.com/
4.(互联网)大数据是什么其实我们谈到大数据,包括很多大数据的书籍都会讲到这个趋势,就是大数据使我们深入了解每一个人。第二个趋势是“智能化”。智能化在整个大数据发展中起到非常重要的作用,因为智能化技术是一个有很多应用的底层技术。第三个趋势是“产业化”。比如:互联网+、工业4.0等一系列思想都和这个有关,也可以把产业化理解得更...https://www.jianshu.com/p/9d3c6e6fe88f
5.大数据与互联网金融的关系未央网当前互联网和大数据行业有一个非常热门的话题,就是大数据和互联网对整个金融行业带来的变革,很多人说大数据和互联网可能对整个金融行业带来是颠覆性,毁灭性,也可能是其他。亿赞普集团副总裁黄苏支在分享了大数据与互联网金融结合带来的机遇和挑战的同时表示,互联网的信用实时评级是传统金融行业所不具备的,颠覆了传统的基...https://www.weiyangx.com/1755.html
6.大数据技术对互联网的影响互联网的大数据是来自人们的使用习惯,人们经常浏览网络、网络购物、网络社交等留下的信息都会被大数据的收集工具所收集,并上传到数据处理平台进行数据处理。 互联网的大数据是来自人们的使用习惯,人们经常浏览网络、网络购物、网络社交等留下的信息都会被大数据的收集工具所收集,并上传到数据处理平台进行数据处理。而今天...https://www.qianjia.com/zhike/html/2020-06/11_25361.html
7.长尾关键词挖掘站长工具智能改写5118通过对排名各类大数据挖掘,提供关键词挖掘,行业词库,站群权重监控,关键词排名监控,指数词,流量词挖掘工具等排名工作人员必备百度站长工具平台https://www.5118.com/
8.茅台集团董事长袁仁国:将互联网思维与大数据融入企业生产他表示,把互联网思维,大数据融入到企业战略及生产经营中,利用3—5年时间建设大数据茅台,加强与消费者的无缝连接,形成茅台全球化的制造、交易、互动全产业链,多元化拓展等大数据平台,让茅台的优质数据持续企业最重要的数据资产,不断提升核心竞争力,产业竞争力,品牌影响力,市场占有率。https://news.cctv.com/2016/05/25/ARTI9a1kl2WUkSDcUTBLsB8r160525.shtml
1.艾瑞网艾瑞网聚合互联网数据资讯,融合互联网行业资源,提供电子商务、移动互联网、网络游戏、网络广告、网络营销等行业内容,为互联网管理营销市场运营人士提供丰富的产业数据、报告、专家观点、行业数据库等服务,打造最具影响力的互联网数据资讯聚合平台。https://www.iresearch.cn/
2.今天我们来了解一下互联网大数据毫无疑问,现如今是属于大数据(Big Data)的,革命性的时代。从社交媒体到企业,每时每刻都在产生大量的数据。无所作为,从而把这样的宝藏白白浪费掉是及其愚蠢的。企业已经学会了收集大数据以获取更高的利润,并提供更好的服务以及更深入地了解其目标客户。 https://www.xinzhangwang.com/article/473
3.生活里的大数据与互联网互联网大数据为省团生活带来了诸多优势和机遇。通过充分利用互联网大数据,省团可以更好地了解用户的需求和偏好,为他们提供个性化的推荐和定制服务。互联网大数据还可以帮助省团进行市场预测和策划,提高我们的市场竞争力。相信在互联网大数据的支持下,省团生活一定能够为广大成员带来更加丰富、便捷的生活体验。http://chatgpt.cmpy.cn/article/4728651.html
4.大数据:发展现状与未来趋势我国互联网大数据领域发展态势良好,市场化程度较高,一些互联网公司建成了具有国际领先水平的大数据存储与处理平台,并在移动支付、网络征信、电子商务等应用领域取得国际先进甚至领先的重要进展。然而,大数据与实体经济融合还远不够,行业大数据应用的广度和深度明显不足,生态系统亟待形成和发展。 http://app.jxsrrd.gov.cn/?action=show&app=article&contentid=7408&controller=article
5.互联网大数据(精选八篇)摘要:在信息化时代下互联网已经成为了商业活动的重要承载平台, 在互联网覆盖面及影响面不断扩增的情况下使得传统商业活动模式发生了极大的变革, 其中融资领域自然也受到了影响。这种变革促进了融资业的发展并且通过构建融资平台为受众带来了更高质量的服务, 而高质量服务的背后必然需要相关技术支持。本文对互联网大数据技...https://www.360wenmi.com/f/cnkey8jv3n4s.html
6.互联网大数据什么意思互联网大数据指的是一段时间以内通过多种渠道收集大量的信息,其中包括用户的爱好、购买倾向、出行方式、吃饭习惯、消费方式、社交软件使用等,然后将这些数据整理成有用的数据,这些数据资源与以前的数据来说,具有明显的新的特征。 互联网大数据什么意思 名词解释 ...https://m.36kr.com/p/1337260624566531
7.互联网时代,一起来了解大数据是什么–互联网知识–中企动力大数据是什么呢?大数据又称为巨量资料,指的是具有更强的决策力、洞察力和流程优化能力的海量信息资产,进行大数据分析,可以取代传统的抽样调查。大数据总有大量、高速、多样、价值四大特点,今天就带大家详细来了解一下颠覆我们生活的“互联网大数据”。 目录https://www.300.cn/zhongqizhijia/chengxuyuan/580.html
8.互联网大数据是什么?大数据的特点主要有什么?行业动态随着科技的不断发展,互联网已经成为我们生活中不可或缺的一部分。在互联网不断普及的过程中,互联网大数据也随之产生,它的出现为我们的生活和工作带来了极大的便利。那么,互联网大数据到底是什么呢?它又具有哪些特点呢?本文将从定义和特点两个方面对互联网大数据进行详细阐述。 https://www.wanqiao.cn/col_spzx/202311/8BAD57F8E8C8AB099A05F4C65FBF0C0C.htm
9.解构芝麻信用:互联网+大数据模式下的征信2、互联网大数据征信:广泛、多维、实时 图2 互联网+大数据征信模式的意义 首先,征信人群覆盖广泛,可作为征信体系有效补充。人民银行征信中心在征信数据方面做得非常出色,有效地解决了信用风险问题,帮助金融行业持续健康发展,大大提高了金融的获得性。同时我们也看到,目前只有不到4亿人在央行征信系统有信用记录,还有很多...http://jetstor.net/nd.jsp?id=47
10.工业互联网赋能千百行(大数据观察·数说新跨越)时政“自工业互联网创新发展战略实施以来,我国工业互联网发展稳步推进,部分重点任务和工程超出预期。目前国家工业互联网大数据中心已形成覆盖京津冀、长三角、粤港澳大湾区、成渝双城经济圈的体系化布局,汇聚约29亿条工业互联网数据,覆盖约703万家企业。”鲁春丛说,也应看到,与发达国家相比,我国工业互联网发展水平仍有较大提...https://www.workercn.cn/34196/202112/29/211229071736895.shtml
11.互联网行业大数据平台解决方案互联网行业用户建设智能大数据平台,传统做法是将业务数据库做集成,形成简单的数据仓库,然后按业务需求,提供数据展示等服务。但随着业务系统增多,业务数据多样化,传统做法在数据存储、数据管理、决策,以及系统运维等方面面临挑战。曙光大数据平台是结合大数据、人工智能技术的海量数据智能分析处理解决方案。帮助互联网用户快速构...https://www.sugon.com/solution/details?id=76
12.大数据技术PPT大数据技术ppt模板下载蓝色科技简约商务大数据云计算PPT模板 蓝色大数据人工智能科技风科技创未来商务通用PPT模板 科技风大气智慧养老互联网大数据人工智能物联网动态PPT模板 蓝色紫色渐变大数据引领未来科技风大数据云计算ppt模板 蓝色简约大数据引领未来科技风大数据云计算ppt模板 蓝色科技风互联网大数据产品介绍商业计划书ppt模板 ...https://www.51miz.com/so-ppt/1637466.html
13.大数据与互联网的关系大数据的专家维克托·迈尔-舍恩伯互联网移动通信、物联网的发展,数据不断爆炸式的增长,人类进入了大数据时代。作为继云计算,IT产业的又一次新技术、颠覆性革命,无论是芝麻开门般的财富奇迹,还是对人们生活的影响。大数据不断地被提及,更是成为了影响当今世界创新的重要知识点。 https://blog.itpub.net/29829936/viewspace-1467943/