阿里云DataWorks基于多种大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。
学习如何在DataWorks进行简单的大数据分析操作,了解DataWorks的数据分析能力。
操作难度
低
30分钟
使用的阿里云产品
所需费用
DataWorks:
产品版本:阿里云为您提供了免费的基础版DataWorks。
开通大数据开发治理平台DataWorks。
在弹出的购买试用DataWorks产品的面板上选择开通地域为华东2(上海),勾选服务协议后单击确认订单并支付。
准备MaxCompute环境。
在弹出的新建项目配置页面中配置项目信息,核心配置参数如表所示。
参数
说明
项目名称
自定义项目名称。本教程设置为doc_test_000。
项目名称需全局唯一,如果界面提示您项目名称已存在,您可根据提示修改项目名称。
计算资源付费类型
本教程选择:按量付费。
您通过免费试用选购的资源抵扣包仅可用于抵扣后付费资源消耗,本教程选择“按量付费”。
默认Quota
用于实现计算资源分配。本教程选择:默认后付费Quota。
单SQL消费限制
数据类型
MaxCompute数据类型包含1.0数据类型、2.0数据类型和Hive兼容类型。本教程选择:2.0数据类型。
是否加密
本教程选择:不加密。
完成配置后单击确定,完成项目创建。
本教程使用的地域为华东2(上海)默认工作空间。
进入管理中心页面。
完成配置后单击完成创建,完成数据源的增加。
单击左侧导航栏的大数据体验>公共数据集,单击阿里电商数据集,进入阿里电商数据集详情页。
单击右上角的开始分析,选择您需要体验的引擎类型。本教程使用的是MaxCompute。
完成设置后,您即可在SQL文件中进行数据查询命令开发,完成后可单击SQL查询文件操作栏中的运行按钮,运行成功后,在SQL文件下方会显示查询结果。
首次操作时你需要先单击我要体验,并根据界面提示开启增强分析对应的功能。
单击右上角的创建报告,根据界面提示选择需要生成报告的数据分析结果卡片。
配置数据分析报告页面内容与主题风格,完成后单击右上角的创建,完成报告创建。
SETodps.namespace.schema=true;SELECTitem_categoryas商品品类ID,COUNT(DISTINCTitem_id)AS商品数量FROMbigdata_public_dataset.commerce.commerce_ali_e_commerceWHEREbehavior_type='4'groupbyitem_categoryorderby商品数量desclimit10;清理完成教程后,请及时清理测试数据和试用资源。
MaxCompute资源清理。
DataWorks资源清理。
本教程使用了免费的基础版DataWorks的SQL分析模块,基础版DataWorks的SQL分析任务运行结束后不会收取其他费用,如果您使用了DataWorks的其他功能模块,使用了DataWorks的资源组运行了其他周期任务,请及时将DataWorks周期任务暂停,避免造成资源组的浪费。