个人介绍:专注大规模数据的分布式计算和传输领域,提供高效、可靠的全域数据集成解决方案;开源社区爱好者,BitSail开源项目负责人之一。
演讲题目:字节跳动数据集成引擎BitSail开源架构演进和实践
1.BitSail背景介绍
2.BitSail新功能介绍
3.BitSailCDC解决方案
4.未来展望
听众收益:
1.了解开源数据集成引擎功能特点
2.如何使用好一款开源数据集成引擎
余俊Aloudata大应科技技术副总裁
演讲题目:DataFabric在数据集成场景的实践
演讲提纲:
1.什么是DataFabric?DataFabric可以解决什么问题?
2.数据虚拟化落地实践
3.基于虚拟化技术的逻辑数据平台同传统解决方案的差异
1.了解DataFabric及数据虚拟化在实际场景的应用。
2.逻辑数仓的业务价值和技术挑战
刘波滴普科技FastData产品线DataFacts产品负责人
个人介绍:刘波,滴普科技FastData产品线DataFacts产品负责人,从事大数据开发10年+,在滴普科技负责30+个数据项目的架构设计与落地,先后主导了TOP级新零售企业的数据智能平台与互联网医疗企业的数据湖建设,目前负责一站式数据智能开发与治理平台的研发工作,聚焦湖仓一体和流批一体的架构设计及实践。
演讲题目:滴普科技数据集成产品FastDataDCT架构演进与实践
1.产品概述
2.功能介绍
3.技术架构演进
4.应用场景
5.成功案例(百丽、中石油)
1.了解DataFabric
2.通过FlinkCDC实现批流一体海量数据采集
3.数据集成产品的设计思路与实践
莫云卿腾讯高级大数据工程师
个人介绍:腾讯高级大数据工程师,腾讯云InLong奠基人,ApacheInLongPMC。
演讲主题:腾讯云Inlong实时集成应用与实践
1.数仓的复杂度
2.软件设计原则在数仓应用
3.数仓加工元模型
冯成林蚂蚁集团高级数据方案专家
个人介绍:近十年蚂蚁安全领域的工作经历,主要从事面向智能风控的数据建模、架构及产品方案的工作。
演讲题目:大宗产业风控领域的数据探索与实践
演讲提纲:基于大宗商品行业场景,从风控视角探索大数据的应用,重点介绍蚁盾安全科技服务大宗产业客户的落地实践。
1.大宗商品行业风控的特点
2.数字化在大宗传统产业的应用
3.行业的非标性对数据应用的挑战
宋志毅网易云音乐资深数据开发工程师
个人介绍:北京邮电大学本科、硕士毕业,加入网易云音乐7年,负责数据仓库内容生态数据体系建设,服务于toC和toB场景,同时负责数据仓库数据治理工作。
演讲题目:网易云音乐用户行为归因数据体系建设
1.用户行为归因面临的问题,主要介绍归因的业务背景,上一阶段的做法和存在的问题
2.归因数据体系建设当前的解决方案,主要包括埋点、模型、平台三个方面
3.未来的规划
1.归因分析主要从哪些方面来做?
2.如何做数据建设支持复杂多样的归因分析?
3.如何将归因的技术手段和业务知识结合?
4.归因实现如何做到高效、统一?
彭欢蚂蚁集团资深数据研发专家
个人介绍:14年大数据领域工作经验,先后在新浪、百度、蚂蚁任职。2014年加入蚂蚁集团,期间负责了金融线数据仓库和蚂蚁大数据治理体系的建设,最近3年重点围绕大数据的质量风险、成本治理、安全合规进行探索与实践。
演讲题目:蚂蚁集团EB级大数据治理架构与实践
演讲提纲:随着蚂蚁业务的快速发展,数据已经贯穿于每个业务场景,我们的大数据任务和服务也出现井喷式的增长,当前在蚂蚁大数据平台中,存储规模已经达到EB级、有数十万以上的数据调度任务、有3000+用户直接参与到数据开发过程中。在如此庞大且快速增长的数据规模下,加上蚂蚁金融业务对数据的强依赖和苛刻性要求,对蚂蚁数据治理体系的建设都带来非常大的挑战。
陈龙腾讯数据资产服务负责人
个人介绍:腾讯游戏大数据平台部数据资产负责人,2007年加入腾讯,负责腾讯游戏大数据实时离线数据资产建设和团队管理。目前专注于数据治理系统的建设和数据资产价值应用挖掘工作。
演讲题目:腾讯游戏数据治理最佳实践
1.腾讯游戏数据治理背景
2.资产化建设与应用
3.数据质量/成本/安全建设
4.未来方向探索
听众收益:介绍腾讯游戏数据治理平台建设思想和技术方案,阐述数据治理建设落地实践,给听众提供详细的实现和技术架构参考方案。
郭炜白鲸开源CEO,ApacheSoftwareFoundation
个人介绍:郭炜先生毕业于北京大学,现任中国通信学会开源技术委员会委员,中国软件行业协会智能应用服务分会副主任委员,全球中小企业创业联合会副会长,TGO鲲鹏会北京分会会长,ApacheConAsiaDataOps论坛主席,波兰DataOps峰会、北美BigDataDay演讲嘉宾,虎啸十年杰出数字技术人物,中国开源社区最佳33人,中国2021年开源杰出人物。郭炜先生曾任易观CTO,联想研究院大数据总监,万达电商数据部总经理,先后在中金、IBM、Teradata任大数据方重要职位,对大数据前沿研究做出卓越贡献。同时郭先生参与多个技术社区工作,Presto,Alluxio,Hbase等,是国内开源社区领军人物。
演讲题目:大模型时代下的DataOps&DataFabric
演讲提纲:大模型时代来临,对于DataOps领域产生了哪些影响?哪些Ops流程可以利用大模型来自动化解决?而大模型出现之后,又对DataOps和DataFabric产生了哪些影响?
1.DataOps如何提高大模型训练效率与质量
2.大模型促进DataFabric智能化落地
3.未来企业大模型+大数据架构与研发模式
1.大模型时代来临,对于DataOps领域产生了哪些影响?
2.哪些Ops流程可以利用大模型来自动化解决?而大模型出现之后,DataFabric是否可以从概念落地。
李成强阿里巴巴技术服务专家
个人介绍:13年数据平台实施经验,先后就职于Teradata、阿里巴巴,以架构师角色支持过零售企业、电信行业、金融企业、烟草行业等企业数据平台架构设计和系统建设,专注于架构设计、数据中台实施、阿里云产品解决方案建设。
演讲题目:阿里云DataOps数据运营中心实践
演讲提纲:通过阿里云数据运营中心的。
1.数据运营中心如何建设
2.如何盘活数据体现价值
3.阿里云云上用数解决方案
1.监管的四道风控防线
2.各保司风控关键举措
3.保司经营风险监控体系
4.新能源车风控定价模型
梁臣京东零售数据产品架构师
个人介绍:京东零售数据产品专家,先后供职于多家世界500强企业,多次主持及参与数据产品平台项目建设,在零售、金融两大领域具有丰富的数据实践经验。2020年加入京东,目前为京东零售数据可视化平台产品负责人,聚焦数据可视化分析、数据中台、数仓模型等方向,此前曾负责京东零售数据中台商业化赋能输出,成功落地多个海内外大型数据中台商业化项目。
演讲题目:京东零售数据可视化平台产品实践与思考
1.京东数据可视化平台产品能力介绍
3.数据可视化平台的挑战与展望
1.理解数据可视化平台:听众将对京东的数据可视化平台有深入的理解,包括平台的核心功能等;
2.学习平台实践经验:听众将了解如何建设数据可视化平台,以及数据可视化平台如何向业务赋能;
3.思考数据可视化平台发展:听众将对数据可视化平台的挑战、发展趋势和创新有深入的理解和思考。
陈鑫伟火山引擎DataWind技术专家
个人介绍:火山引擎智能数据洞察DataWind研发架构师,曾就职于IBM、阿里云等企业,一直从事大数据分析、数据湖等产品研发。
演讲题目:火山引擎DataWind智能化探索与实践
演讲提纲:企业级自助式BI已经逐步成为企业数据分析的标配,抖音集团作为数据驱动型企业,在内部充分践行数据民主化的理念,超过80%的员工在日常工作中能够访问和分析数据,以数据来指导决策和日常工作。大模型的崛起,给数据分析领域带来了重大变革契机。火山引擎DataWind,作为抖音集团内部统一的ABI分析平台,一直致力于通过AI能力来简化BI分析过程、强化分析能力。本次演讲,将重点介绍DataWind在智能化方面的探索与实践,主要包括以下内容:
1.火山引擎DataWind产品技术介绍
2.支持AI算子的数据建模
3.指标数据的异动检测与智能归因
4.结合LLM的数据探索与自助分析
1.了解企业级BI的通用能力及发展趋势
2.BI智能化的实践思路,包括AI建模、指标智能归因、智能数据问答等
3.了解抖音集团结合LLM在BI领域的探索应用
谭李数势科技联合创始人
个人介绍:数势科技联合创始人,服务了沃尔玛、永辉、宝洁、中金、平安等头部零售和金融企业的数智化建设,在指标体系设计、指标平台建设、数据价值化场景落地方面有丰富经验。曾任京东零售技术与数据中台总监,百度IDL高级经理。