今天的介绍分为五个方面:
1. 指标体系概述
2. 业务痛点和指标体系的解决方式
3. 指标体系的搭建方法
4. 小米的最佳实践
5. 总结与展望
分享嘉宾|王浩 小米 高级软件研发工程师
编辑整理|苏基宗
内容校对|李瑶
出品社区|DataFun
01
1. 指标体系的定义
首先,指标体系需要分两个方面来讲:一方面是指标,指标是对业务单元进行细分后的度量值,用于对业务进行描述、度量和拆解,是对业务量化的过程,以评价业务的好与坏; 另一方面是体系,由不同的维度组成。光有指标是不够的,还需要通过不同角度(维度)去思考业务,不同的维度最终构成了一个体系。
业务痛点和指标体系的解决方式
业务视角:业务上主要面临两个问题,一是数据出口多,指标不统一,需要反复确认业务口径和反复核对数据;二是系统多、平台多,各种各样的系统中存放了各自割裂的数据。 技术视角:技术上主要面临三个问题,一是指标定义和命名混乱,不同的技术人员和业务部门的理解和定义的指标不一致;二是指标生产,因为系统多,不同的团队都在建设自己的指标,导致指标重复建设、混乱;三是指标消费,指标出口不统一,输出口径不一致。 产品视角:目前没有一个产品能把整个数据流,从业务系统到数据仓开发、到指标管理、到BI 可视化展示全链路可见和管理。
03
指标体系的搭建方法
1. OSM 模型
2. MECE 法则
“相互独立”意味问题的细分需要在同一个维度上,并有明确的区分、不可重复; “完全穷尽”则意味着全面、完整,没有遗漏和缺失。
二分法:二分法在日常生活中比较常见,其实就是把事物分成 A 和非 A 两个部分,如“白天、黑夜”、“男人、女人”、“国内、国外”、“内部、外部”等; 流程法:按照事情发展的时间、流程、程序,对过程进行逐一的拆解,例如,小米销售业务涉及五个环节仓储、销售、物流、售后、客服; 要素法:主要用于事物由哪些要素(或部分)组成,把一个整体分成不同的构成部分。但是,在拆解要素时要保持维度的一致性,否则有可能出现有重叠和遗漏的问题,比如某图书馆可以按楼层这个维度来划分:一楼、二楼、三楼; 公式法:按照公式设计的要素进行分类,公式若成立,那么要素的分类就符合MECE 原则。比如 GMV=客流量X客单价; 矩阵法:把事物按二维矩阵进行分类或划分,例如说时间管理中常用的紧急且重要、紧急不重要、不紧急但重要、不紧急也不重要的分类方法就是典型的矩阵法。
小米的最佳实践
1. 小米指标体系建设-实现路径
模型设计:根据 MECE 原则划分数据域,采用维度建模方法构建核心模型; 数仓建设:按照统一数据架构和规范,构建稳定安全的集团数仓; 指标管理:建设统一的数据字典,保障口径统一。实现快捷找数,高效用数; 数据应用:基于统一指标,快捷搭建看板,快速共享,实现高效数据消费。
2. 小米指标体系建设-模型设计
高内聚和低耦合:包括业务特性和访问特性。业务特性:将业务相近或相关的数据设计为一个逻辑或者物理模型;访问特性:将高概率同时访问和低概率同时访问的数据分开存储; 核心模型与扩展模型分离:建立核心模型与扩展模型体系。核心模型应包含被多个业务高频访问的字段;扩展模型应包括个性化或少量业务访问的字段; 公共处理逻辑下沉及单一:底层公用的处理逻辑应在底层进行封装与实现,避免暴露给应用层;同一个公共逻辑避免在多处同时存在; 成本与性能平衡:适当的数据冗余可换取查询和刷新性能,不宜过度冗余与数据复制; 数据可回滚:处理逐辑不变,在不同时间多次运行数据的结果需确定不变; 一致性:相同的字段在不同表中的字段名必须相同; 命名清晰可理解:表命名规范需清晰、一致,表命名需易于下游的理解和使用。
3. 小米指标体系建设-集团数仓建设
总结与展望
小米目前数据开发(数据工场)->指标管理(数据百科)->数据分析 (数鲸 BI) 全链路已经打通,通过数据血缘加工链路全链路可见;
指标体系建设方法论和工具已经在小米内部进行推广使用,覆盖公司核心业务板块、55 个数据域、520 个核心原子指标,方法论和工具会持续迭代实践。
分享嘉宾
INTRODUCTION
王浩
小米
高级软件研发工程师
小米数据中台部集团销服数仓负责人,专注数仓建设、指标体系建设等领域。
<END>
数据学堂
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...