因为我们知道的太少。
图1:牵强附会加张图
而设计指标的目的就在于:让我们了解更多。
具体而言,通过指标数值,可以在可接受的成本下,传递足够多的信息。
中年危机老贾去医院体检,咨询身体状况如何;医生说:“还行。有点问题。问题不大。”而不是告诉他血压如何、体脂如何、血糖如何。 法外狂徒小艺被查酒驾,交警质问他喝了多少;小艺说:“没醉。喝了一点。喝的不多。”交警却没有一个血液酒精含量的指标,去判断他是否醉驾,应该作何处罚。 霸道总裁阿饼例行月会询问业绩,负责销售的副总说:“很棒。业绩很好,卖了不少。”只字不提销售总额、人均产能、业绩趋势。
倘若没有指标这个工具,我们能获得的信息,就会变得是非常有限的;或是获取信息的成本变得极高。为了更好的使用这个工具,我们首先要了解“指标”的定义是什么。
02 什么是指标?
它们的共性是什么? ——共性在于它们的载体都是数值。例如,身高180,体重154,温度26,GDP14.7万亿。 它们的差别是什么? ——差别在于它们的含义各不相同。比方说,身高180(cm)和体重180(斤)的含义是截然不同的。
当一个事实比较简单的时候,例如某个物品的轻重,我们用通过质量这一个指标就可以衡量清楚。 但当一个事实更复杂一些的时候,例如一个人的胖瘦,也许仅仅是用质量(体重)就不足以说明这个事实。这个时候我们可能会用BMI、体脂率等经过了两次抽象的指标。 当这个事实变得更加复杂,例如一个国家的经济状况,我们会用GDP,这个一个进行了很多层复杂抽象、涉及到大量数据[1]的指标。甚至是仅仅一个指标也完全不足以描述出这个事实的重要特征;这时候就要设计一整套的指标体系,来量化这个复杂的事实。
图2:事实、数据、指标之间的关系
名称:指标名称要清晰明确,避免歧义,降低沟通成本。 责任人:责任人要保证指标可维护、可运营。 含义:指标含义要描述的是“被量化的事实”;例如——这个指标是在什么场景下?为了什么目的?刻画了什么事实? 口径:指标口径要保证我们能及时地、准确地取到所需的“数值”;例如——这个指标是如何计算的?所需的数据从哪获取?获取的时效如何?
当然仅仅知道什么是指标是远远不够的,还要知道怎么去生成一个指标。
参考:
03 如何设计一个指标?
结合统计与数据治理视角,我们可以将指标的设计过程分为三个步骤:抽象、加工、限定。
图3:指标的生成过程
数据经过初步抽象,形成原子指标,即绝对数指标。例如:保费、客户数、用户量。
原子指标经过三种加工方式,形成衍生指标。例如:升学率、平均客单价、沪深300。这3种加工方式分别为:进行对比、计算统计量、指数设计(结合对比和统计计算)。
当我们对原子指标和衍生指标,进行维度限定的时候,就形成了派生指标。
图4:指标类型
这里对原子指标、相对指标以及统计量指标的使用做一个简单的介绍:
原子指标记录事实:根据指标的定义,指标是一个被定义的数值,用来对事实进行量化抽象。这个量化过程的起点是传感器、数字化等;然后是日志、记录、标签等;进入指标汇总层面的第一步就是原子指标。我们通过原子指标来记录事实,例如访问的次数、出行的距离、消费的金额等等。所以当我们需要记录一些基本事实的时候,我们设计一个原子指标来量化它们。
相对指标用于评价:我们通过原子指标,记录下了一堆的事实。紧接着,我们要做的就是对这些事实进行评价。常说“没有比较就没有伤害。”为什么没有伤害呢?因为没有比较,就很难做评价,进而我们也不知道自己是好是坏。所以当我们需要评价一些事实的时候,我们设计一个相对指标来量化它们。
当我们要评价一件事情的发展趋势的时候,我们可以用动态相对数;例如:同比、环比。 当我们要评价一件事对整体的影响的时候,我们可以用比例相对数;例如:市场占有率。 当我们要评价同一个事物在不同维度下的差异程度的时候,我们可以用比较相对数;例如:TGI、男女比例。 当我们要评价两个不同事物之间的关联的时候,我们可以用强度相对数;例如:投诉发起强度、退款发起强度。 当我们要评价计划的完成情况的时候,我们可以用完成相对数,例如:销售额完成进度。
统计数指标提炼信息:有时候,我们会有非常多的记录或指标。它们蕴含着非常多的信息,但是价值的密度却很有限。这个时候就可用通过一些统计的方式,提炼其中的信息价值。例如我们有数以千万记的用户的月均消费金额,这时候可以通过统计分位置的方式对我们客户整体的消费能力做一个刻画。
2、指标的尺度特性
不同的指标,还会具有不同的尺度特性。根据可比程度的不同,我们可以将指标划分为4个测量尺度:定比尺度、定距离尺度、定序尺度和名义尺度。
名义 尺度 | 定序 尺度 | 定距 尺度 | 定比 尺度 | |
---|---|---|---|---|
类别区别 | √ | √ | √ | √ |
次序区别 | √ | √ | √ | |
距离区别 | √ | √ | ||
比例区别 | √ |
指标尺度的特性是我们必须要了解清楚的,因为低尺度的指标不能使用高尺度的数据运算进行处理。这里举2个反例说明以下,如果没有弄清楚指标的尺度特性会导致什么问题:
在指标设计的过程中,时间是一个非常重要的因素。由于多个事实的发生时间之间的异步性,以及事实发生时间与指标计算时间之间的异步性,导致不同的时间统计口径会对指标产生重大的影响。
总的来说,我们希望指标在保证一定准确性的前提下,越及时越好。为了达成这个目标,我们需要慎重的考虑两个时间特征:“T+n”和“时间切片 v.s. 关联绑定”
1. 有效性:这个指标能不反映我们量化的事实?
3. 敏感性:事实的变化,能否被指标敏感的捕捉到,并反映出来?
4. 可运营:这个指标能否被用于日常的运营,及时的帮助我们谋求改善?
使用指标的原因:指标可以帮助我们低成本的获取更多信息。 指标的定义:指标是一个被定义的数值,用来对事实进行量化抽象。 指标设计的4个要素:名称、责任人、含义、口径。 指标设计的3个过程:通过抽象、加工、限定,我们可以将数据转化为原子指标、衍生指标和派生指标。衍生指标是原子指标经过运算的结果,派生指标是原子指标和衍生指标经过维度限定的结果。 衡量指标设计好坏的4个标准:有效性、可信性、敏感性、是否可运营。
(本文来源知乎,作者好好的分析师)
<END>
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...