说明:
我们已进入数据时代,众多以数据为核心的工作也在开展中,基于我国的特点,众多专家都认为数字经济将是中国实现跨越式发展重要的机遇,确实,在数据经济上能看得出来国家是很重视的,各项举措都在有条不紊的推进过程中。但,目前就作者观察,数据工作,问题还很多,其中,传统理念的束缚成为最大的障碍,导致众多工作是错误的。这个问题,对于数据工作者需要在具体工作中持续研究和反思,否则,开展的时间越久,改正的机会越小,难度也越大,更有甚之我们会失去数据时代的先前优势(正确的数据,历史越长,价值越大,持续错误就毫无意义)。
本文就以作者的角度,从近期工作中获得的一点感悟给大家做个分享,希望借此做个提醒。
数据工作的首要任务是:保障数据的质量,而不是数量和速度
数据的意义和价值,不言而喻,开启数据工作,培养数据思维也就成为首要工作,基于此,抢进度、比数量的风气成为数据工作的一个趋向,作者在众多的行业报告甚至是国家层面的报告中都隐约看到这样的趋势,这是数据工作前期阶段必然的情况,也是中国人开展一项新工作最熟悉的套路和打法。但,仔细想一想不难发现,数据工作中,数据质量是第一位的,没有数据质量的数量和速度,只能带来更大的麻烦。我想这一点,从业者很容易理解,没有质量保障的海量数据无异数据垃圾场,价值很小,甚至会产生污染。
保障数据质量的方法是,“法治”而绝对不能是“人治”
数据的物质性《》,信息技术、数据技术产生和发展,都是自然发展的必然,客观性、关联性、真实性、自然性,才是质量数据、价值数据应该有的样子,设计性、操控性、误导性的数据害人害己,没有任何价值。所以,用自然的法则(道法自然)进行数据工作才是正确的,相信自然的客观性要远远大于人(人的不确定,会导致数据的不确定性,而不确定的数据往往价值很小)。在具体落实上就需要全面分析数据产生、生产过程等方面的自然法则,才能做出正确的设计,而不至于又走向人主导的流程主线上。
落实数据工作“法治”的核心是:自驱、自验证、自清洗
自然法则就是自我发展,自我验证和自修正,在必要的时候进行自我清洗,这种进化过程才最真实、最客观、最有效,才最能保障数据的质量。
自驱:数据产生的意义是为了数据主人带来价值,数据质量越高,数据主人的价值也越大,否则,数据主人得不到价值的前提下还有可能丧失信用,在这样的逻辑下,数据主人必然对数据质量负责任,时刻提醒自己进行数据质量的保障
自验证:正所谓检验真理的唯一标准是实践,产生的数据只有在实际应用过程中才能判断其质量,所以,数据处理过程中需要增加处置点,在顿挫中彼此验证数据的质量,检验多了,正确率自然能提高很多
自清洗:错误的数据会有放大作用,其污染性是很强的,所以,清除掉哪些错误的数据,对数据价值保障是意义重大的。而,清洗错误数据的方法就是在多方验证过程中是错误的数据,必须增加数据清洗处置点,并且反馈给数据主人,反思流程和逻辑,并进一步优化
落实数据工作“法治”的另外一个维度:数据法治化,流程人治化
数据是资产,是真金白银,是需要明确的权力和责任保障的,这一点就需要依赖“法治”框架(法->制度),而数据的相关业务流程,还是人的流程的,所以“人治”化是ok的。在这个维度上讲,法治数据、人治流程,相辅相成,以此为基础保障数据和流程的解耦、法治和人治的解耦,才能保障数据最终价值的实现。
最后要说:
目前我们的数据工作还有很多差距,目前情况看,很多思路和方式都是错误的
正确的数据工作应该坚守法治而不是人治,这一点需要正确认识
法治的核心是遵守自然的特性,消除人不确定带来的影响,在实际操作上将数据和流程解耦,并在必要环节上增加数据处置点,在顿挫间实现数据自验证和自清洗
数据工作的差距有很多方面,本文仅是给出一个方面,希望大家打破传统思维理念,多思考,多实践,这样在数据时代才更有价值
顺祝大家:五一节快乐!
祝思考的人、永远践行的人:节日快乐!
【注:以上仅是作者肤浅认识,仅供参考!】
来源:与智慧做朋友
作者:李志勇 ( 微信号:qichelaba )
声明:文章中部分图例来源于网络,版权并不属于作者
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...