数据标准是个什么鬼?听了他这番话醍醐灌顶
发布时间:2022-11-08 11:03:31 所属栏目:大数据 来源:
导读: 小菜是亿信华辰刚入职两天的实习生,外向的他很快和前辈们熟络了,这天他在去茶水间的路上顺便瞅了一眼旁边前辈的电脑,见前辈正在整理数据标准管理系统需要改的bug需求。小菜心里就开始嘀咕:“数据,我知
|
小菜是亿信华辰刚入职两天的实习生,外向的他很快和前辈们熟络了,这天他在去茶水间的路上顺便瞅了一眼旁边前辈的电脑,见前辈正在整理数据标准管理系统需要改的bug需求。小菜心里就开始嘀咕:“数据,我知道是什么意思。标准,我也大概能明白,但是整合到一起——数据标准?这是个什么鬼?“ 一、什么是数据标准 自己苦思不得,从茶水间回来后小菜终于忍不住了。 小菜:“哥啊,这个数据标准是什么啊?” 前辈:“数据标准就是数据的标准呗,就是给数据一个统一的定义,让各系统的使用人员对同一指标的理解是一样的。” 二、为什么数据标准很重要 小菜听到和自己心里想的差不多,不屑的说:“定义就定义呗,有那么重要吗?” 前辈:“因为啊......”,前辈看到小菜满脸的不屑,“那你说说,你觉得对一个银行来说,它的客户是什么?” 小菜:“啊,客户不就是办了他们银行卡的人么?” 前辈:“那我也可以认为是在他们的银行网站注册过、或者通过这个银行转账的人都是客户呀。” 小菜瞬间明白了,原来如果数据没有一个标准,那么人与人之间的理解就不一样,有时为了确定自己的理解是否有误就会询问其他人,这个人如果也不清楚又会再找别人来确定,无疑增加了沟通成本,而且有时技术人员偷懒连问都不问,那可能就与需求有所偏差,导致项目的结果与业务需求相差甚远,就很麻烦了。 前辈看到小菜恍然大悟的表情,哈哈大笑:“这下你知道数据标准的重要性了吧!现在这个大数据时代啊,数据应用分析项目特别多,如果数据本身存在非常严重的问题,如数据统计口径不统一,数据质量参差不齐,数据标准不统一等,往往会影响到项目正常交付,甚至后续数据应用和战略决策。因为在整个项目实施过程时,应用系统之间需要上传下达、信息共享、集成整合、协同工作。没有数据标准,那不乱成一团了嘛。 三、为什么要有亿信华辰数据标准平台 小菜狂点头:“是的是的,知道了。”但是马上又疑惑了:“那就成文规定一下,让使用人员都清楚明白不就行了,还非得搞个平台?” 前辈:“成文规定一下?大数据耶,数据多如牛毛难找得很大数据标准,我们这个数据标准平台啊,有一套统一的数据命名、数据定义、数据类型、赋值规则等的定义标准,还能提供搜索功能,帮助客户快速找到标准。而且你想啊,你认为标准定了就定了,你就能保证不会更改?还保证它一直有用?你就能保证别人都是按着这个标准来的?” 小菜脸一红,挠挠头:“哇,我确实没想到那么多,原来有这么多的用处啊,哥,你再多讲讲呗!” 看到这小子这么好学,前辈的兴致也来了:“为了保证数据的正确性,我们还提供审批流程,建立好的标准要先发布再审批,标准确定后还要让这个标准能被实际落实,也就是需要被参与数据治理的各个平台所使用。为了评估各系统是否按照数据标准进行实施的,我们还有落地评估功能,先将已定义好的标准与元数据(与数据有关的数据)那边进行映射,再通过评估找到问题数据进行整改,以保证制定出的数据标准被正确使用,发挥它的作用。” ”那数据标准什么时候会变呢?“小菜继续追问。 前辈:”数据标准不是一成不变的,比如企业在拓展新业务的时候就需要增加相应的标准,另外对于没有价值的标准也要及时废弃。当然了,这就需要我们对数据标准不断进行改造,让标准满足现有业务。我们的数据标准平台对每个版本修改都做了管理,以便于持续维护改进,方便问题查找。而且为了直观的查看标准的变化情况,这个平台还提供了数据标准监控模块,以图表的形式,直观的展现三个月内标准各方面的变化情况,实时监控。” 小菜听到这里,激动地挥动双手,感叹到:“原来数据标准不仅仅是一套共同使用和重复使用的规范,而是通过一套由管理规范、管控流程、技术工具共同组成的体系逐步实现信息标准化的过程啊,牛!” 四、怎么建立数据标准 小菜:“说了这么多,那怎么建标准呢?需要填写什么信息呢?” 前辈:“不同类别的数据标准可能需要设置不同的信息,所以在建立标准之前呢,我们可以先建个标准集,对标准进行分类,设置其需要填写的属性,每个标准集都可以自定义属性。而且我们除了有单条新建标准的方法,即在新建标准页面设置标准属性值然后保存即可,也支持从excel文本中导入在表格中编辑好的标准到系统中,还提供了标准文档管理,你可以上传和管理任何格式文档的标准。另外还支持从元数据拾取生成数据标准,用户选择元数据及元数据下的字段信息,设置元数据属性与数据标准属性的对应关系,自动获取元数据属性信息填充到标准中,形成标准。” 前辈看了看表:“你感兴趣的话可以去公司的官网上看看数据治理相关内容,刚才我们讨论的数据标准,其实就是数据治理中的重要环节。想做大数据治理,首先要把数据标准做好,否则匆忙建设各种数据仓库、数据集市,最后发现标准有问题,质量不高,这时候再去建数据标准就会导致投资浪费问题。我们的数据治理管理平台睿治有9大产品,从元数据、主数据、数据标准、数据质量再到数据处理、数据资产、数据交换和数据安全,可以打通数据治理的整个流程。所以了解数据标准的同时也该了解一下数据治理,你慢慢看吧,小伙子,我先去吃午饭啦。” 嗯哼,听君一席话,胜读十年书。前辈离开后,留下若有所思的小菜,默默地打开亿信华辰官网(点击阅读原文),仔细研读数据治理专题页面克了...... 关于亿信华辰 亿信华辰是中国专业的智能数据产品与服务提供商,一直致力于为政企用户提供从数据采集、存储、治理、分析到智能应用的智能数据全生命周期管理方案,帮助企业实现数据驱动、数据智能,已积累了8000多家用户的服务和客户成功经验,为客户提供数据分析平台、数据治理系统搭建等专业的产品咨询、实施和技术支持服务。 (编辑:草根网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐


浙公网安备 33038102330473号