全文共 5828 个字,建议阅读8分钟
导读:数据目录可以为公众提供一个清晰、有序的数据视图,帮助用户快速找到和理解所需的数据。这对于促进数据的有效利用和推动数据驱动的决策具有重要意义。
一、范围
本标准规定了数据目录梳理、数据目录审核和数据目录管理等阶段的要求。本标准适用于公共数据目录的编制,企事业单位可参照本文件执行。为规范开展重庆市公共数据目录编制工作,特制定本指南。
各市级部门、各区县依法履行职责和提供公共服务过程中产生的公共数据(除涉密数据)都应纳入数据目录编制范围,有数字化应用支撑和无数字化应用支撑的公共数据,原则上都应该编制数据目录。
二、术语和定义
下列术语和定义适用于本标准。
(一)数据
是指以电子或者其他方式对信息的记录。
(二)公共数据
政务数据和公共服务数据统称公共数据。
政务数据:是指国家机关和法律、法规授权的具有管理公共事务职能的组织(以下称政务部门)为履行法定职责收集、制作的数据。
公共服务数据:是指医疗、教育、供水、供电、供气、通信、文旅、体育、环境保护、交通运输等公共企业事业单位(以下称公共服务组织)在提供公共服务过程中收集、制作的涉及公共利益的数据。
(三)元数据
定义和描述其他数据的数据。
(四)数据目录
通过对公共数据资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个公共数据资源的特征,以便于对公共数据资源的检索、定位与获取。
三、编制方法
数据目录编制包括数据目录梳理、数据目录审核、数据目录管理三个方面,如图1所示:
数据目录梳理:开展本部门数据目录梳理,具体梳理内容参照4.2章节;
数据目录审核:对梳理的数据目录进行整理、汇编、审核,形成数据目录;
数据目录管理:对形成的数据目录进行分类、发布和更新。
图 1 数据目录编制流程图
(一)有数字化应用支撑的公共数据
各市级部门、各区县应依据本单位应用开发过程中产生的规范性文档,如《建设方案》《软件需求规格说明书》《数据库设计说明书》《用户手册》等,编制数据目录。
1.状态为“运行中”的数字化应用
各市级部门、各区县在依法履行职责和提供公共服务过程中获取的公共数据资源,以及法律、法规规定纳入公共数据管理的其他数据资源必须编制数据目录。不采集、不产生公共数据的数字化应用,如宣传性质的微博/微信公众号类、不产生公共数据的硬件类、仅存储或交换公共数据的工具类可不编目;过程数据、日志数据,可不编目。
2.状态为“建设中”的数字化应用
“建设中”的数字化应用,应根据本单位应用开发过程中产生的设计文档,编制数据目录;上线运行前需按照“运行中”的数字化应用数据目录编制方法进行目录复核,未完成不予验收。
3.状态为“停用”的数字化应用
无历史数据的“停用”数字化应用,经过本级数据主管部门审核后可不编目;若有历史数据且历史数据不再迁移,应编制数据目录;若“停用”数字化应用已经迁移整合,应同步迁移数据目录。
(二)无数字化应用支撑的公共数据
各市级部门、各区县在依法履行职责和提供公共服务过程中获取的纸质、电子表格等基础材料,需进行分类汇总和结构化处理后编制数据目录。
四、数据目录梳理
(一)梳理范围
数据目录梳理范围包括行业主管部门统建的数字化应用、本部门自建的数字化应用和未建数字化应用的公共数据。
(二)梳理要素
数据目录梳理应保证数据目录要素完整、内容规范准确。数据目录梳理内容包含以下要素:
a)数据资源统一编码;
b)数据资源名称;
c)数据资源提供方;
d)数据资源摘要;
e)数据资源格式;
f)数据所属领域;
g)所属应用;
h)数据敏感级别;
i)更新频率;
j)发布时间;
k)修改时间;
l)数据项描述:
1)数据项名称;
2)数据类型;
3)数据长度;
4)字段描述;
5)共享属性;
6)共享条件;
7)开放属性;
8)开放条件;
9)是否主键;
10)是否可为空;
11)是否字典项。
(三)梳理模版
数据目录梳理模板和填写说明见附录A。
(四)梳理要求
涉及行业主管部门统建的数字化应用,本部门应将行业主管部门已编制的数据目录直接纳入;涉及本部门自建的数字化应用,应结合数字化应用开发过程中产生的规范性文档辅助进行梳理,如《软件需求规格说明书》、《数据库设计说明书》等;涉及未建数字化应用的公共数据,应结合业务涉及的材料、表单等进行梳理。
五、数据目录审核
(一)部门审查
各数据资源提供方应根据本单位业务条线分别设置专人对本单位的数据依据附录A的A.1数据目录梳理模板进行审查,主要审查数据目录是否覆盖本单位核心业务或应用、元数据是否规范、要素是否完整准确等,对于不符合要求的数据目录进行整改。汇总、整理、审查后提交至本级数据主管部门。
(二)大数据主管部门审核
各级大数据主管部门对各部门提交的数据目录依据附录A的A.2各项要素填写说明进行数据目录的全面性、完备性、准确性进行审核,如果发现不符合要求的,应退回数据资源提供方整改。
六、数据目录管理
(一)数据目录分类
1.应用场景分类
根据数据应用场景分类形成基础库目录、主题库目录和应用领域目录等,具体分类和说明见表 1。
表 1 应用场景分类
分类 | 说明 |
基础目录库 | 包括自然人综合库目录、法人基础数据库目录、自然资源和空间地理基础数据库目录、电子证照基础数据库目录、信用信息基础数据库目录等。 |
主题库目录 | 包括基层智慧治理、渝康码、渝快融、乡村振兴、营商环境等。 |
应用领域目录 | 包括科技创新、商贸流通、社会救助、城建住房、教育文化、工业农业、机构团体、地理空间、资源能源、市场监管、生活服务、生态环境、交通运输、安全生产、社保就业、医疗卫生、信用服务、公共安全、财税金融、气象服务、法律服务、疫情防控、其他。 |
2.目录层级分类
根据目录层级分类形成市级目录和区县目录,具体分类和说明见表 2。
表 2 目录层级分类
分类 | 说明 |
市级目录 | 包括党委、人大、政府、政协、法院、检察院、企事业单位、民主党派、工商联及群众团体等市级部门数据目录。 |
区县目录 | 包括各县区数据目录。 |
3.共享属性分类
根据目录共享属性分类形成无条件共享类目录、有条件共享类目录和不予共享类目录,具体分类和说明见表 3。
表 3 共享属性分类
分类 | 说明 |
无条件共享类 | 可以提供给各政务部门共享使用的政务数据资源。 |
有条件共享类 | 可以提供给部分政务部门共享使用或者仅能够部分提供给各政务部门共享使用的政务数据资源。 |
不予共享类 | 不宜提供给其他政务部门共享使用的政务数据资源。 |
4.开放属性分类
根据目录开放属性分类形成无条件开放类目录、有条件开放类目录和不予开放类目录,具体分类和说明见表 4。
表 4 开放属性分类
分类 | 说明 |
无条件开放类 | 除有条件开放类和不予开放类的其他公共数据。 |
有条件开放类 | 需要按照特定条件提供给数据利用主体的公共数据。 |
不予开放类 | 涉及国家秘密、商业秘密、个人隐私和国家安全,以及其他不宜提供给数据利用主体的公共数据。 |
(二)数据目录发布和更新
1.数据目录发布
各级大数据主管部门应将本级审核、分类后的数据目录及时发布,形成本级数据目录。
2.数据目录更新
各级政务部门、公共服务组织,应做好本部门数据目录的更新与维护。
表A.2 数据目录梳理模板填写说明
填写要素名称 | 说明 | ||
1.数据资源统一编码 | 定义 | 数据目录的唯一不变的标识字符。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,由系统自动生成;参照《政务信息资源目录编制指南(试行)》确定的代码结构规则,代码结构由前段码、后段码组成。 | ||
2.数据资源名称 | 定义 | 缩略描述数据目录内容的标题。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,手工填报;业务类数据目录命名为XXX信息,该类数据含数字化应用、数据库、报表、业务办理记录、业务情况等业务信息;证照类数据一般对应为目录下有两张表,一部分是证照信息表,一部分是证照的版式文件;地理信息类数据命名为XXX地理信息,该类数据为地理位置信息;其他类命名规则如数据名称涉及主表、子表、附表、X 月、正本、副本等在数据名称后添加括号表示,同部门同名数据若内容确实为不同数据,且需要加以区分的,在前面加上数字化应用名称简称作为前缀,用“-”连接数字化应用名称与数据名称。 | ||
3.数据资源提供方 | 定义 | 提供公共数据的部门。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,由系统自动绑定;该公共数据部门的规范简称。 | ||
4.数据资源摘要 | 定义 | 对公共数据内容(或关键字段)的概要描述。 | |
数据类型 | 字符型。 | ||
建议 | 必选项;系统自动生成后,再人工调整。 | ||
5.数据资源格式 | 定义 | 公共数据存在方式(可多选)。数据资源提供方应尽可能提供可机读的电子格式及相关软件版本信息,如只有纸质介质,应尽量提供电子扫描格式。数据格式,可采用但不限于:电子文件的存储格式为 OFD、wps、xml、txt、doc、docx、html、pdf、ppt 等; 电子表格的存储格式为et、xls、xlsx等; 数据库类的存储格式为 Dm、KingbaseES、access、dbf、dbase、sysbase、oracle、sql server、db2、mysql、PostgreSQL等,同时应明确具体的数据库表结构定义(可细化至“数据项描述”元数据中);图形图像类的存储格式为jpg、png、jpeg、gif、bmp等;流媒体类的存储格式为swf、rm、mpg等;自描述格式,由提供方提出其特殊行业领域的通用格式,如气象部门采用的“表格驱动码”格式。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;按定义的多种格式选择确定。 | ||
6.数据所属领域 | 定义 | 说明公共数据所属领域分类的信息。包括科技创新、商贸流通、社会救助、城建住房、教育文化、工业农业、机构团体、地理空间、资源能源、市场监管、生活服务、生态环境、交通运输、安全生产、社保就业、医疗卫生、信用服务、公共安全、财税金融、气象服务、法律服务、疫情防控、其他。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;按定义的数据所属领域分类进行选择确定。 | ||
7.所属应用 | 定义 | 公共数据所在的数字化应用名称。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;若该公共数据无数字化应用管理产生,应填“无”。 | ||
8.数据敏感级别 | 定义 | 描述结构化数据内容的敏感程度,包括1级(公开数据)、2级(受限数据)、3级(敏感数据)。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;按定义的数据敏感级别进行选择。 | ||
9.更新频率 | 定义 | 标明公共数据归集的频率,包括分钟级、小时级、每日、每周、每月、每季度、每半年、每年、不定期等。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择。 | ||
10.发布时间 | 定义 | 数据资源提供方发布该数据目录的时间 | |
数据类型 | 日期型,格式为YYYY-MM-DD HH:MM:SS | ||
建议 | 必选项,系统生成。 | ||
11.修改时间 | 定义 | 数源单位最新修改该数据目录的时间 | |
数据类型 | 日期型,格式为YYYY-MM-DD HH:MM:SS | ||
建议 | 必选项,系统生成。 | ||
12.数据项描述 | 12.1 数据项名称 | 定义 | 描述结构化数据中具体数据项的标题。适用于格式为数据库、电子表格类等的公共数据。 |
数据类型 | 字符型。 | ||
建议 | 必选项,手工填报;描述电子表格、数据库,以及具有结构化数据内容资源中的各数据项(字段)标题,采用中文表示,一般较为常用的像ID、IP这样的英文专有名词可采用英文表达,英文字母应使用大写,其他情况下不应出现英文表达(英文非必填项)。名称应简洁明了,数据项中涉及的字典项或特殊说明可在字段描述中进行描述。根据数据属性,关键数据项不应缺失,如涉及人员的信息应提供相对应的证件类型、身份证据号码等数据项;涉及法人主体的信息应提供相对应的统一社会信用代码、企业名称等数据项;涉及电子证照数据应按照国家证照目录规范要求提供相应数据项;全市范围的数据,应有地区字段。 | ||
12.2 数据类型 | 定义 | 标明该数据项的数据类型,包括:字符型C、数值型N、货币型Y、日期型D、日期时间型T、逻辑型L、备注型M、通用型G、双精度型B、整型I、浮点型F等。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;对应“数据项名称”逐一描述其数据类型。 | ||
12.3 数据长度 | 定义 | 标明该数据项在计算机中存储时占用的字节数,适用于结构化数据(数据库类、电子表格类)。属于数据库类的,数据长度即该数据项对应的字段在数据库中的指定长度或默认长度;属于电子表格类的,估算该数据项内容字数的上限,并折算成字节数,该字节数即为数据长度。 | |
数据类型 | 字符型。 | ||
建议 | 可选项,手工填报;对应“数据项名称”逐一描述其数据长度。 | ||
12.4 字段描述 | 定义 | 对重要数据项的含义进行解释、描述。 | |
数据类型 | 字符型。 | ||
建议 | 可选项,手工填报。 | ||
12.5 共享属性 | 定义 | 标明公共数据的共享属性,包括无条件共享类、有条件共享类、不予共享类三类。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;对每个数据项按定义的共享属性进行选择确定。 | ||
12.6 共享条件 | 定义 | 描述不同共享类型公共数据的共享条件。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,手工填报;手工填报;有条件共享类的公共数据,应注明使用要求,包括作为行政依据、工作参考、共享条件和共享范围,用于数据校核、业务协同等;对于不予共享类的公共数据,应注明相关的法律、行政法规或党中央、国务院政策依据。 | ||
12.7 开放属性 | 定义 | 标明公共数据的开放属性,包括无条件开放类、有条件开放类、不予开放类三类。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,界面选择;涉及个人、企业隐私的数据项不应对外开放,如身份证号码、联系电话等。 | ||
12.8 开放条件 | 定义 | 描述不同开放类型公共数据的开放条件。 | |
数据类型 | 字符型。 | ||
建议 | 必选项,手工填报;有条件开放类的公共数据,应注明使用要求,包括作为行政依据、工作参考、开放条件和开放范围,用于数据校核、业务协同等;对于不予开放类的公共数据,应注明相关的法律、行政法规或党中央、国务院政策依据。 | ||
12.9 是否主键 | 定义 | 标明该数据项是否为数据表的主键,包括“是”和“否”,主键是数据表中的一个或多个字段,用于唯一地标识表中的某一条记录。 | |
数据类型 | 字符型。 | ||
建议 | 可选项,界面选择;一条数据目录应有一个及以上主键,已归集公共数据不应更换主键、增加主键和删除主键。 | ||
12.10 是否可为空 | 定义 | 标明该数据项是否可以为空,即该字段是否为必填。包括“是”和“否”。 | |
数据类型 | 字符型。 | ||
建议 | 可选项,界面选择;按该类数据的业务理解,关键数据项不应为空,涉及自然人的应有姓名和身份证号,且不应为空;涉及法人的应有名称和统一社会信用代码,且不应为空。 | ||
12.11 是否字典项 | 定义 | 标明该数据项是否为字典项,包括“是”和“否”。 | |
数据类型 | 字符型。 | ||
建议 | 可选项,界面选择; |
据统计,99%的数据大咖都关注了这个公众号
👇
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...