标准定制

依据国家相关标准,研究制定政务大数据运营管理中心和大数据平台建设急需的标准规范,包括总体标准、管理标准、数据标准、服务标准及安全标准等方面的标准体系的建立,为政务大数据工程建设提供支持与服务。

数据梳理

目录编制

资源编目

对各部门资源目录进行统一编目、标准化制作与确认,形成部门资源目录。

资源目录注册、审核、发布

对部门资源目录进行ETL处理,在资源目录平台导入相关成果。

数据治理

数据治理检测主要是对各级部门的数据源数据、已经接入大数据中心数据、基础库等按照大数据治理检测标准对进行完整性、一致性、准确性、及时性质量检测。

数据库注释补全

按照政务大数据建设标准对目前数据库字段、注释等信息进行补全,以符合数据库字段信息的完整性和未来业务的可扩展性要求。

数据归集

按资源目录核对部门数据源,建立维护机制;核对部门前置库数据源,配置完善表及字段信息;注释中含字典内容的字段进行字典处理;整理资源对应的字典信息,编辑入库;对可结构化的电子表格资源进行编辑和数据入库处理;处理文件类型资源,规整文件名称上传文件资源。

基本清洗

通过数据库字段的补全对现有数据全列去重、主键去重,实现数据的初步清洗和提治理。

字典转换

字典转换是对必要的数据进行数据字典转码,使数据符合数字典的规范要求。

高级清洗

高级清洗使得数据清洗更贴近业务,主要是对相关业务的数据项目进行数据清洗比对,对重复的业务数据进行去重、外键关联和数据的补全等,完成数据的校验、纠错、更新工作。

数据建模

人口基础数据库建设,以现有的常住人口和流动人口基础信息为基础,逐步整合公安、计生、社保、民政、教育、卫生、统计等部门与人相关的基础信息,建成标准统一的全市人口基础数据库,涉及常住人口、流动人口、特殊人群(如失业、低保、残疾、社区矫正、刑释等)等自然人信息。
  法人基础数据库是以统一社会信用代码为唯一标识,涵盖工商企业法人信息、市编委办机关事业单位法人、市民政局社团法人等法人信息,以市工商局、质监局、国税、地税等部门现有法人数据为基础,加强信息共享交换,通过确定信息比对规则,对法人基本信息的历史数据进行批量比对和数据纠错,保证法人基础信息在各主要管理部门的一致性和唯一性,推动数据资源综合利用,从而建立包含核心基础信息和法人扩展信息的数据库模型,并统筹整合接入市工商局、编办、民政局、税务、食药监、安监、公安、商务局等相关部门数据。
空间地理基础数据库是用于描述对象的位置、形状、大小和分布特征等方面信息,适用于描述二维、三维和多维分布的关于位置的现象。不仅包括对象本身的空间位置及状态信息,还包括表示对象的空间关系的信息。属性数据为非空间数据,用于描述对象的性质,对空间对象进行语义定义。结合内/外网络、内/外坐标等属性,将空间地理信息库分互联网版和政务版。
社会信用信息库建设,按照先完善部门信用信息数据库再进行共享交换的模式,各行业部门建设和完善本部门信用信息数据库,以各行业部门信用信息数据库为基础,按照国家统一要求,以规范的社会信用代码制度为标准,逐步推进政务诚信、商务诚信、社会诚信、司法公信等信用基础信息库建设。
全面整合和采集发展改革、财政、税收、投资、消费、出口、物价等方面的年度数据、月度数据、普查数据和专题数据,收集产业经济、地区经济和世界经济的基本运行数据信息,实现宏观经济管理部门的互联互通和信息共享,为政府、企业和社会公众提供权威的、基础性的数据支持。
按照企业、市民为服务对象,梳理、汇聚、组织、整合、关联企业相关的电子证照,实现各部门电子证照库之间的互联互通、资源共享,并建立证照库中证照数据的更新机制,支撑电子证照跨部门应用。

数据服务

将数据资源业务化,将跨部门业务共性的需求封装成能力,进行统一服务、自助挖掘、API服务、标签、图谱等提供等多种模式的数据支撑能力,实现数据“不出中心”解决各部门多样化应用的需求,同时规避数据安全风险。