|
〔关键词〕 开放政府数据 数据质量 质量问题 质量管理 脏数据
〔摘 要〕 数据质量是影响开放数据价值生成的关键因素。本文采用网络调查和数据分析 方法,对 13 个开放数据平台中的数千个数据集进行分析,归纳出 29 类“脏数据”,统计了北京、 上海和哈尔滨三地的数据质量问题分布情况。文章建议在引进“数据清洗”和“质量检查”环节、 采用标准规范等方面借鉴先进经验,提升和保障数据质量。
参考文献:
1.McKinsey Global Institute. Open Data: Unlocking Innovation andPerformance with Liquid Information[EB/OL].[2018-04-20]. http://www. mckinsey.com/business-functions/digital-mckinsey/our-insights/open- data-unlocking-innovation-and-performance-with-liquid-information. 2.Ubaldi B. Open Government Data: Towards Empirical Analysis of Open Government Data Initiatives[J]. OECD Working Papers on Public Governance, 2013(22):1-60. 3.OGP. Aligning Supply and Demand for Better Governance: Open Data in the Open Government Partnership.[EB/OL].[2018-04-20]. https://www.opengovpartnership.org/irm/irm-reports. 4. 樊文飞 , 弗洛里斯·吉尔茨 . 数据质量管理基础 [M]. 北京: 国防工业出版社,2016. 5. 杜岳峰 , 申德荣 , 聂铁铮 , 等 . 基于关联数据的一致性和时 效性清洗方法 [J]. 计算机学报,2017, 40(1):92-106. 6. 王宏志 . 大数据质量管理 : 问题与研究进展 [J]. 科技导报 ,2014, 32(34):78-84.
|
|