开放数据资产 估值白皮书1 开放数资产估值白皮书目录前言2中国的公共开放数据资产现状3数据资产化在中国已成为重要趋势4公共开放数据正蓬勃发展5公共开放数据资产评估运用传统估值思路的挑战10“数据势能”估值体系及实证探究12“数据势能”估值概念13“数据势能”公式15“数据势能”估值体系在实证方面的初试及探析18宏观合理性测试分析23公共开放数据资产的应用与分析24最具潜力的5大公共开放数据排行榜25全国公共开放数据10佳实践案例27对标与展望29结束语30参考文献30联系人31开放数据资产估值白皮书 2前言数据资产化是数据要素的重要趋势,旨在最大化释放数据的核心价值。在全球 数据开放的大背景下,我国公共数据开放的步伐在近年来进一步提速。公共开 放数据在数据资产生态中起到基础性的作用,为加快我国数字化发展,建设 “数字中国”提供支撑。当前,全国已有18个省级公共数据开放平台正式上线, 免费为社会各方提供相关政府单位的公开数据。但免费并不等同于没有价值。 公共开放数据在“惠民”以及“智慧政务” 方面产生了巨大的潜在社会价值。 目前,公共开放数据的应用场景正在不断丰富的过程中,假以时日,必将蓄积 巨大的潜在经济价值,未来可期。 数据资产估值是未来数据资产价值释放的核心环节。然而,由于公共开放数据 自身的独特性,将传统估值思路应用于其估值时面临诸多挑战。本白皮书首次 借用物理学中的“势能”概念作为理论基础,推出“数据势能”新概念及其相 应的估值逻辑,就政府公共开放数据的估值体系进行研究和探讨,旨在根据公 共开发数据资产的特点,发掘其特有的价值驱动因素及其魅力所在,进一步揭 示能够撬动其估值体系的支点。 此方法论目前仍处在尝试探索阶段,虽取得了初步成果,但仍需进一步深入研 究与论证。普华永道欢迎学术界、科研单位以及业内人士与我们开展深度交流 探讨,携手助推我国数据资产化发展的步伐,为“数字中国”建设尽绵薄之力。3 开放数据资产估值白皮书中国的公共开放 数据资产现状数据资产化已成为重要趋势开放数据资产估值白皮书 4在现今快速发展的数字经济新时代,中国作为数据生 以资产的合理估值为前提,但数据资产的估值当前并产大国已明确表明数据在我国社会经济发展中的重要 不存在统一、普适性的估值依据;再次,数据作为一战略意义。2020年4月9日,中共中央、国务院发布 种无形资产,与黄金、石油等不可再生资源的稀缺性《关于构建更加完善的要素市场化配置体制机制的意 相比,数据的稀缺性是相对的动态概念,在特定场景见》(简称《意见》),将数据确立为五大生产要素之 和时间节点,数据具有极高的稀缺性,从某种意义上,一,与土地、资本、劳动力以及技术等传统生产要素 数据资产是取之不尽、用之不竭的。伴随着中国数字一样,数据将成为可市场化配置的生产要素。《意见》 经济的发展,数据资产化对于国家治理、市场配置、强调,要加快培育数据要素市场,具体体现在推进政 企业运营和个人权益四个领域影响深远。普华永道认府数据开放共享、提升社会数据资源价值,以及加强 为,数据资产化已成为中国以数据驱动社会发展的重数据资源整合和安全保护。2021年6月10日,《数据 要趋势,当前各利益相关方的行动也正在为这一进程安全法》正式表决通过,并将于2021年9月正式生效, 扫除障碍,包括以上提及的三点。该法旨在建立工作协调机制,加强对数据安全工作的 统筹,进一步完善保障政务数据安全方面的规定。 《数据安全法》是继《网络安全法》提出数据的概念 后,我国在数据安全立法层面的又一个重大里程碑, 将成为中国数字经济高速发展的压舱石和中国数据资 产化稳定发展的指路明灯。普华永道在2020年11月发布的《数据资产生态白皮书》 中写道,数据如同水与空气的数字化时代已至。数据 的价值迎来了悄无声息却影响深远的革新,数据不再 仅仅是宝藏或者石油这样直白的物质财富代表,而已 经发展为如同水与空气一般重要的必需品。首先,水 与空气是每个个体日常生活中无法缺失的重要资源,随着数据要素市场的发展,数据将更加资产化。但从 即使存在感有时无法察觉,而一旦失去就会导致机体经济和法律视角来看,资产具有三项核心特征:其一, 的崩溃,同样,人们对于数据也已习以为常,生活与资产应归属某主体所有或控制,即权属明确;其二, 生产已经无法离开数据的支撑。其次,水与空气是自资产能够产生既有的或预期的经济利益;其三,资产 然界无处不在的巨大资源供给,而数据也已经在潜移是一种资源,具有稀缺性。而对于当今的数字世界来 默化间成为个人、企业与政府正常运作即可获得的重说,数据的无限采集、可复制性以及取之不竭的特性 要资源之一,如同水与空气一样影响着每一个个体。导致其作为资产存在的特殊性。首先,数据资产主体 最后,水与空气看似廉价,却能在相关介质的配合下具有多重性,即权属模糊,例如数据从生产到流转的 催生出长久持续的能量,例如水电,数据自身虽然微过程中,可产生衍生数据及衍生数据主体;其次,数 小,同样也能通过聚合效应驱动质变。据资产对当前经济生产经营及未来预测的经济利益需图 1:全球数据量增长预测(单位: ZB)200180175160140130120100100808070 606050 4040 20 246810 14 16 2002010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020E 2021E 2022E 2023E 2024E 2025E资料来源:IDC, 《数据时代2025》报告5 开放数据资产估值白皮书数据资产化旨在最大化释放数据的核心价值以及流通 与土地、资本、技术、劳动力等传统资产相比,数据性。根据国际数据公司(IDC)对全球 “数据圈”的 带来的机遇与挑战也伴随左右。一方面,联通个人群研究预测,2025年全球数据量将达到175ZB。中国 体、企业机构与政府部门,数据通过开放、流通、采2018年产生了7.6ZB的数据。IDC预计,中国的 “数 集、监测等不同方式释放巨大信息价值,重塑社会生据圈”将会在2018年至2025年之间扩张14倍左右, 活方式与经济商业模式,产生巨大杠杆效应;另一方以 每 年 30%的 平 均增 速 快速 发 展 , 在 2025年 达 到 面,如同空气和水面临污染威胁,数据也同样面临权48.6ZB,也就是48.6万亿GB1。届时,中国将远超美 属不清、估值不明、垄断使用等社会经济难题,导致国,问鼎数据圈的 “金山”,成为全球第一。坐拥如 这一价值潜力无限的资源难以真正实现市场化为主导此庞大的体量以及未来的潜力,社会各界谁能率先认 的平衡。除了需要政府主导下的数据确权机制之外,识到数据的重要性、对丰富的数据资源加以合理运用, 还需要学术界以及科研单位提出数据资产的科学价值谁就能迅速把握时代风口、抢占行业先机,并创造惊 评估体系。普华永道作为数据资产领域的先锋和倡导人的经济利益。者,撰写本白皮书旨在响应国家推动数据要素市场化的号召,为政府以及社会各界提供数据资产估值领域的最新思考与探索。1 IDC, 《数据时代2025》报告公共开放数据正蓬勃发展根据世界银行的定义,开放数据是“能被任何人出于 任何目的不受限制地进行自由利用、再利用和分发, 并最大程度保持其原始出处和开放性的数据”。图 2:平衡的数据资产生态系统数据中介 — 数据银行、数据信托、数据运营商 (云,大气循环)政府管控与治理/数据要素市场 – 数据确权与定价指导(阳光,光合作用)数据资产(水)科研机构/学术单位数据生产者 — 个人/企业 (树木) 数据中介(微生物,分解者)P — 政策/法律 资料来源:普华永道分析O2 数据资产(氧气)数据消费者 — 小企业数据消费者 — 大企业(食草动物,初级消费者) (食肉动物,高级消费者)公共开放数据(土壤)E — 经济S — 社会T — 技术开放数据资产估值白皮书 6普华永道认为,公共开放数据正如数据资产生态系统 作为开放数据的重要组成部分,公共开放数据是政府里的“土壤”,为加快我国数字化发展,建设“数字 向全社会提供的一种公共服务。数据开放始源于美国中国”提供支撑。一方面,各级政府部门拥有大量基 政府在2009年推广的开放政府数据,随后在全球范围础性、关键性的数据资源,掌握着社会绝大部分数据, 内掀起一波开放政府数据的浪潮。在此大背景的推动包括交通、金融、电信、工商、卫生等行业。另一方 下,上海率先于2012年向社会发布上海公共数据开放面,大小企业、个人、数据中介等社会主体也采集和 网站,即上海市公共数据开放平台的前身。上海作为存储了大量具有公共属性和公共价值的数据。在保障 公共数据开放平台建设的标杆,其公共数据开放平台国家安全、商业机密和个人隐私的首要前提下,将这 于2019年正式上线以来,现已覆盖144个公共数据开些公共开放数据最大化开放,供全社会进行开发利用, 放机构,包括5000多个开放数据集,包含近十亿条数有利于培育数据要素市场,释放公共开放数据的社会 据。这类开放平台的首页几乎都展示了总数据量、总与经济价值。应用数量等重要信息,以及各类应用场景,通常包括交通出行、培训与就业、城市安全、学校教育与终身教育、就医与保健、社会保险、政府办事、婚育、社区周边生活服务等。开放数据的方式除了传统的Excel之外,还有可以实时更新的开放API。上海每年通过公共数据开放平台发布《政府网站工作年度报表》,其他省市也会发布类似报表,以展现一年来的数据公开成果。图 3:数据资产相关政策及法案颁布时间轴7 开放数据资产估值白皮书从政策方面看,2013年6月,法国、美国、英国、德 国、日本、意大利、加拿大和俄罗斯八国签署《开放 数据宪章》,为各国开放数据奠定基础以及实践原则。 从此,数据开放成为当今世界各国的共同趋势。中国 也顺应趋势,于2015年首次在《促进大数据发展行动 纲要》中明确大力推动“公共数据互联开放共享”, 而且要“推进数据资源向社会开放,增强政府公信 力”。各省市政府开始推行公共数据的开放,全国政 府公共数据开放呈现爆发式增长。2020年,我国进一 步明确提出“加快培育数据要素市场”,将数据纳入 五大生产要素中。从合规的角度看,监管机构高度关注数据安全和隐私 保护,于2020年出台草案倡议,旨在明确数据安全法 律责任,完善监管体系,保障国家安全、公民个人隐 私权益和社会安全稳定,其中对政务数据的安全与开 放也提出了明确的要求。于2021正式发布的“十四五” 规划中也明确提到“鼓励企业开放搜索、电商、社交 等数据,发展第三方大数据服务产业”,表明数据开 放不仅限于政府公共数据,也包含企业数据开放。截 至2020年底,全国已有18个省级政府公共数据开放平 台,以及124个副省级和地级政府公共数据开放平台。 普华永道观察到,国内有些省份目前将政府公共数据 开放平台安排在副省级和地市级政府层面,比如江苏、 安徽和湖北等,因此这些地区尚未出现省级政府公共 数据开放平台。即便如此,数字中国正在蓬勃发展。 数据开放是提高政府透明度、责任度和社会参与度的 重要原则之一。政府部门机构向内外部公开数据成为 达成这一目标的重要机制。图 4:2012-2020年我国地方政府公共开放 数据平台数量增长情况(单位: 个) 1421025633410 15 202012 2013 2014 2015 2016 2017 2018 2019 2020 资料来源:复旦DMG前瞻产业研究院整理开放数据资产估值白皮书 8从法律方面看,目前,全国已有9个地方制定了专门 据具有特殊性,事关国家安全,一旦被滥用或非法泄 针对数据开放的政策法规,其中浙江、天津、哈尔滨、 露,会对国家和社会产生危害。《数据安全法》中明 青岛和重庆在2020年新制定了相关政策法规。在效力 确提出“国家机关应当遵循公正、公平、便民的原则, 等级上,浙江省制定的是地方政府规章,其余4个地 按照规定及时、准确地公开政务数据。国家制定政务 方则为地方规范性文件。法规政策是推进政府数据开 数据开放目录,构建统一规范、互联互通、安全可控 放的法制基础和重要依据。《数据安全法》与《网络 的政务数据开放平台,推动政务数据开放利用。”同 安全法》、《数据安全管理办法(征求意见稿)》、 时也明确规定国家机关委托他人建设、维护电子政务 《个人信息和重要数据出境安全评估办法(征求意见 系统,存储、加工政务数据,应当经过严格的批准程 稿)》相衔接,由国家层面建立数据分类分级保护制 序,并应当监督受托方履行相应的数据安全保护义务。 度,根据数据在经济社会发展中的发展程度,以及一 受托方应当依照法律、法规的规定和合同约定履行数 旦遭到篡改、破坏、泄露或者非法获取、非法利用, 据安全保护义务,不得擅自留存、使用、泄露或者向 对国家安全、公共利益或者个人、组织合法权益造成 他人提供政务数据。《数据安全法》利于平衡政务数 的危害程度,对数据实行分类分级保护。政务数据具 据开放及安全之间的需求,并强化了对个人信息、隐 有两面性的特点,一方面,需要不断推进政务数据的 私在内的保护要求,同时也约束了第三方的数据安全 透明开放,提升社会治理水平;另一方面,因政务数 义务。图 5:合规关键要素开发和维护有效的数据/隐私 保护治理框架定义数据安全事件 响应和管理程序建立并沟通关于数 据安全和隐私保护 的内部政策定期实施培训以提 高员工的数据安全 意识程度资料来源:普华永道分析合规关键 要素任命数据保护负责人 处理与数据安全和隐私 保护相关的事宜数据全生命周期的 跟踪、识别及保护了解涉及处理数据的 所有第三方已充分考 虑到数据安全和隐私 保护要求对新项目或者相关系统/流程 改造开展数据安全及隐私保 护评估计划9 开放数据资产估值白皮书从经济方面看,在2014年,国家宣布计划公开政府层 面企业工商信息,三家专注于商家工商信息查询服务 平台先后成立。这几家公司的核心原理是通过爬虫技 术从国家工商信息网站等政府机构官方网站以及互联 网公开数据中爬取企业信息,进而形成商业信息报告, 提供给B端和C端用户。这些平台免费提供基础权限 使用,高级权限使用需按年付费成为会员后才可访问 内容,包括其网站以及APP。相比于欧美国家从政府 公共开放数据衍生出来的多元化商业模式,包括使用 医疗开放数据为康复病人推荐最为合适的医疗机构 (Aidin)、使用公开的土壤以及气候公开数据帮助农 民提供及时全面的农场生产力全景(AgSquare)、 使用公共开放数据进行研究并且推荐如何解决社会问 题(Abt Associates)等,中国目前公共开放数据的 商业模式显得相对单一,有待全面发力创造多元化商 业模式,未来可期。由于公共开放数据资产缺乏估值 标准,其价值难以得到公众认可,这也阻碍了其流通 性。因此,公共开放数据资产亟需一套合理的估值体 系来释放其核心价值以及流通性。从社会方面看,中国自2015年开始已逐渐形成公开数 目前公共开放数据运用的基本技术包括以下两方面:据对“惠民”以及“智慧政务”的认知。尽管政府部 门仍在努力推进数据公开透明程度、数据问责和数据 质量治理的进程中,社会群众对建立公共数据共享社1. 大数据处理技术:提供数据集的多版本控制,以及 访问权限控制。会作为一种理念的转变确已形成。对公共开放数据价 值的挖掘帮助政府更好地利用大数据来服务百姓,数 字政府为民办事的效率大大提升。经济合作与发展组2. 安全防护技术:提供有效数据的同时,防止爬虫扫 描,防止恶意盗取有条件开放的数据资源。织 ( OECD ) 于 2020 年 10 月 发 布 《 数 字 政 府 指 数 (DGI)2019》报告。该报告从6个维度衡量了33个 国家公共部门的数字化水平、效率和透明度。该报告在此基础上,目前开放数据在技术上在进行以下几方 面的尝试:的重要洞察表明,大多数国家在数字政府改革中缺乏 用户和利益相关者的积极参与,在数字化公共服务的 设计、实施、交付和监控过程中无法全面考虑到用户 的需求、期望和偏好。根据普华永道观察,中国面临1. 敏感数据自动发现:开放数据上传目前大量依靠人 工审核才能发布。该技术帮助相关部门在数据发布前 进行审核,防止敏感数据上传公开。同样的困难,只有考虑到用户的需求才能更好地促进 2. 多层数据融合汇聚:该技术能将分层存储在各个系 数字化政府的变革。目前,全国各省级政府公共数据 统的分散数据进行汇聚,节省了时间和人力成本。开放平台访问量和下载量都相对较少,宣传推广投入也有待提升,种种迹象表明我国可能需要从顶层设计 3. 数据自动化发布流程:将日常政务数据发布流程标与配套实施开始重新思考用户需求,全面提高用户体 准化、自动化,确保输出数据的一致性和及时性。验,吸引社会各方大力挖掘开发公共开放数据的价值。 4. 隐私计算技术:适用于有限政府数据开放环境下,从技术方面看,数据开放是在政府大数据局以及大数 如上海的普惠金融开放数据。开放平台需提供一套可据中心汇聚的数据基础上进行开放的。目前省级开放 信安全计算环境,在数据可计算的情况下,保护公民平台,在数据跨部门的横向打通上仍然面临一些障碍, 和企业的敏感信息,确保数据“可用不可见”,计算比如数据只能查询不能入库,数据的完整性、实时性、 结果按权属分发给参与方。准确性也缺乏交叉检验或者核实。通常看到的情况是, 数据字段非常多,但真正能发挥价值的不多,因为没 5. 联邦学习技术:该技术能有效帮助多个机构在满足 有办法去核实数据的实用性。目前公共开放数据尚缺 用户隐私保护、数据安全和政府法规的要求下,进行 乏类似“撞库”或者区分度的方法论或实践,只有尽 数据使用和机器学习建模,特别适合关系网络的跨平 快铺开去实验这些保护数据隐私计算的方式,才能发 台数据联合。掘出数据更多的价值。开放数据资产估值白皮书 10公共开放数据资产评估 运用传统估值思路的挑战11 开放数据资产估值白皮书目前,数据资产这一相对前沿的概念,在全球范围内 均尚未形成较为成熟的估值体系。本次研究所聚焦的 公共开放数据资产,由于具有较强的普惠性,且短期内不以商业化为目标,以传统的估值思路对其进行评 价,往往无法完全反映其包括社会价值以及经济价值 在内的潜在价值 。图 6:估值思路简介估值思路估值思路说明应用于公共开放数据估值可能面临的不足传统估值思路成本途径成本途径是从产生数据资产所需花费的成本 进行评估的一种估值方式。数据资产的重置成本通常包括存储成本、加 工成本及运维成本。成本途径仅从数据开发、构建及维护所花费的成本 角度进行分析。然而考虑到公共开放数据的普惠性 及前沿性,传统的成本法在应用时无法完全反映公 共开放数据带来的潜在社会价值及经济价值。收益途径对数据资产投入使用后的预期收益能力进行 评估的一种估值方式。具体为将全部收益扣除其他资产的贡献后归 属于数据资产的现金流,以适当折现率进行 折现得出。公共开放数据资产具有明显的普惠性,在目前及可 预见的未来其使用方式仍为政府免费提供的公开数 据,短期内并未有效仿商业化公司对于数据的使用 收取年费的计划,也未有提供以盈利为目的的数据 定制化以及加工服务的计划,因此很难通过量化方 式估计未来收益;同时,因其独特性,亦无法从市 场观测计算出合适的折现率进行测算。市场途径基于相同或相似数据资产的可比市场交易案 例进行评估的一种估值方式。在拥有市场交易价格的基础上,对数据资产 的性质等相关因素进行修正,从而估算出标 的数据资产的市场价值。考虑到公共开放数据的普惠性,即数据为免费开放 让社会各方挖掘利用,而目前国内也没有完全围绕 政府数据进行的市场交易,因此并不存在一个公开 并活跃的交易市场,亦没有可获取的交易价格。创新或衍生估值思路实物期权法实物期权法通常用于不确定的市场环境下的 资产或权益,其考虑了管理决策者在投资、 生产以及产品研发等问题决策中的选择权, 因而能充分反映资产的选择权价值。实物期权法运用于数据资产估值时,需考虑 数据资产的价值不仅包括数据产生的收益, 而且还包括决策者(数据使用者)的选择权 所带来的收益,即期权价值。因公共开放数据资产具有明显的普惠性,与前述收 益途径的适用局限类似,无法通过量化方式估计各 选择权下的未来收益,同时,由于数据的使用场景 多样,且数据的价值在不同的场景下大多不同,基 于现有信息估计不同场景下的价值具有较大主 观性。模糊综合评价法模糊综合评价法是一种基于模糊数学的综合 评价方法,通常运用层次分析法,请专家针 对数据的各评价指标进行打分,将定性评价 转化为定量指标,最终得到数据资产价值。由于公共开放数据带来的潜在社会价值及经济价值 远高于其原始投入成本,如仅基于模糊综合评价法 估计潜在社会价值和经济价值将因缺少标尺而导致 较大的主观性。因此我们仅考虑在涉及调整系数 (如数据质量调整系数)的选用中采用模糊综合评 价法。神经网络模型假设成交数据资产和未成交数据资产的价值 因公共开放数据的普惠性,即数据免费开放让社会 服从同一分布,成交数据的价值是已知的, 各方挖掘利用,而且目前国内也没有完全围绕政府 未成交数据的价值是未知的。然后收集公开 数据进行的市场交易,因此并不存在一个公开并活 的数据资产交易数据,分析影响数据资产成 跃的交易市场,亦没有可获取的交易价格,作为神 交价格的相关因素,然后通过神经网络模型 经网络模型的基础。 对成交数据价值的变动进行模拟,在此基础 上建立样本中输入变量(即影响数据资产价 值的相关因素)和输出结果(数据资产价值) 的关系。随后代入未成交数据资产的因素变 量,就可以得到这些数据的价值。基于上述分析,普华永道从当前我国省级政府公共数 据开放平台上所提供的公共开放数据作为切入点,通 过借用物理学中的“重力势能”概念,提出创新的 “数据势能”概念以及实证探究。此方法论目前仍处 在尝试探索阶段,虽取得了初步成果,但还需进一步的深入研究与论证。作为数据资产领域的先锋和倡导 者,普华永道希望通过本白皮书呼吁社会各方认识到 数据资产估值所面临的主要挑战,并且积极参与到数 据资产估值的探索之中,为提升对数据资产价值的认 可做出贡献。开放数据资产估值白皮书 12“数据势能” 估值体系及实证探究13 开放数据资产估值白皮书“数据势能”估值概念物理学中的势能(Potential Energy),是指储存于一 已上线的公共数据开放平台从平台前期构建成本投入、个系统内的潜在能量,即还未释放出来的能量。根据 上传数据的质量、总下载量、应用场景多样性等方面物理学能量守恒定律,势能可以释放或者转化为其他 在我国各省市级公共数据开放平台都参差不齐,可优形式的能量,这种能量就是价值。普华永道认为,公 化空间较大。随着各开放平台的开放API数量的增加、共数据开放的价值与势能的概念极为相似。其一,公 上传数据质量的完善,开放数据集以及开放数据总量共开放数据在数据资产生态这一系统内作为“土壤” 的积累、基于开放数据的应用程序的增多,我国公共存在,起到基础性的作用。其二,我国的公共数据开 开放数据资产价值也将不断积累、不断提升。放尚处于早期实践阶段,至今不到10年的历史沉淀。 虽然截至2020年底,全国已有142个省市级公共数据 开放平台正式上线,但仍有40%的省份还未上线省级 公共数据开放平台,因此公共开放数据的潜在价值巨普华永道认为,传统的估值途径在公共开放的数据价 值分析中略显单薄,对于该类具有较强普惠性的资产, 建议针对其特征搭建全新的估值体系。大,有待挖掘开发。其三,我国数据资产价值正处于存储积累的状态中,蓄势待发。通过此次研究观察到,从公共开放数据资产的特性及构成提炼关键价值 驱动因素公共开放数据价值包含数据开发价值与数据潜在价值。 前者由全系构建成本与公共开放数据质量调整系数组 成。后者则由公共开放数据的潜在社会价值以及潜在 经济价值组成。图 7:数据开发价值与潜在价值定义以及关键价值驱动因素123数据开发价值定义数据在尚未被公众使用时,其价 值仅仅为提供数据所需要的成 本,即数据开发价值关键价值驱动因素 • 全系构建成本 • 数据质量综合评分体系潜在社会价值定义在提供“惠民”以及“智慧政 务”的过程中,数据的潜在社 会价值逐步彰显,达到远高于 其开发价值的“数据高度”关键价值驱动因素• 用户下载量/点击量 • 人民整体生活质量及效率提升 • 人民幸福指数潜在经济价值定义数据资产应用于医疗、金融、教 育、交通、能源等多个领域。随 着应用场景的增加,数据资产的 经济价值呈指数级扩大关键价值驱动因素 • 数据经济增长率/GDP增长率 • 潜在应用场景的多样化以微观角度搭建体系,以宏观角度进行验证近年来,全国各省市纷纷启动数字经济战略行动,发 挥数字经济相关产业先行先试优势,聚集了各地政治、 经济、文化、金融、交通等优质资源,以公共数据开 放为基础打造“数字高地”,拓展服务民生新渠道, 数据“惠民”,形成了巨大的潜在社会价值。同时, 在数据经济整体增长助力下,进一步赋能公共数据开 放产生潜在经济价值。基于此,公开数据的价值将远 远高于其单纯的数据开发价值,即其中蕴含着巨大潜 在社会价值和经济价值。因此,普华永道尝试借用物 理学中的“重力势能”(具体公式为Ep=MgH),首 次提出“数据势能”概念,对应的“数据势能”估值 模型应运而生。开放数据资产估值白皮书 14微观角度,从公共开发数据的特征及撬动其潜在价 值的关键因素出发,推出“数据势能”公式,即 公共数据资产价值 = 公共数据开发价值*潜在社会价 值呈现因子*潜在经济价值呈现因子宏观角度,从国民经济生产总值出 发,剖析数据经济总值占国民经济 之比例,通过成分分析层层推出公 共开放数据可能的价值区间15 开放数据资产估值白皮书“数据势能”公式公共数据资产价值 = 公共数据开发价值*潜在社会价 • 加工成本:数据加工过程中设计的物力(服务器、值呈现因子*潜在经济价值呈现因子软件等)和人力(员工成本、下包商费用、项目费下文我们逐一剖析 “数据势能”估值体系下的关键用等);参数。• 运维成本:保障数据正常可靠服务所需的动力(服公共开放数据开发价值,对应传统重力势能公式中的务器、软件等)和人力(员工成本);M (质量),即相对固定的因素,等于全系构建成本*公 公共开放数据质量调整系数则是第三方数据资产专家共开放数据质量调整系数。根据数据资产的特性,从公共开放数据的准确性、完整性、及时性、时效性,及唯一性等五个维度逐一进 全系构建成本指的是构建一个数据资产所需全部投入, 行打分评价,再经过加权平均后最终得出的结果2。 包括初始建设成本、期间全部运维成本及管理成本,具体为:• 存储成本:数据存储占用的基础设施(机房、机柜、 2《数据资产价值评估模型的理论研究与技术实现探讨》,上海数存储设备等)的成本按数据容量折算后的价值;据分析网图 8:公共开放数据质量五个维度的含义准确性完整性及时性时效性唯一性衡量所采集数据的 准确程度。数据的 准确性越高,可分 析性越强,数据的 价值也越大。衡量所采集数据是 否存在缺失,若重 要数据存在缺失, 可能未来将支付额 外成本进行数据 补充。衡量数据更新频率 的快慢,反应数据 世界与客观世界的 同步程度。数据的 及时性主要与数据 的同步和处理过程 的效率相关。衡量最后一次数据 更新时点与期望有 效时间之间的差距, 对于需要持续跟踪 最新数据的用户来 说具有较大意义。衡量是否存在重复 数据,若数据重复 性较高,会导致后 续分析结果失真。开放数据资产估值白皮书 16潜在社会价值呈现因子,对应传统重力势能公式中的 H (高度)在我国加快数字社会建设步伐的大背景下,秉持“以 民为本”的发展理念,且将“构筑全民畅享的数字生 活”。作为近五年国家的战略规划,“惠民”成为公 共开放数据越来越重要的社会价值体现。其另一方面 的社会价值体现在“提高数字政府建设水平”,在公 共开放数据的基础上,将数字技术广泛应用于政府管 理中,不断提高决策科学性和服务效率。利用大数据 以及人工智能等数字技术洞察民生以及政府需求,又 将此技术用于拓展服务民生、服务政府等新渠道,在 提供“惠民”以及“智慧政务”的过程中,达到远高 于其开发价值的“数据高度”。“惠民”结果可直接从宏观效果观察得出,人民整体 生活质量以及效率的提高、幸福指数的增加为公开数 据社会价值的表象。“智慧政务”结果也可从百姓对 政府工作的“好差评”评价体系中得以体现,以及政 府内部效率的提升为社会价值的表象。但由于获取此 类数据难度较大,且评判可能较为主观,因此本文在 研究过程中更多考虑使用可直接量化的的参数指标, 即公共开放数据实际累计下载量。公共开放数据实际累计下载量可以全面反映社会对数据开放平台的认知 水平和运用的活跃度。下载即使用,用户下载量是反 映公共开放数据社会价值最具代表性的指标,原因如 下:其一,公共开放数据的下载量能反映全社会,包括个 人、企业、政府对于数据的主动关注程度,以及数据 的有效触及率;其二,下载量能体现终端用户对于数据价值及数据可 利用性的认可,公众将其认为有参考意义的信息下载 后,更可能在未来加以分析,在更加长期的时间里开 发数据的价值;其三,在当前公共数据开放的早期阶段,公众对于公 共开放数据的获取和了解较少,公共开放数据的社会 价值并未被充分开发和利用,仍停留在较低水平。随 着公众对于公共开放数据价值的认知不断提升,下载 量的逐渐增加,公共开放数据在社会中得到更为广泛 的流通及更多场景的应用,逐步改变社会生活方式及 经济商业模式,产生巨大的杠杆效应,公共开放数据 的价值也将加速上升。图 9:潜在社会价值与数据下载量的正向非线性关系数据经济发展初期数据经济发展成长期数据经济发展稳定期考虑 社在数据经济发展早期,数据尚未“十四五”以及2035年远景期间, 在此阶段,绝大部分群众对数据会被公众使用时,其价值仅为数据在我国加快数字社会建设步伐的平台的认识基本完善,数字经济价 开发价值。随着数据经济的进一 大背景下,数据经济迅速发展。发展进入稳定期,新增下载对整值 步发展,在提供“惠民”以及后 的 数“智慧政务”的过程中,数据的 潜在社会价值逐步彰显。中国信通院的数据显示,预计 2021至 2025 年,我国数字 经济 年均增速将保持在15%左右。体社会价值的贡献率会逐渐下降。据资产价值2021年前2021~2035年2035年以后 数据下载量17 开放数据资产估值白皮书在选定下载量为量化指标的基础上,我们引入了指数 介于0.5-1之间的幂函数来量化潜在社会价值(H)。 这一函数的图像如上图所示,反映出社会价值的增长 与数据下载量的正向非线性关系,即价值的增长随着 下载量的增加逐渐降低,符合边际递减规律,正如图 中曲线的斜率会从陡峭变得平缓。在公共数据开放平 台发展初期,下载量基数较小,群众对公共数据开放 平台的认知以及开发利用逐渐形成,新增单位下载量 带来的社会价值贡献度较高;到了成长期,群众对数 据平台的认识逐渐提高,新增下载对整体社会价值的 贡献率会持续上升,但不如发展初期迅猛;到了稳定 期,对公共数据的开发利用基本饱和的情况下,公共 开放数据带来的社会价值将逐渐平缓,趋向最大化。2016年G20杭州峰会发布的《二十国集团数字经济发 展与合作倡议》指出,数字经济是指以使用数字化的 知识和信息作为关键生产要素、以现代信息网络作为 重要载体、以信息通信技术的有效使用作为效率提升 和经济结构优化的重要推动力的一系列经济活动。根 据中国信通院发布的《中国数字经济发展白皮书》, 数字经济具体包括数字产业化、产业数字化、数字化 治理、以及数据价值化四大部分。数据是数字经济的 血液,公共开放数据资产有助于驱动创新、优化资源 配置、为企业和社会赋能,是数字经济价值的重要体 现。由于数据资产价值与数字经济的呈显著正相关性, 因此,我们引入各省数字经济的名义增长率作为计算 潜在经济价值的关键参数之一。潜在经济价值呈现因子,对应传统重力势能公式的 g (重力加速度),在此我们将其定义为转换率。有别于传统的势能公式,在“数据势能”中,该因子 为非恒定因素, 公式=(1+g)x,其中g为数字经济名 义增长率,x为第三方数据资产专家对公共开放数据 应用场景多样性评分所对应的数值。根据现阶段的观 察研究,潜在经济价值是在潜在社会价值的基础上实 现的潜在经济价值的转换。在此基础上,我们根据第三方数据资产专家的公共开 放数据应用场景多样性进行评分,确定了各省对应的 指数函数的另一变量x。数据如果能在一个国家内部 流动起来,就能创造价值。公共开放数据在“惠民” 和“智慧政务”过程中不断流动,运用于不同的应用 场景,使得数据资产的经济价值呈指数级扩大。考虑 到公共开放数据资产本身具有强公信权威和广覆盖领 域的特点,有政府背书的数据资产跨越了医疗、金融、 教育、交通、能源、农业、制造等多个领域。各领域 政府数据在不同场景下的开放,有望助力不同行业企 业提升服务效率及服务精准度,从而加速驱动地方传 统企业转型升级,推动数字经济的发展。因而,数据 资产本身的潜在经济价值将随着应用场景的不断拓展 而得到提升。“数据势能”估值体系 在实证方面的初试及探析开放数据资产估值白皮书 18基于前述“数据势能”概念、估值模型及关键参数, 普华永道根据采集到的18个已开放省级公共数据开放 平台(包括北京市、天津市、上海市、重庆市、河北 省、浙江省、广东省、山东省、四川省、贵州省、广 西壮族自治区、河南省、福建省、江西省、海南省、 陕西省、湖南省、宁夏回族自治区)的统计信息,结 合第三方数据资产专家对公共开放数据质量和公共开 放数据应用场景的评分,以及中国信通院对各地区数 字经济增长率的披露,对这些省级平台的数据资产价 值进行了初步的研究分析。数据开发价值:数据全系构建成本*公共开放数 据质量调整系数全系构建成本通过与各省级公共数据开放平台专家访 谈以及第三方数据资产专家判断汇总而成。公共开放数据质量由第三方数据资产专家分别从5个 维度:准确性、完整性、及时性、时效性和唯一性, 经过逐一打分,加权平均得出的结果。图 10:解析公共开放数据质量五个维度质量指标 准确性 完整性 及时性 时效性 唯一性内涵 数据是否正确描述目标实体的特征 数据是否完整体现出各个开放单位的公共数据 数据更新的频率 数据集最近一次更新时点以及期望有效时限之间的差距 数据集的重复情况打分及权重 专家判定 专家判定 专家判定 专家判定 专家判定图 11:公共开放数据质量评分标准0~20分21~40分41~60分61~80分81~100分准确性20% 以 下 数 据 正 确描述目标实体 特征。数据几乎 无法依赖。20%~40% 的 数 据 正确描述目标实 体特征。可依赖 较少数据。40%~60% 的 数 据 正确描述目标实 体特征。可依赖 近一半数据。60%~80% 的 数 据 正确描述目标实体 特征。可依赖绝大 部分数据。80% 以 上数 据 正 确描 述 目标实体特征,数据几 乎可以完全信赖。完整性公共数据开放平 台 仅 获 取 20% 以 下能够开放公共 数据的政府部门公共数据平台获 取 20%~40% 能 够 开放公共数据的 政府部门公共数据平台获 取 40%~60% 能 够 开放公共数据的 政府部门公共数据平台可获 取 60%~80% 能 够 开放公共数据的政 府部门公共数据平台可获取 80% 以 上能 够 开 放公 共 数据的政府部门及时性 数 据 更 新 频 率 低 数据每年更新 于每年1次数 据 更 新 频 率 介 数据更新频率介于 数据更新频率高于每月1于每半年1次和每 每季度1次和每月1 次季度1次之间次之间时效性最 近 一 次 更 新 时 最 近 一 次 更 新 时 最 近 一 次 更 新 时 最近一次更新时点 最 近 一 次 更 新 时 点 在点在2015年以前 点 在 2015~2017 点 在 2017~2019 在2019~2020年间 2021年内年间年间唯一性 80% 以 上 重 复 数 60%~80%重复数 40%~60% 重 复 数 20%~40% 重 复 数 20%以下重复数据集据集据集据集据集19 开放数据资产估值白皮书下图明确了这五个维度的定义,同时从这五个维度展 示了此次研究的各省级公共数据开放平台所提供的数 据质量的综合评分情况,结果为76分。这其中,准确 性的评分最高,主要原因在于省级公共数据开放平台 对于上传的数据要求极高,确保上传的公共开放数据 准确无误。可提升的维度包括时效性以及完整性,这 需要各个开放数据单位部门形成有效的上传机制以及 流程的自动化,确保公共开放数据得以持续不断地上传,且推动所有开放数据单位部门都如期上传相应的 公共开放数据。同时,以政务的业务需求为指导,建 立一套科学的、可行的、适合政务业务环境的数据质 量考核管理体系,对政务数据产生部门上报的数据进 行评分,并生成考核报告公布于众,从而达到数据质 量的持续改进。这将极大提升全国各省公共开放数据 质量综合评分,且直接影响公共开放数据资产的价值 上升。图 12:全国18省的公共开放数据质量综合评分完整性衡量所采集数据是否存在缺失,若 重要数据存在缺失,可能未来将支 付额外成本进行数据补充。准确性衡量所采集数据的准确程 度。数据的准确性越高, 可分析性越强,数据的价 值也越大。公共开放 数据质量 综合评分76分时效性衡量最后一次数据更新 时点与期望有效时间之 间的差距,对于需要持 续跟踪最新数据的用户 来说具有较大意义。10% 20% 30% 40% 50% 60% 70% 80% 90% 100%及时性衡量数据更新频率 的快慢,反应数据 世界与客观世界的 同步程度。 数据 的及时性主要与数 据的同步和处理过 程的效率相关。唯一性衡量是否存在重复 数据,若数据重复 性较高,会导致后 续分析结果失真。开放数据资产估值白皮书 20从此次研究的18个省级公共数据开放平台中,我们以 新频率,因此及时性打分90;上海市开放平台数据集 上海市的公共开放数据质量打分为例,其实际开放数 均为2020和2021年更新,但由于并非全部于2021年 据部门占开放部门总数的80%,因此完整性评分为80; 更新,因此时效性评分85;平台中重复数据集仅2%, 根据第三方数据资产专家评估判断,开放平台数据集 唯一性打分98。对上海市数据5个维度的质量评分加 100%为真实数据,准确性评分为100;开放平台会以 权平均,得到该地区公共开放数据质量调整系数为90 日为单位对数据集进行更新,但由于未能做到实时更 分。其他省份数据质量评分均按此标准展开。图 13:公共开放数据质量评分示例完整性及时性时效性准确性唯一性上海市80908510098重庆市258580100100浙江省33907510098河南省25305010098贵州省70857510073以上的图中,我们选取了具有代表性的五个省份,将 其数据质量从这五个维度进行了分析。重庆的公共开 放数据虽然准确性和唯一性都满分,但完整性较低, 即实际上传开放数据的部门占所有能够开放公共数据 的部门比例较低。浙江省也面临类似的挑战,其时效 性稍逊一筹,主要原因在于其数据集大多更新于2019 和2020年,缺乏2021年的最新数据。河南省处于类 似境地,由于数据集基本都于2018年更新,时效性偏 低,而且由于其公共开放数据大多都一年上传一次, 因此及时性评分仅30分。贵州省在及时性、完整性、 时效性皆优于河南省,但由于重复数据集出现较多, 因此唯一性评分仅73分。潜在社会价值呈现因子该因子是基于采集到的各省级政府开放平台数据实际 下载量计算得出。潜在社会价值与下载量呈非线性正 相关的关系,即其增长率则随着下载量的不断增加而 逐渐减少,呈现边际效应递减趋势。从各省的下载量 情况分析,第一梯队省份包括上海和浙江,总下载量 均在50万次以上。第二梯队包括北京、广东、山东、 四川、贵州、以及广西,总下载量均在10万至50万之 间。其余的则在10万以下,形成了第三梯队。图 14:全国18省的公共开放数据下载量现状第一梯队开放数据总下载量在50万次 以上的省市浙江省 上海市第二梯队开放数据总下载量在10万至 50万之间的省市广东省 山东省 北京市广西壮族自治区 四川省 贵州省第三梯队开放数据总下载量在10万以 下的省市河南省 重庆市 河北省 福建省 江西省宁夏回族自治区 海南省 陕西省 湖南省 天津市21 开放数据资产估值白皮书潜在经济价值呈现因子在此次分析中,我们将各省近三年的平均数字经济名 义增长率作为上述公式中的g。公共数据应用场景多 样性则反映在了x这个指数中。根据中国信通院发布 的 2019 、 2020 、 2021 年 《 中 国 数 字 经 济 发 展 白 皮 书》,计算各地区三年平均数字经济名义增长率作为 潜在经济价值的基础。根据第三方数据资产专家对各 省市数据应用场景多样性评分,得出对应的数据应用 场景系数。公共开放平台数据应用场景的数目越多, 涉及行业越广泛,评分越高。图 15:应用多样性评分所对应的数据应用场景 系数应用多样性评分 81-100 61-80 41-60 21-40 0-20数据应用场景系数 5 4 3 2 1图 16:省级公共数据开放平台数据应用场景系数现状上海市广东省山东省第一梯队公共开放数据已广泛应用于金融、医疗、教育、TMT、 基础设施建设、工业农业、民生、文化产业等多个领域。北京市 四川省浙江省 河南省第二梯队数据已被用于部分产业和行业,仍有 待开发更多潜在应用场景。重庆市天津市福建省江西省广西壮族自治区宁夏回族自治区海南省贵州省陕西省湖南省河北省第三梯队数据仅被用于少数固定场景, 政府有待加大投入及推广力度。基于上述原始数据3及计算过程,“数据势能”模型测 算 出 18 个省 市的 公共 开放数 据资 产潜在 价值 超过 1,000亿元,其中前六大省市,北京市、上海市、广东省、浙江省、四川省、和山东省(省市排列顺序以 民政部为准)的公共开放数据实际下载量和应用场景 多样性均领先于全国其它省市。3 本模型使用的部分原始数据由上海数据交易中心提供图 17:全国各省公共开放数据资产价值分布图开放数据资产估值白皮书 22未纳入本次数据资产估值分析的省市 政府公共开放数据潜在价值小于10亿的省市 政府公共开放数据潜在价值大于10亿但小于50亿的省市 政府公共开放数据潜在价值大于50亿的省市普华永道认为,此结果与该地区政府前期的规划以及 根据“数据势能”模型估值发现,潜在社会价值占总 近期推出的“十四五”规划密切相关。北京市政府提 价值的65%,潜在经济价值约35%。由于目前公开数 出,在“十四五”时期,要使数字经济成为发展新动 据平台的建设发展尚处于早期阶段,数字发展走在前 能,打造具有国际竞争力的数字产业集群,力争将北 沿的省市,如广东,政府平台发布公开数据最长也仅 京市建设为全球数字经济标杆城市。上海市政府在其 有五年时间,大部分省市还在公共开放数据平台的初 “十四五”规划中提及将从“互联网医院&智能化医 期开发阶段,整体仍在不断探索、不断优化的过程中。 疗服务”、“数字赋能教育”、“智慧养老”和“文 在当前这个阶段,公共开放数据资产尚在蓄积潜在社 化旅游+数字”等4个方面营造“智慧便利的数字生 会价值的过程中,而经济价值理应在社会价值的基础 活”。其中上海市公共开放数据已被应用于如“普惠 上形成,但借助公共开放数据平台实现大数据变现的 金融”等实际应用场景,正深度挖掘其潜在经济价值。 案例仍在少数。因此,目前公开数据资产所带来的社 浙江省政府同样在“十四五”规划中提及“深入实施 会价值要大于其经济价值,而经济价值会在政府公开 数字经济”,具体到“加快建设数字社会”、“推进 数据平台达到建设成熟期后,当社会各界认识到其潜 生活数字化”、“公共服务数字化”等方面,足以见 在价值并大力挖掘开发后逐渐得以体现。 得其对数字经济以及数据价值释放的重视。23 开放数据资产估值白皮书宏观合理性测试分析为了对“数据势能”公式所得出的结论进行合理性测 试,我们从宏观层面对省级政府公共开放数据价值进 行了评估。从各省2020年的数字经济总产值出发,考 虑到的因素包括政府总数据量占全国总数据量的比例, 政府公共开放的数据量占政府总数据量的比例,目前 已上线的省级公共数据开放平台总数据量占全国省市 级公共数据开放平台总数据量的比例,以及第三方数 据资产专家认定的政府公共开放数据价值被激活释放 的程度。最终,从宏观层面测算出此次评估的18个省 级公共开放数据资产价值总和超过1,000亿元,得出 的具体结果与从微观层面得出的结论相差无几,足以 证明“数据势能”模型估值方法论存在一定的合理性、 科学性,值得继续探究分析。图 18:宏观合理性测试示意图全国数字经济总值第一层过滤非政府(个人、 企业)总数据量政府机构 总数据量政府未公开 的数据量第二层过滤公共数据价值被释放程度 (第三方数据资产专家认定)省级未上线 公共数据开放平台省级政府公共数据价值总和数据资产价值被释放政府公共开放的数据量 (全国省市公共数据开放平台总数据量) 省级公共数据开放平台总数据量 (已上线)开放数据资产估值白皮书 24公共开放数据 资产的应用与分析25 开放数据资产估值白皮书最具潜力的5大公共开放数据排行榜本次研究挖掘出的最具潜力的公共开放数据排行榜是 #1 基础设施建设从行业维度进行排名的。由于6大公共开放数据资产 最具潜力排行榜第一的是基础设施建设相关的公共开大省,即北京市、上海市、广东省、浙江省、四川省、 放数据,占6个省公共开放数据总价值的28%。基础和山东省(省市排列顺序以民政部为准)的数据资产 设施建设相关数据涵盖交通运输、仓储和邮政业、城价值之和占本次研究的18个省市公共数据开放平台的 乡建设、房地产、以及资源与环境保护等相关的公共数据资产总价值的绝大部分比重,故本排行榜通过分 开放数据。其中,下载量最高的数据集为上海市发布析6个省各个行业的公共开放数据的下载量以及“数 的“1978年以来住宅投资和竣工建筑面积”,拥有将据势能”模型里的潜在社会价值得出最具潜力的最终 近5万次下载。这充分体现出公共开放数据的社会价结果。值,住宅价格一直以来都是关注度比较高的话题,该根据上文分析得出的结论,潜在社会价值是实现潜在 经济价值转换的根基,潜在社会价值也体现出大部分 公开数据资产总价值。因此,最具潜力的公共开放数 据排行榜是通过潜在社会价值从大到小的行业数据资 产价值依次排名得出的。数据提供了累计40多年的数据给社会各界提供研究分 析的依据。从城乡建设方面看,2019年7月上海开始 实行垃圾分类政策,与老百姓的生活也息息相关。与 “生活垃圾收集点信息”相关的数据集都拥有较高的 下载量,体现出“惠民”的潜在社会价值。图 19:最具潜力的公共开放数据#2 民生 最具潜力排行榜第二的是民生相关的公共开放数据,占比为19%。民生相关数据涵盖劳动就业、人事、民 政、政府机构与社会团体名称等相关的公共开放数据。其他 21%基础设施建设 28%除上海以外,广东省的民生相关总下载量最高。其中, 下载量最高的数据集为“广东省养老机构基本信息”。 根据我国第七次人口普查结果发现,60岁以上老龄人 口快速增加,老龄化问题严峻。相关的配套设施以及教育服务也深受百姓以及企业的关注。从2021年1月起,工9%信部针对此问题在全国范围内开展为期一年的“互联网应用适老化及无障碍改造专项行动”,首批将完成医疗 10%金融 13%民生 19%与老年人等群体工作、生活密切相关的115个公共服 务类网站和43个手机APP适老化及无障碍改造,让老 年人可以用到更多界面友好、操作简单的服 务产品。开放数据资产估值白皮书 26#3 金融#5 教育最具潜力排行榜第三的是金融相关的公共开放数据, 最具潜力排行榜第五的是教育相关的公共开放数据,占比为13%。金融相关数据覆盖财政、财税金融、公 占比为9%。教育相关数据涵盖教育科技、教育科研、共预算等相关的公共开放数据。除此已有成功实践案 教育资源等相关的公共开放数据。教育是民族振兴、例的普惠金融相关的数据之外,下载量最高的数据集 社会进步的重要基石。教育也是我国“十四五”规划为“广东省各市一般公共预算收支情况”。如上文所 里的重要板块,政策明确要求劳动年龄人口平均受教述,公共数据开放是提高政府透明度、责任度和社会 育 年 限 从 2020 年 的 10.8 提 高 到 2025 年 的 11.3 , 于参与度的重要途径之一。社会各界关注各省公共预算 2035年建成教育强国。除上海以外,北京的教育相关收支也可了解各地方政府近期发展趋势的动向,包括 数据集下载量最高。其中,前三的数据集为“小学”,保障和改善民生、推动经济社会发展、维护国家安全、 “中学”,和“职业教育学校”。据了解,北京推出以及维持国家机构发展等方面。“E上学”应用程序收录了最新一年部分小学与中学的入学关系,并且将该学区内的学区房的名称与价格#4 医疗对应展示,极大解决了家长的择校困惑,关注量突破最具潜力排行榜第四的是医疗相关的公共开放数据, 6万次。占6个省公共开放数据总价值的10%。医疗相关数据涵盖卫生健康,医药卫生管理、医疗保健等相关的公共开放数据。由于2020年新冠疫情在国内的爆发,山东、四川、广东等省的下载量最高的公共开放数据集都与疫情相关、例如确诊病例信息、疫情分级分区信息、疫情基本情况统计等数据集。除此之外,浙江省的“定点医药机构信息”下载量较高,足以体现公共开放数据“惠民”的潜在社会价值。除上海的“平安 科技健康咨询试点项目”可查询本市相关医疗医药机1000亿+构信息,其他省市在这一领域目前实践尝试较少,因此公共数据开发利用的潜力相当大,尤其是“普惠医疗”未来的发展空间值得期待。18个省级政府公共开放数据 总价值超过1000亿元27 开放数据资产估值白皮书全国公共开放数据10佳实践案例本次研究整理出的10佳实践案例是通过综合考量相关 公共开放数据的下载量、关注量、媒体报道次数、以 及潜在社会价值等多维度严格筛选得出的结果。结果 不分先后,省市排列顺序以民政部为准。最佳案例1:北京市的“基于无人机在线取证的智慧 城市交通突发事件应急响应”为了解决小型事故引起的交通拥堵,北京市和南京理 工大学合作开发了基于无人机在线取证的解决方案。 这一方案克服了警力不足、取证不便等目前事故处理 中的现实困难,利用了无人机快速高效的特点实现了 对小型事故现场的全地形、多机位覆盖,同时提供了 拍摄证据和交通警示、车流疏导等功能。通过无人机 与执法人员的协同工作和智能分工,保障了对城市交 通突发事件的应急响应。最佳案例3:上海市的“普惠金融应用”上海市为推动普惠金融真正实现扶持大量企业发展, 并降低银行的业务风险,于2019年10月组织各政府部 门公开数据资源,通过制度与技术双重管理,将公共 数据安全、合规、高效向社会企业有条件开放,形成 了普惠金融试点应用。参与试点的银行将公共数据作 为普惠金融中小微企业风控的信息资源,提升了自动 化风控的能力,有效降低了中小微企业信贷业务过程 中的成本,提高了业务效率,形成了公共数据资源的 潜在社会价值以及经济价值。截至2021年5月,已有 18家上线银行对接政府公共数据开放平台,调用数据 超200万次,向银行提供超过5.4万家企业的信息,为 超过700亿元中小微企业贷款提供数据支撑。今年将 新增15家金融机构参与普惠金融试点应用中。最佳案例2:北京市的 “融合遥感产品和地理要素的 北京市PM2.5污染制图”北京市与武汉大学合作开发的PM2.5地图应用,融合 遥感产品和地理要素对北京市进行PM2.5污染制图。 遥感观测的气溶胶光学厚度与地面PM2.5浓度相关性 强、覆盖面广,且时效性强。通过进一步利用地面监 测点数据和周围地理信息构建模型,模拟出未监测地 区的污染物浓度空间分布,整合为PM2.5动态地图, 为民众智慧出行提供数据支撑。此应用是全国智慧城 市技术与创新设计大赛获奖作品。最佳案例4:上海市的“城市商业数据地图”城市商业数据地图是一款集商圈实时天气、人流、交 易、地理指标数据于一体的城市商业数据地图产品, 同时具备可视化和交互性的特点。通过多维数据排列 整合,将需求指标化,实现上海34个主要城市商圈数 据的小时级更新,并集中呈现在一个可视化数据地图 平台上。除此之外,城市商业数据地图还设计出“天 时影响力、地理辐射力、消费支撑力、商业竞争力” 四大类,细化成95项数据指标,可以实现精准预测商 圈未来消费数据、消费人流等功能。通过深入洞察商 圈行为,可以帮助政府更好地监控城市商业运行体征, 更有效地进行城市规划和建设。开放数据资产估值白皮书 28最佳案例5:广东省的“粤港澳文化生活地图”最 佳案例 8:四川 省的“重 大慢病发 病风险 AI量 化预粤港澳大湾区合作开发了文化生活地图,以三地地图 警系统”为依托,录入了三地博物馆、演出场地、文化遗产的 结合临床电子病历、体检数据、个人生活和工作信息地理位置和文字简介,让公众能快捷地了解三地文化 以及流行病学数据,对重大慢病发病风险进行人工智设施等的分布情况及具体详情,对市民的文化出行提 能量化评估,可为用户提供高危致病因素甄别等个性供指引,而且每日同步更新三地的演出、展览、文化 化预防服务,甄别高风险人群,从而助力重大慢病的活动等信息,还能通过链接进入三地的网上购票平台, 防控工作,提高全民健康水平。方便公众购票。最佳案例6:浙江省的“数字经济中的企业风险全景 画像”浙江绍兴利用公共平台数据以及第三方合作企业相关 数据,将数据进行预处理,并提取有效特征,在分析 大数据机器学习中的决策树、逻辑回归、神经网络等 算法的基础上,选用前馈神经网络算法开发了数字经 济中的企业风险全景画像,便于政府精准高效地监管 企业经营状况,在控制风险的基础上更有效地提升银 行信贷发放业务。最佳案例9:山东省的“豌豆苗应用”“豌豆苗”应用是一款针对校园学生校内校外安全情 况的家校互通软件。结合物联网设备,使家长可以及 时查看孩子的进出学校消息和视频、便于了解孩子校 内外的行动轨迹。出现异常时,软件应用会自动提示, 这大大提升了学校和家庭的互信,守护了少年儿童的 安全。除此之外,该系统还提供健康安全、家庭教育 等素材,关注孩子的身心健康,提高家长和孩子的安 全意识,防患于未然。最佳案例7:浙江省的“菜篮子”应用浙江湖州的“菜篮子”应用,汇集了湖州全城农产品 的超市菜价排名,以及各农贸市场的批发价格。数据 由湖州市发展和改革委员会同步发布,保证了信息的 真实可靠。市民通过手机即可了解各市场的菜价,可 以更好地货比三家,降低了商贩坐地起价的风险。 “菜篮子”应用便于政府对全市农产品供应市场价格 实施监管,在价格变动异常时及时采取相应措施,更 好地维护市场秩序,为形成健康有序的菜市场行情提 供了基础保障。最佳案例10:山东省的“城市针灸师”“城市针灸师”是来自山东省数据应用(青岛)创新 创业大赛金牌团队的创新方案。通过使用青岛市公安 交警支队大队提供的交警道路视频等城市基础静态数 据和车流量、道路交通等动态交通数据,构筑了一整 套人工智能与交通工程深度融合的算法体系,进而形 成了先进的城市交通控制系统,从而改善交通拥堵等 问题。29 开放数据资产估值白皮书对标与展望 — 利用“数据势能”模型 对标海外省市公共数据资产价值作为全国公共数据开放平台的标杆,上海公共数据开 息,以及按邮政编码列出的人口统计数据。作为最早放平台于2019年正式上线。虽然早在2012年,上海 开始推动数据开放的国家中的最大城市,纽约显然在就率先推出上海公共数据开放网站,但无论从数据质 公共开放数据应用场景方面比上海更加多元化。因此,量、用户体验和下载量等维度,均无法与后来重新投 无论从潜在社会价值还是潜在经济价值,根据“数据资构建的公共数据开放平台同日而语。如今的上海公 势能”模型的应用,纽约的数据资产价值遥遥领先于共数据开放平台下载总量近150万次,访问量在578万 上海,值得我国各省市去深入地学习研究。次,公共数据质量综合评分为90分,皆在我国当前处 于相对领先的位置,具有一定的代表性。对于相对起步较晚的省份,普华永道建议,首先需在 公共数据开放平台搭建中大力投入资源,保证用户体对标美国第一大都市的纽约,其公共数据开放平台于 验与使用的便利,并且确保上传数据的质量综合评分2015年正式上线。其下载量与访问量都在五千万次以 较高。其次,市场推广与普及教育也极为重要。为便上,其访问量是上海的近10倍,下载量更是上海的35 于引流,可考虑效仿浙江省,将公共数据开放平台放倍,可见纽约的公共数据被关注、被使用、被开发利 置于省政府网站较为显眼的位置。最后,建议大力开用的程度远高于上海。虽然纽约的公共数据时效性比 发多元化的应用程序,切实做到让公共开放数据“惠上海低一些,但与上海相同,天天都在上传更新数据。 民”,提升“智慧政务”,帮助各行各业基于公共开纽约下载量最高的数据集包括自2010以来乐透彩票中 放数据的不断突破与创新,持续提升公共开放数据的奖号码、近三年机动车碰撞的车辆信息、疫情相关信 潜在社会价值以及经济价值,甚至实现弯道超车。图 20:对标分析上海与纽约的公共数据资产价值 上海纽约2400万人2200万人2020年人口159,384元人均GDP502,272元1,469,148 次下载量52,980,484 次5,784,098 次访问量54,339,963 次公开数据更新时间为2020~2021年时效性公开数据更新时间为2018~2021年数据更新频率/天及时性数据更新频率/天开放数据资产估值白皮书 30结束语数据是数字经济的血液。作为数据资产价值释放的核 资产排名前六的省市,包括北京市、上海市、广东省、 心环节,数据资产的估值目前在全球范围内仍停留在 浙江省、四川省、和山东省(省市排列顺序以民政部 理论探讨层面,尚未形成较为成熟的数据资产估值方 为准)的公共开放数据实际下载量和应用场景多样性 法论,更少存在实证探究。作为数字经济时代的长期 均领先于全国其它省市。 实践者,普华永道勇于创新,率先提出“数据势能” 概念,并且对全国已上线的18个省级公共数据开放平 “数据势能”方法论目前仍处在探索阶段,虽取得了 台所提供的公共开放数据进行估值。通过“数据势能” 初步成果,但还需进一步的深入研究与论证。普华永 公式所得出的结果,以及宏观合理性测试的分析表明, 道希望通过本白皮书呼吁社会各方认识到数据资产估 上述公共开放数据资产总价值超过1,000亿元,其中 值的主要挑战,并且邀请学术界、科研单位以及业内 潜在社会价值占65%,潜在经济价值约35%。从最具 人士与我们开展深度交流探讨,一起助推我国数据资 潜力的公共开放数据来看,基础设施建设、民生、金 产化前进发展的步伐,为“数字中国”的建设尽绵薄 融、医疗、教育等相关的公共开放数据最具潜力,占 之力。 前六大省份数据资产价值的80%左右。公共开放数据参考文献北京市政务数据资源网,https://data.beijing.gov.cn/ 天津市信息资源统一开放平台,https://data.tj.gov.cn/ 上海市公共数据开放平台,https://data.sh.gov.cn/ 重庆市公共数据开放系统,https://data.cq.gov.cn/rop/home 河北省公共数据开放网,http://hbmgov.gov.cn/catalog 浙江数据开放,http://data.zjzwfw.gov.cn/ 福建省公共信息资源统一开放平台,https://data.fujian.gov.cn/ 江西省政府数据开放网站,https://data.jiangxi.gov.cn/ 山东公共数据开放网,http://data.sd.gov.cn/ 河南省公共数据开放平台,http://data.hnzwfw.gov.cn/ 湖南政务大数据公众门户,http://data.hunan.gov.cn/ “开放广东”政府数据统一开放平台,https://gddata.gd.gov.cn/index 海南省政府数据统一开放平台,http://data.hainan.gov.cn/ 四川公共数据开放网,http://www.scdata.gov.cn/ 贵州省政府数据开放平台,http://data.guizhou.gov.cn/index.html 陕西省公共数据开放平台,http://www.sndata.gov.cn/ 广西壮族自治区公共数据开放平台,http://data.gxzf.gov.cn/portal/index 宁夏数据,http://www.nxdata.com.cn/ 资产评估专家指引第9号 –– 数据资产评估31 开放数据资产估值白皮书联系人张立钧 普华永道中国区域经济主管合伙人 +86 (755) 8261 8882 james.chang@cn.pwc.com王莹 普华永道中国并购交易服务合伙人 +86 (21) 2323 2887 mendy.wang@cn.pwc.com詹睿 普华永道中国并购交易服务合伙人 +86 (21) 2323 8261 kate.zhan@cn.pwc.com李扬 普华永道中国数据治理及隐私服务管理咨询合伙人 +86 (10) 6533 7800 dennis.y.li@cn.pwc.com孙衍 普华永道中国转让定价和税务估值服务合伙人 +86 (21) 2323 2056 kenny.sun@cn.pwc.com章杨 普华永道中国区域经济经理 +86 (21) 2323 8078 yosef.y.zhang@cn.pwc.com以下成员对本次普华永道中国白皮书编写亦有贡献薛雯婷,普华永道中国转让定价和税务估值服务经理 田雪,普华永道中国数据治理及隐私服务管理咨询经理 覃家唯,普华永道中国并购交易服务高级顾问 匡诚,普华永道中国并购交易服务高级顾问 黄必澄,普华永道中国并购交易服务顾问 刘佳璐,普华永道中国并购交易服务顾问www.pwccn.com本文仅为提供一般性信息之目的,不应用于替代专业咨询者提供的咨询意见。© 2021 普华永道。 版权所有,未经普华永道允许不得分发。 普华永道系指普华永道网络中国成员机构,有时也指普华永道网络。详情请进入www.pwc.com/structure。每家成员机构各自独立,并不 就其他成员机构的作为或不作为负责。