作为一门新兴且综合性强的学科,数据经济学彰显出鲜明的时代特征与实践意义,对我国经济、社会等众多领域产生了深远的影响。中山大学国家发展研究院院长、岭南学院讲席教授赵昌文与清华大学社会科学学院经济学研究所副所长戎珂教授联袂创作的《数据经济学》一书,近期由中信出版社出版。该书力求突破传统经济学的分析框架,运用数据经济的独特视角,深入探索数据经济的运行规律及其对我国乃至全球经济的重要影响,构建了一个涵盖数据生产、交换、分配、消费的全体系分析框架,并归纳总结了数据经济学的基本原理。
围绕上述话题,赵昌文教授也向观察者网做了更深度解读,全文如下:
观察者网:随着中国互联网平台经济的快速发展,公众已经意识到,数据所有权无论对于国家安全还是个人生活,都会产生重大影响。目前各国对数据所有权的认定有哪些典型模式?各自的效果如何?
赵昌文:近年来,学术界对数据产权问题展开了一系列讨论,主要集中在数据是否应该有所有权、单一产权还是多重产权以及产权赋予谁这三个方面。对此,《数据经济学》第一章第三节有详细的文献梳理。对于数据是否应该有所有权,有观点认为,数据所有权会形成壁垒而阻碍其流动性,从而导致数据市场的扭曲,但大部分研究仍持数据应该被赋予所有权的观点。
对于单一产权还是多重产权,学术界也存在较大争议。有人提出基于数据的有限排他性,应创设一项具有限制性的数据财产权——数据生产者权;也有人提出企业与个人双重数据所有权的观点,其中包括个人的名义数据所有权和企业的实际数据所有权;还有人提出应建立“所有权+用益权”的框架。
目前,数据所有权的认定在全球范围内并没有统一标准,各国根据其法律体系和政策需求,采取不同的模式。主要有:
(1)数据拥有者模式,代表性国家和地区是美国及部分欧盟国家。这一模式更强调数据生产者权利,比如个人生成的数据通常被认为属于个人自己,个人可以决定数据的使用、分享和转让。其好处是有助于保护隐私和数据安全,但可能对数据分享和商业利用造成障碍。
(2)数据控制者模式,代表性国家和地区是部分欧盟国家和澳大利亚。这一模式更强调数据实际控制者,即负责数据管理的组织或个人的权利。其好处是提供了明确的数据保护标准和要求,但可能增加企业和机构的运营成本。
(3)国家所有模式,代表性国家和地区是俄罗斯等。这一模式更强调数据的国家主权,即政府拥有对数据的控制权。其好处是增强了国家对数据的监管能力,有助于维护国家安全,但可能影响跨境数据流动和国际商业活动。
(4)混合模式,代表性国家和地区是印度、巴西等。这一模式结合了上述不同模式的特点,比如数据的所有权可能归个人所有,但其使用则需要遵循特定的法则或由企业进行管理。其好处是试图平衡个人隐私保护与商业创新需求,但也可能增大法律合规的挑战。
观察者网:《数据经济学》一书中还提到了数据公有制的概念,跟我们熟悉的土地公有制是不是比较类似?相比于现有的模式,提出公有制是想解决什么问题,有哪些优势或者问题?
赵昌文:数据之于数字经济,在一定程度上相当于农业社会的土地和工业社会的资本,是极为重要的生产要素,明晰产权是建立数据交易规则、实现数据价值最大化和确保数据安全的前提条件。虽然关于数据的所有权依然存在很多争议,但数据确权是数据交易、流通乃至分配等环节的基础。从理论上讲,数据应该有明确的所有权,以便其所有者通过占有、使用或转让数据能够实现其经济或社会目的。十九届四中全会和二十届三中全会都强调提出,要健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制,也为数据要素参与分配提供了政策依据。数据作为一种生产要素参与生产和价值创造过程并因此获得回报,正是其所有权的经济实现。在实践中,一些大数据交易所也试图采用隐私计算、区块链等创新手段,以解决数据交易中所有权、使用权和隐私权的分离问题。
有学者提出,可以探索社会主义制度下的数据公有制,也有学者建议要建立数据共有制。虽然二者并不完全相同,但出发点都站在有利于充分协调利益关系、优化数据资源配置、理顺数据生产关系、规范收入分配秩序等方面。这个问题,《数据经济学》并没有更多的论述,还需要进一步深化研究。
观察者网:以我们熟悉的互联网平台为例,如果用户和平台都享有部分数据所有权,那么各方所占的权重应该怎么分配?用户以什么形式来分享数据收益?
赵昌文:《数据经济学》第一章第三节和第九章,都涉及到了数据要素的所有权和收入分配。在用户和平台之间共享数据所有权和收益的情况下,权重分配可以根据数据的重要性、贡献度、使用频率或其他标准来进行。主要有:(1)数据的来源和创造者。如果用户是数据的创造者,就应该享有较大的权重。平台作为数据存储、处理和分析的基础设施提供者,也应该获得一定的权重。(2)数据的使用和加工者。平台通过算法或其他技术加工用户提供的数据,这一过程会增加价值,因此也应得到权重。具体的权重分配,可能会因为商业模式和数据利用情况而有所不同。
数据收益分享方式主要是以一定比例分成给用户和平台。比如,根据平台和用户的权重比例来分配收益。除了直接经济回报外,还可以考虑给予用户数据的使用权或访问权作为回报。
观察者网:为了解决数字经济中收益分配不公平的问题,很多国家也在探讨数字税。数字税在中国落地的可行性有多大?征税方式如何设计?
赵昌文:数字税通常是一国政府对数字企业和数字经济活动征收的税种,核心是对通过数字平台提供搜索引擎、在线广告、社交媒体等数字服务获取收入的跨国企业征税,以确保这些企业在其运营的市场中支付公平的税收。数字税提出的直接原因是,全球大型互联网科技公司,无需在海外设立子公司或实体机构,就能覆盖当地用户并提供各类服务。目前,多个国家或地区已计划或实际开征数字税。例如,欧盟提出的数字服务税方案,适用于在线广告、数字中介等用户在价值创造中发挥主要作用的数字活动,征税对象是全球年收入总额超过7.5亿欧元且在欧盟年收入超过5000万欧元的数字企业,采用对总收入征税的形式,税率为3%。由于爱尔兰、卢森堡等低税率国家因担心会降低对外资的吸引力而反对,欧盟层面的数字税计划并未落地,反而是一些成员国率先启动。比如,2019年法国国民议会通过数字税法案,意大利于2020年起正式开征数字税,奥地利和西班牙分别在2020年1月和12月开征数字税。此外,已有包括印度、印尼、新加坡、马来西亚等亚洲国家率先开征数字税,加拿大的数字服务税法案从2024年开始生效。
作为全球经济的重要一员,中国支持国际社会关于数字税的各种讨论,也积极参与国际税收规则的制定。中国数字经济规模庞大,拥有较为成熟的税收征管体系。从长远看,应以国情为基础,充分考虑税收公平、监管要求、征收成本以及消费群体特征,积极开展数字税的政策研究和储备。关键是要明确哪些企业和业务活动适用于数字税,包括跨国企业和大型本土平台;税率如何设计,以确保税收的公平性;如何避免在国际贸易中引发摩擦,以及明确数字税的实施细则和争议解决机制等。对此,《数据经济学》第九章中“数据要素收入分配”部分有比较具体的理论分析。
2022年6月,中央全面深化改革委员会第二十六次会议提出,“要完善数据要素市场化配置机制,更好发挥政府在数据要素收益分配中的引导调节作用,建立体现效率、促进公平的数据要素收益分配制度。”在《数据经济学》中,我们提出了数据要素参与收入分配的三层制度方案,以初次分配为主,二次分配和三次分配为辅。数字税可以作为政府引导调节数据收益再分配的核心手段。对于数据要素参与二次分配,可以尝试使用数据收集费+数据增值税的数字税费模式。当然,这只是理论上的分析。
观察者网:尽管数据经济的发展可能产生大量的新就业岗位,但是结构性失业的群体往往也难以从事这样的岗位。那么数字税的用途是不是应该更倾向于这些失业群体?甚至可以设立专项计划?
赵昌文:这是一个很有意思但也很难回答的问题。数据经济和数字技术的快速发展确实可能会使一些传统行业的工作岗位被淘汰,同时新兴行业的岗位对劳动力的要求发生变化。这种情况下,结构性失业群体的再就业问题必须给予更多关注。《数据经济学》第七章“数据经济的宏观目标”的第三节数据经济与充分就业部分,对此有具体论述。
如前所述,数字税仍是一个新生事物。如果开征数字税,当然可以考虑优先用于支持这些结构性失业群体。一是可以用于职业培训和技能提升项目,帮助失业者提升他们在数字经济中的竞争力。二是可以用于设立创业基金,支持失业者或转型者创建自己的企业。三是可以用于提供心理辅导、职业规划服务和个性化就业指导,帮助失业者顺利过渡到新的职业生涯。四是可以用于增加失业救济金和社会保障,为失业者提供更长时间的支持和缓冲期。五是可以用于促进数字技术与传统行业的融合,在支持产业转型升级的同时为相关从业者提供支持。总之,包括数字税在内的政府财政支出的有效运用,都能够帮助一个社会更好地应对技术进步带来的挑战,推动可持续发展。
观察者网:个人隐私泄露、大数据杀熟都是大家经常诟病的现象,有哪些技术手段可以加强监管?
赵昌文:个人隐私泄露、大数据杀熟是现代数字经济、数字社会中面临的重大挑战。《数据经济学》第九章中“数据在市场匹配中的应用”部分有比较具体的理论分析。解决这一问题,既需要确保法律法规和社会伦理与技术进步同步,也需要不断完善各种技术手段。主要有:(1)数据加密。使用HTTPS等安全协议保护数据在传输过程中的安全,或者对数据进行加密存储。(2)数据匿名化和去标识化。对数据进行脱敏处理,去除能够直接或间接识别个人身份的元素。(3)访问控制和身份认证。除了密码之外,还需要手机验证码、生物特征等其他方式。(4)权限管理。严格控制不同用户的访问权限,确保只有授权用户才可以访问敏感数据。(5)实时监控。对数据访问进行实时监控,及时发现异常行为。(6)合规工具和合约管理。使用合规性检查工具确保数据处理符合相关法律法规。(7)数据生命周期管理。跟踪数据的生成、存储、使用和销毁全过程,确保得到妥善管理。(8)机器学习和人工智能。利用算法检测数据使用中的异常行为,以及利用隐私保护算法。
观察者网:目前国内的数据交易主要发生在哪些领域?能否用具体的例子说明一下,不同数据之间的价值有多大的差异?比如普通用户的个人信息、行为等数据,跟企业产生的业务数据,在实际的数据交易中是怎么定价的,占据怎么样的比重?
赵昌文:《数据经济学》从第三章到第六章,分别讨论了数据的供给、需求,数据市场类型、结构与交易模式以及市场均衡等重要理论问题。从实际看,国内的数据交易主要集中在金融、零售电商、公共服务、交通和地理遥感等领域。金融数据涵盖银行交易记录、信用评分等;电商平台积累用户购买行为数据;公共服务数据包括用电水平、人口迁徙等;交通数据涉及出行记录、车辆轨迹等;地理遥感数据包括水资源、农作物等。数据交易形式多样,价格因数据类型和用途而异。其中,个人数据如脱敏后的年龄、性别等在广告和市场分析中应用广泛,单个价值低但聚合后价值高。企业数据如销售记录、供应链数据等,对市场分析和战略决策有重要作用,价值高且商业机密性强。以运营商的数据为例,运营商数据可以通过三要素验真确保真实性,并根据通话时长、欠费停机次数等标签,帮助金融机构评估用户信用风险并防范欺诈。总体而言,个人数据交易量大但单位价值低;企业、金融和医疗数据交易量小但价值高,各自的比重是不断动态调整的过程。
《数据经济学》 赵昌文、戎珂 等著