Tax100 税百

  • 在线人数 1252
  • Tax100会员 27958
查看: 450|回复: 0

[税务研究] 深化税收数据增值能力研究

2万

主题

3万

帖子

3万

积分

专家团队

Rank: 10Rank: 10Rank: 10

积分
36008

2020税务高考

2021-1-19 06:50:09 | 显示全部楼层 |阅读模式
精选公众号文章
公众号名称: 税务研究
标题: 深化税收数据增值能力研究
作者:
发布时间: 2021-01-18
原文链接: http://mp.weixin.qq.com/s?__biz=MzU5MTgxNTQ5OQ==&mid=2247492143&idx=1&sn=4d2de8e29353f5d44772ec0025ceeecd&chksm=fe2b940bc95c1d1dc35fb4a70c8f1d6ef373f068448b969f7eb35a16ed91080b72f0141d1b60#rd
备注: -
公众号二维码: -



李万甫 刘同洲
中国税务杂志社
国家税务总局税收科学研究所

一、引言及文献综述
数据正成为新时代国家治理现代化的关键性要素,数据治理能力是衡量国家治理能力现代化的重要标志,在复杂数据中充分挖掘数据资源的价值是数据治理的首要目标。习近平总书记提出:“要运用大数据提升国家治理现代化水平。”党的十九届四中全会首次将数据作为生产要素进行表述。顶层设计将数据作为新型生产要素来定位,意味着数据已成为最重要的国家战略资源,是继土地、劳动力、资本之后,全球数字经济竞争的新赛道。《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》的适时出台,对标了国家战略要求,旨在破除数据价值挖潜的体制机制障碍,凝聚各方协同发掘数据价值。党的十九届五中全会进一步提出建立数据资源产权、交易流通、跨境传输和安全保护的制度规范,为数据资源开发利用“保驾护航”。
税收数据作为数据资源的重要组成部分,是提升税收治理能力的基础性要素,税收数据治理与税收治理现代化直接相关。因此,税务部门在数据治税的实践与应用方面,进行了一系列的探索,并取得了一系列显著成效。在数据大集中时代,谭荣华 等(2009)提出了金税三期工程的基本框架,“一个平台、两级处理、三个覆盖、四个系统”的顶层设计架构为税务系统内统一执法、扁平管理和科学决策奠定了基础。根据信息化发展的“诺兰模型”(Nolan,1973),大集中与大数据并不对立,而是信息化发展的两个阶段。金税三期工程是基于数据大集中(系统内集成)而设计的,中心任务是结束数据分散,实现系统整合(谭荣华 等,2014)。信息化建设进入大数据阶段(全社会集成),大数据治税的要求以及金税工程建设目标体现在跨部门、跨系统的信息互联互通、数据驱动、高效便捷与科学预测决策上。在此背景下,李万甫 等(2016)提出了构建我国“互联网+税收大数据”应用机制,王敏 等(2018)在重塑“互联网+”税收征管模式核心理念的基础上,构建了一个最适税收征管模式的理论分析框架。在税收管理实践中,创新科技的赋能效用愈发显著。刘尚希 等(2016)基于跨部门涉税数据,将机器学习法应用于税收风险识别,建立了一套以机选系统为核心的高效纳税评估机制。四川省国际税收研究会课题组(2020)认为,大数据应用价值的最大化,在于以大数据、云计算等信息技术为依托,构建数据智能化的税收征管模式。
数据的价值不在于其本身,而在于“使用”。所谓“使用”,是对海量数据的整合、计算、分析、开放,掌握新信息,获得新知识,创造新价值。这也是大数据价值的源泉。而数据创造的真正价值,在于能否提供稀缺的增值服务,这种增值服务就是数据分析与挖掘(Cohen 等,2009)。因此,大数据治税的关键在于挖掘数据的潜在价值。然而一直以来,“信息孤岛”、信息壁垒等问题时常导致大数据价值无法得到充分体现,税务部门涉税数据分析与挖掘能力亟待提升(雷炳毅,2016),且新技术、新业态、新模式所造就的复杂数据环境又加剧了数据价值的“深藏闺中”。应当明确的是,大数据也不仅仅是数据本身,还包含数据中所运用的信息技术与大数据思维。故大数据治税的核心价值在于将“互联网+ 税务”理念与信息技术镶嵌于税收治理中,通过海量涉税数据的采集、存储和关联分析,获得新信息和新能力(杨林林,2017)。
上述文献对数据价值以及大数据治税进行了积极的研究探索,为本文分析提供了坚实的基础。但从现有文献看,多数文献集中于大数据在税收管理中的应用研究,有关税收大数据价值“使用”的系统性、理论性研究相对不足,以数据增值为研究视域的文献较少,缺乏一个能支撑全局、聚焦税收数据增值的理论分析框架。虽然部分文献对税收大数据价值的“使用”有所涉及,但逻辑基础、框架设计以及各层级建设目标多基于数据大集中时代的理念,与大数据时代税收信息化建设的“数据驱动、互联互通、高效便捷、科学预测决策”要求仍有差距。就技术层面而言,税收数据增值的实现工具——数据挖掘能力相对滞后,现有文献以理论模型与计量方法研究居多。由于复杂数据的本质是非线性数据,面对税收数据的非线性、非正态分布且常伴随缺失值的数据特点,基于理论模型与经典假设的传统方法在数据挖掘深度、分析结果精度与区分度上稍显乏力。有鉴于此,本文从税收数据增值(税收大数据“使用”)的系统逻辑出发,并在此逻辑框架下聚焦深化数据挖掘能力,以数据包容度见长的机器学习法为引导,结合社会网络分析、数据可视化与人工经验等方法,在诸多税收增值服务场景中选取税收收入预测与税收风险管理,试图破解现有大数据价值“深藏闺中”的普遍问题。

二、税收数据增值的系统逻辑
税收数据治理的首要目标在于挖掘复杂数据背后蕴含的价值。本文以实现税收数据增值为导向,构建了系统性、理论性的税收数据“使用”的逻辑框架,主要包括大数据采集、大数据预处理、大数据存储与安全、大数据分析与挖掘、大数据应用五个层次(详见图1),具体逻辑关系如下。

(一)逻辑起点:大数据采集
大数据采集是税收数据增值的逻辑起点。数据采集能力如若滞后,将导致大数据治税成为“无源之水、无本之木”。税收数据生成机制决定了税收数据应用的效率,故大数据采集层建设应以“数据可知、数据可取、数据可联”为目标,保障数据初始端口的真实性、全面性、多元化,聚焦构建多渠道、多维度的数据采集体系,拓展税务系统内部数据与外部数据采集的渠道,为实现内外部数据的互联互通与分析比对奠定基础。其中,拓宽内部数据来源主要是将企业财务数据与自然人数据纳入采集范围;拓宽外部数据来源主要是获取其他政府部门数据、第三方数据以及国际情报交换的离岸税收数据,尤其是银行、证券交易所等金融机构的数据以及互联网数据。随着金税三期工程的完善与“互联网+ 税务”行动的深化,包含税务端数据、企业端数据、第三方数据、互联网数据的数据采集体系初步构建,信息不对称与“信息孤岛”等问题总体改善,但涉税数据全社会互联互通仍任重道远。此外,税务部门跨部门数据采集应有《税收征管法》作为法律支撑,应明确税务部门数据获取的权责划分,赋予其主动获取涉税数据的权力。更重要的是,要明晰其他政府部门、第三方机构的涉税信息报告义务、规则以及拒绝履行义务情况下的责任追究,给予税务部门涉税数据采集强有力的法律保障。这既是我国税收治理能力现代化的必然要求,也是发达国家大数据治税的经验与共识。
(二)必要前提:大数据预处理
大数据预处理是税收数据增值的必要前提。该层次建设以“数据可用、数据实用”为目标,以数据标准化为核心,对数据采集层上报的数据统一定义、统一口径、统一标准,将多种涉税数据加工整理,保障数据质量的“真实性、完整性、精准性”,具体包含数据辨析、数据筛选、数据清洗、数据转换、数据整合多个环节,主要处理对象为发票信息、纳税评估、税务稽查等事务数据以及其他公共部门数据。大数据预处理水平的高低体现在对数据无序性、缺失性与重复性等典型数据资源的处理上,如若处理不当,极易侵蚀税收数据增值逻辑的基础架构,影响后续的大数据分析与挖掘效果。近年来,随着税务系统内各层级数据中心的加速完善,数据预处理能力显著提高,但现有数据预处理方法多针对结构化数据,针对非结构化与半结构化数据特征的预处理方法仍有待加强。因此,未来大数据预处理层建设应聚焦非结构化与半结构化数据的处理,有效解决数据属性值缺失、偏差大、不易被机器解读等问题。
(三)运行保障:大数据存储和安全
大数据存储和安全是税收数据增值的有力保障。其规划建设应匹配大数据分析与挖掘层对数据处理性能的要求,即应满足该层次多维度税收数据即时调用分析计算的业务需求,进而支持科学预测决策。囿于税收数据规模巨大、非结构化数据与半结构化数据激增的现实状况,单一的关系型数据库已不能满足上述要求。基于此,通过构建混合型分布式存储系统,既能对结构化数据、非结构化数据与半结构化数据混合存储,也能对数据库、文件系统等多种存储系统进行数据存储,并提供统一的数据操作接口。大数据存储与安全层建设的核心是搭建分布式数据存储架构,并逐步与人工智能技术相融合,实现对数据处理性能的自调优、自诊断、自运维。同时,也应尽快引入图数据库技术,利用其对复杂关系网络处理的性能优势,助力税务部门的关联方交易分析等业务。目前,国家税务总局依托阿里云打造的智慧税务大数据平台已建设完成,通过运用分布式海量计算技术,实现了计算速度2 000倍的提升,保障全国省级税务机关核心涉税数据的当日计算、存储、汇集。此外,大数据存储过程中时常面临因管理与技术漏洞产生的数据泄露风险,构建与数据存储能力相匹配的数据安全保障体系至关重要。就顶层设计而言,出台《信息安全技术大数据安全管理指南》等数据安全国家标准,可以让数据安全保障有制可守、有规可循,提升数据存储及其管理的标准化与规范化水平。就技术而言,需要对敏感数据进行加密存储,并打造涉密数据的监测、预警、控制和处置一体化的安全防护系统。
(四)核心价值:大数据分析与挖掘
1.税收数据增值服务和大数据分析与挖掘的内在逻辑。大数据分析与挖掘层建设以形成税收数据增值服务为最终目标,数据分析与挖掘是达成该目标的技术性工具,技术性工具运用是否恰当,对税收数据增值服务的精准性与科学性起决定性作用。其中,税收数据增值服务的核心内容是“评价纳税行为、监控执法过程、优化纳税服务、提供决策支持”。于数据挖掘而言,其本质是一种知识发现的过程。数据挖掘基于统计学、数据仓库、机器学习、人工智能等多项理论与技术,将数据应用从简单的数据查询提升至归纳推理数据中不为人所认知的信息和趋势,进而分析预测未来情况,辅助决策者评估风险与科学决策。疫情期间,税务部门通过分析增值税发票等税收数据,对企业复工复产状况予以关联分析与深度挖掘,为党中央、国务院统筹推进疫情防控和经济社会发展提供了重要参考,就是一个典型例证。实际上,税收数据增值服务的生成,如同产品的生产过程,以全文检索、精准查询、多维分析、综合分析为代表的生产方式(数据分析)在高质量税收数据增值产品的供给上稍显乏力,急需以回归分析、关联分析、聚类分析、机器学习为代表的生产方式(数据挖掘)的优化升级。当然,深化数据挖掘并不是忽视数据分析,两者应协同匹配,共同发挥合力,从而提升税收数据增值服务的质量。
2.大数据分析与挖掘的“承上启下”支柱作用。大数据分析与挖掘是税收数据增值系统逻辑的核心价值,发挥着“承上启下”的支柱作用。就整个逻辑架构而言,无论是由大数据采集、大数据预处理、大数据存储与安全所构成的逻辑基础,还是由大数据应用所构成的场景实现,只有通过大数据分析与挖掘的支撑,整个系统方能运行通畅。若将税收数据增值的逻辑架构视为产品的生产流通过程,大数据采集、大数据预处理、大数据存储与安全则分别代表不同层级的原材料,通过对原材料的逐层“优化提纯”,才能保障大数据分析与挖掘层次生产要素的高质供给。税收数据增值服务代表产成品,数据分析与数据挖掘代表生产方式,通过差异化生产方式对生产要素的加工升级,生成多维度功能的增值产品,进而满足企业部门、税务部门以及其他公共部门的业务需求;大数据应用代表着增值产品投入市场后的流通方向,供应于企业或个人将降低交易双方因信息不对称产生的风险,是增值产品商业价值开发与应用的体现,供应于税务部门则助力政策决策的科学性与前瞻性,供应于其他公共部门则有利于推进社会协同治理,通过税收数据增值产品为各部门的市场行为与政策决策提供智力支持。
(五)场景实现:大数据应用
大数据应用是税收数据增值的成果展示层,是新时代税收职能的场景应用。新时代税收工作既要完善财政资金筹集、宏观经济调控、收入分配等经济职能,更要履行新时代赋予的社会治理职能,上述职能在税收数据增值的顶层架构得以实现,主要体现为商业价值开发与应用、科学预测决策、社会协同治理。其中,大数据商业价值开发与应用是一个混合性公共产品补偿问题。从税务端而言,税务部门将一部分税收数据增值服务对市场主体开放共享,通过收取一定的费用以补偿数据采集、预处理、存储、分析与挖掘过程中的成本,促进数据资源可持续供给;从企业端而言,企业通过购买税收数据增值服务,一方面可基于此与用户需求精准匹配,明晰产品导向,切实把“数据”作为新型生产要素去推进企业产品与服务的价值创造,另一方面可以有效规避交易风险。因此,税收数据增值服务的开放与共享会产生一个企业、个人、税务部门多方受益的生态系统,企业将数据要素投入生产则可创造就业岗位、增加收益、规避风险,个人能够获得个性化更强、品质更高的产品与服务,税务部门除了在初始阶段能够获得一定补偿,更通过税收数据协助企业取得业务增长和效益提升,进而涵养税源。当然,税收数据增值服务的市场化配置边界也不应忽视。科学预测决策包含两个维度。一是使税收政策效应最大化,通过税收数据增值服务预先判断经济趋势,为宏观经济逆周期调节、税收收入预测等领域提供决策支撑。二是税收政策与财政金融等宏观政策深度融合、有效衔接,发挥“政策组合拳”的协同效应。相较于传统管理型社会中的碎片化治理,社会协同治理是基于各个公共部门数据交换共享后所形成的信息资源网络,通过组织机构的联结互通与行政流程的协同配合,打造一体化的公共服务平台。疫情防控期间,税务部门联合银保监会推出“税银互动”即为协同治理的一次初步尝试,将企业纳税信用转化为融资信用,为小微企业融资难融资贵纾困解难。
综上可知,随着近年来税务部门“数据治税”建设的推广和深入,税收大数据采集与预处理能力显著提升,大数据应用前景广阔,但底层架构(大数据采集与预处理)的初步实现并不能掩盖大数据分析与挖掘相对不足的“短板”,且大数据应用的场景实现多基于数据挖掘后的新信息、新知识、新价值,数据挖掘能力的相对不足容易造成大数据应用层的“先天劣势”,较大程度上抑制了数据增值服务的深度。因此,如何在巩固底层架构的前提下,聚焦深化大数据分析与挖掘能力,进而形成以大数据分析与挖掘为支撑的现代化决策机制,既是实现税收数据增值的当务之急,更是实现税收治理能力现代化的核心命题。

三、数据挖掘在税收数据增值服务领域的应用场景
相对数据分析,数据挖掘是更高阶技术工具,是实现税收数据增值的必由之路。数字经济时代,税务部门面临纳税人经营模式复杂性、交易主体隐匿性、交易资产超流动性的挑战,传统数据分析方法下的数据查询、结果比对、指标分析与模型设计并不足以对纳税人行为进行全面、深度、动态的“画像”。时常表现为,指标体系与分析模型对数据间的逻辑关系以及涉税风险点精准呈现不足,模型分析结果与实地核查结果不相一致等问题。此外,由于算法歧视造成价值规则与定价方式被重新定义,互联网企业的收入形成与财富分配方式大为改变,造成税源更加的多样化与复杂性,时常表现为“找不到纳税主体、理不清税源关系”。税情的严峻性迫切要求从算法、模型入手,聚焦技术工具的换代升级,挖掘海量数据的潜在价值。
(一)在税收收入预测中的应用
大数据的核心价值之一在于预测,通过预测能够协助政策决策更具前瞻性与科学性。当前,我国经济面临结构性、体制性、周期性问题相互交织所带来的困难与挑战,加之新冠肺炎疫情冲击,减税减收与有为增支矛盾凸显,财政收支平衡问题备受关注。税收收入作为财政收入的主体部分,其预测的前瞻性不仅关乎税收计划的制定与国家预算的编制,也关乎“六稳”“六保”政策目标的实际落实,更是高层决策与全局部署的关键性参考。囿于税收数据的高度非线性、耦合性和动态性,以及现有预测方法与模型的不足,本部分试图弥补现有预测方法与模型的短板,提供一种税收预测的优化路径。
1.传统税收收入预测方法有待提升。税收收入预测是利用海量税收数据,分析影响税收收入的各个因子,运用理论、方法和模型预测未来税收收入。由于税收数据具有非线性、耦合性与多重因素影响下的复杂性,加之近年来税制调整变化较大,传统预测方法仍有待提升,集中表现为:线性回归分析模型的预测是以既有经济理论为基础,以固定的参数去刻画变动的经济发展状况,对于非常规冲击引起的经济数据和税收数据的变动,缺乏解释能力,不能有效反映数据变动背后所隐含的信息、逻辑与规律,难以作出精准预测。新冠肺炎疫情背景下经济不确定性加剧,上述问题会更加突出。神经网络模型虽然适用于税收数据高度非线性的特点,但单独的神经网络模型最小化会产生“过度拟合”现象,导致预测精度下降。判断预测法是根据专家判断对税收收入予以预测,受主观因素影响较大,预测精准性不易控制。
2.PSO-LS-SVM模型在税收收入预测中的应用。随着计算机科学与技术的发展,决策树、分层聚类、关联规则分析等以机器学习为主的数据挖掘方法备受瞩目,其中又以支持向量机(Support Vector Machine,SVM)方法对税收收入预测提供的思路最为常用。支持向量机的主要思想是建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的距离最大化,从而对分类问题提供良好的泛化能力。目前,支持向量机模型对税收收入预测的精准性主要取决于其模型的参数优化,参数优化方法又以粒子群优化算法(PSO)为代表,主要原因在于:该算法不依赖于问题信息,有较强的通用性;参数调整相对较少,算法较易实现;具有较强的全局协同搜索的能力和全局优化的特性,更容易发现全局最优值,对于疫情背景下的经济不确定性有较佳的预测效果。结合支持向量机标准模型与粒子群优化算法的机理可知,首先通过控制预测误差的取值,采用粒子群优化算法对最小二乘支持向量回归模型(LS-SVM)中的参数近似寻优。由于粒子更新受自身经验和群体经验的双重影响,整个迭代过程更具方向性。其次,以粒子群优化的最小二乘支持向量机模型(PSO-LS-SVM)对税收收入进行预测。最后,选取差分整合移动平均自回归(ARIMA)模型、BP神经网络模型、标准SVM模型予以误差比,验证PSO-LS-SVM模型是否在其他预测模型中误差最小,进而验证该方法下的税收收入预测精准度。上述思想如图2所示。

(二)在税收风险管理中的应用
数字经济时代纳税主体的经营模式愈发复杂,交易主体的跨国别、跨地区、跨行业,交易资产的隐蔽性与虚拟化,导致部分地区税源管理“找不到纳税主体、理不清税源关系”。作为税收风险管理流程的逻辑起点与关键环节,税收风险识别本质上是发掘海量数据间的规律并提取风险特征的过程,同大数据分析与挖掘具有天然的逻辑一致性。税收数据增值的系统逻辑已然表明,解决上述问题的关键在于以信息技术提升数据间内在规律的挖掘能力与利用水平。
1.传统税收风险识别方法有待改进。传统的税收风险识别法包括税务审计法与机器学习法。税务审计法比较依赖税务人员的经验与技能水平,在海量涉税数据与有限人力的制约下,数据采集、预处理、分析与挖掘的工作量巨大,风险识别周期长、成本高,且税务审计法受人为因素影响较大,风险源搜寻精度偏低。为了应对税务审计法的局限,近年来以关联分析、聚类分析为代表的机器学习法逐步应用于实践,虽然在风险识别的精度与有效性上大幅提高,但简单的“逃税”与“非逃税”的分类方式缺乏详细的分类解释与依据。数字经济背景下,以关联方交易为代表的复杂组织结构极大地考验着税务风险识别的方法与模型。
2.基于纳税人社会关系网络的数据挖掘应用机理。根据意大利税务局最新公布的实践经验,大数据时代税收风险识别是一个以实现人机交互为导向,综合运用社会网络分析、机器学习、信息传播、数据可视化、人工验证等方法,不断迭代反复调优的过程(详见图3)。

如图3所示,匹配阶段是税务部门基于先期经验将纳税人可能涉及的税收不遵从行为特征化,并存储于图形特征库中,之后利用图数据库技术梳理纳税人关系网络,并将前后两者图形相匹配,根据匹配结果计算关联指数,进而提取关系网络特征,为第二阶段的机器学习奠定基础。本阶段的重点在于构建纳税人关系纽带并以社会网络的形态呈现,即通过明晰交易各方的经济往来、股权关系、亲属关系等事项,将复杂的关联关系图形化,直观把握各方交易的内容与实质。社会关系网络是一个描述各个关系主体(纳税人)及其属性的模型,其将每个纳税人设为一个节点,将每个纳税人的注册类型、位置、行业、税率等要素视为节点的属性。同时,将各纳税人之间的利益关系设为一条边,将纳税人利益关系的类型、关联度、交易日期与所涉及金额等要素作为边的属性,其中根据纳税人利益关系的类型,将亲属关系、相互持股关系设为双方向边,将股权关系、法定代表人关系和交易关系为单方向边,即可构建出纳税人交易行为的网络图形,之后将网络图形与税务专家所设定的交易模式相互匹配,进而提取纳税人利益关联的结构特征与关联交易逃税的业务特征。实际上,社会网络分析是将多维度、多来源、看似无关联的海量数据予以辨析、筛选、清洗、整合,是大数据采集层与大数据预处理层建设效果的具体展示。
机器学习阶段以预测各纳税人的税务风险为目标,基于匹配阶段纳税人利益关联的结构特征与关联交易逃税的业务特征,通过机器学习算法与模型对纳税人税务风险予以量化打分,识别出高风险纳税人。其中,预测模型寻优的过程相对复杂,要比较诸如回归模型、支持向量机、随机森林、神经网络等多个模型涉及的指标与参数,具体包括总体风险识别精度、高风险识别精度、敏感度、总评分等指标。该阶段的风险预测结果会拓展纳税人关系网络并在下一阶段予以传递。
一般而言,高风险纳税人对其关联方造成的负面影响较大。因此,将已预测的纳税人税收风险信息在其社会关系网络中传播,以识别纳税人潜在税收风险。实际上,风险信息传播的过程是一系列迭代的过程,首次迭代的税收风险通过前一阶段被分类为高风险的纳税人(风险源)以随机的形式在其社会关系网络中传播,纳税人社会网络所涉及的利益关系权重越大,税收风险沿该关系传递的可能性越大。首次迭代之后,被传递到的社会关系将成为下期迭代的源头,以此类推直至风险与纳税人社会网络无利益关系为止。本阶段将极大地拓展纳税人社会关系网络,也会据此得出纳税人税务风险的评分。
可视化验证阶段是将税收风险评分的社会关系网络输入到可视化界面,构建交互式可视化环境,以便税务人员观察纳税人社会关系网络,对纳税人真实风险予以更精准的审核,与图形匹配、机器学习、信息传播阶段所计算的税收风险相互验证。通过风险的可视化验证,税务人员更容易发现新的风险图形特征以及在前阶段被分类为低风险但实际具有高风险特性的纳税人,之后将新模式新特征补充至税收风险特征库,实现整个风险识别流程的闭环(如图3所示)。就全文逻辑框架而言,本部分是税收风险管理这项增值服务的具体展示,进一步表明大数据应用的实际效果有赖于大数据分析与挖掘能力建设。综合运用多种信息技术并发挥好其合力是该层建设的关键。
综上所述,发达国家在综合运用多种数据挖掘技术的同时,并没有摒弃人工审核,而是将税收管理与决策置于人的控制之下。实际上,基于人工验证的可视化环境弥补了图形匹配、机器学习、信息传播阶段的部分结果失真,有助于税收管理与决策的“提质增效”。因此,科技赋能与人工经验应是相互补充、相互验证、相互优化,最终实现人机交互。

四、税收数据增值逻辑架构的优化路径展望
如前文所述,税收数据增值是以大数据采集为逻辑起点,大数据预处理为必要前提,大数据存储与安全为运行保障,大数据分析与挖掘为核心价值,大数据应用为场景实现的系统性逻辑框架,各层级的税收信息化建设都应依托于此系统性架构。数字经济时代,任何逻辑架构都需要不断迭代升级,未来应着重提升税收数据增值逻辑架构的自我更新优化能力,具体如下。
(一)顶层设计优化:以数字政府总体框架锚定税收数据生成源头
税收数据增值除了关注数据本身的属性,关键是要研究数据生成的源头——税收业务流程,业务流程的设置将决定税收数据的生成。数字经济时代,税收业务流程不应是传统征管与服务流程的电子化和数据化,而应是在考量传统业务流程与数字经济新业态新模式匹配度的基础上,对流程予以“先减后加”式的再造重构,但“减加”的内容与技术保障,应对标国家治理,放在数字政府建设的总体规划框架下考量,由上至下地研究税务部门在数字政府总体框架下的职能定位与作用,以数字政府总系统的规划框架锚定“智慧税务”子系统的数据生成源头。
(二)底层数据整合:以数据中台夯实逻辑基础链接业务场景
当前,急需推进数据集成整合共享,强化业务部门和数据管理部门的协同共治机制。但由于数据采集标准、数据结构定义标准、数据接口标准、数据存储标准、数据共享标准仍未完全统一,数据标准化建设推进缓慢。因此,可借鉴大型互联网企业与国有大型金融机构数据整合共享的成功经验,尽快引入数据中台架构,将分散、孤立的税收数据整合、统一与共享,夯实税收数据增值的逻辑基础。此外,智慧税务建设需要整合众多信息系统,数据中台可作为系统间的数据桥梁,进行跨业务的数据整合与数据挖掘,打造智慧化、一体化的税务云平台,进而实现对税收数据整合共享和业务应用的协同联动。
(三)创新科技赋能:构建以人机交互为导向的算法群与多模型组合
大数据分析与挖掘的方法、模型的选用,关乎税收决策的前瞻性、纳税服务的精准性、税收治理的有效性,对整个逻辑框架起决定性作用。税收收入预测与税收风险管理的应用经验表明,综合运用算法群与多模型能够提升数据挖掘的深度与精度,发挥群策群力的优势,结论更加逼近真实值。同时,算法群与模型的组合并不排斥人工经验分析,并不以模型为唯一,而是以人机交互为导向,进而实现“人在干、数在转、云在算”。因此,提升税收数据挖掘能力要结合数据基础与人工经验,实践中并没有最优的模型,只有更适合的模型。
(四)法律法规支撑:厘清数据归属权与利用权间的关系
数据利用权在整个数据财产权利保护中居于核心地位,厘清数据归属权与利用权之间的关系,是税收数据增值服务市场化应用的法律前提。税收数据增值逻辑的这种“底层数据不动,增值服务输出”模式,有效规避了数据归属权争议,实现了数据增值服务的向外输出。虽然该模式已有央行“个人征信”的类似实践,但还应出台相关法律法规予以明晰纳税人数据归属权与税务部门的数据利用权。
新时期,创新科技赋能税收征管已成为我国税收治理能力现代化的重要组成部分,创新科技突破了先前数据内在规律探索的技术性短板,在收入预测、风险管理等应用场景上不断拓展,在推进税收治理能力现代化上成效显著。同时也应认识到,综合运用信息技术所产生的数据增值,应在治国理政中发挥更大作用,税收治理体系与治理能力理应协同匹配、相互促进。但相较于税收治理能力现代化的“快步前进”,税收治理体系现代化进程却相对滞后。当前,亟须建立基于“数据要素”价值增值与开发利用的课税制度与标准规范。就历史逻辑而言,资本、劳动力、土地应用于生产流通则形成价值增值进而课以要素税。数据作为新型生产要素,也会在流动、加工、分享中创造价值,也应当构建与“数据要素”相匹配的现代化税收制度,这既符合对生产要素课税的历史逻辑,也是税收治理体系现代化的必然要求。数字经济背景下,给予税收制度设计的时间与空间并不充裕,税收治理能力现代化应在倒逼税收治理体系现代化上更加有为。在更广的视域下,创新科技与税收治理应跳出“就技术论技术,就税收论税收”的思维局限,应对标国家治理,对位党和国家事业全局。所谓“数据赋能治理”,这个治理全局不仅是传统意义上税制改革和征管改革,更是“五位一体”背景下对税收治理的全面创新发展,这是新时代赋予数据治理的历史使命,即以税收数据治理为契机,将税收数据增值的技术红利转化为现代国家治理效能,更好地发挥税收在国家治理中的基础性、支柱性、保障性作用。
(本文为节选,原文刊发于《税务研究》2021年第1期。)

END
《税务研究》2021年选题计划
《税务研究》投稿须知
“数字经济与税收治理”征文启事
第八届“邓子基财税学术论文奖”获奖名单公示
“国家治理与地方税体系建设”研讨会征稿启事
《税务研究》2020年总目录


点击“阅读原文”快速投稿~
640_1611010209366.jpg
回复

使用道具 举报

Copyright © 2001-2013 Comsenz Inc. Powered by Discuz! X3.4 京公网安备 11010802035448号 ( 京ICP备19053597号-1,电话18600416813,邮箱liwei03@51shebao.com ) 了解Tax100创始人胡万军 优化与建议 隐私政策
快速回复 返回列表 返回顶部