【2017年9月19日】“互联网+税务”的技术拓展

caichang · 2021-8-11 13:50:10

“互联网+税务”的技术拓展

本文节选自------《互联网税收生态：共生·博弈·演化》

“互联网+”涉税大数据
国务院发布的《促进大数据发展行动纲要》从顶层设计全面部署了我国未来大数据发展的相关工作。涉税数据是国家经济数据的重要组成部分，统筹规划税务大数据资源，推动数据共享开放，强化涉税大数据分析应用，实现涉税数据的价值红利，必将进一步提升税务机关的治税能力，促进简政放权，有力促进国家整体治理水平的不断提高。

“互联网+”涉税大数据旨在充分发挥税收大数据的资源优势，面向纳税人和税务管理机关，全面深化涉税大数据在纳税服务和税收管理中的创新应用，逐步形成涉税大数据驱动型的管理创新机制，最大程度地释放大数据的创新潜力。

各级税务机关深入探索和研究涉税大数据应用在服务税收征管和面向社会经济发展方面的增值模式，及时了解纳税人的各项需求，为实现税收征管科学化、风险管控精细化、信用管理体系化，税收与经济运行协同化奠定坚实基础，力争打造税收系统大数据分析应用的“拳头”产品。在深化大数据应用过程中，应注重培养技术人才，逐步形成涉税大数据应用的技术团队，健全大数据安全保障体系，强化网络和数据安全支撑。

“互联网+”涉税云服务
云服务是以云计算技术与模式为主要特征的信息技术服务，包括SaaS（软件即服务）、PaaS（平台即服务）、IaaS（基础设施即服务）。云服务已经突破互联网市场的范畴，政府、公共管理部门、各类企事业单位都已经接受云服务的理念，并开始将传统的自建IT方式转为使用公共云服务方式，云服务真正进入其产业成熟期。云服务主要优势体现在降低互联网创新企业初创期的IT构建和运营成本，形成可持续的商业模式。大数据技术基于云的数据分析平台将更趋完善，大数据的分析工具和数据库也将走向云计算。

“互联网+”涉税云服务是税务部门实施“互联网+”税务各项行动的重要基础保障，侧重于构建基础设施层面的云服务，包括利用自有资源搭建云计算基础设施体系和面向社会购买云计算服务两个方面。为了适应“互联网+”税务行动计划的推进，税务部门积极引入云计算技术，搭建自己的私有云平台。国家税务总局通过实施全国发票查验系统建设项目，初步构建全国国税系统上下统一的云计算基础设施框架，各地税务机关在此框架下，不断丰富、充实和融入税务系统内部统一基础设施管理体系。

在面向社会购买云计算服务方面，根据服务方式和对象的不同，对于相对独立、与内部业务系统没有直接交互需求的系统，可以选择购买社会服务的方式，快速构建基础设施。对于与内部业务系统存在交互的系统，原则上应搭建私有云，如需购买云计算服务，必需做到独立、可控、可管。应提醒注意的是，云计算服务在带来便利性的同时，安全风险问题也很突出，税务部门必须高度重视相关安全问题，严格执行《关于加强党政部门云计算服务网络安全管理的意见》（中网办发文〔2014〕14号），在与云服务商合作的过程中，要充分认识到相关安全管理责任不变、数据归属关系不变、安全管理标准不变，涉及纳税人敏感信息的数据和系统不宜采用社会化云计算服务。

网络爬虫：工作原理及关键技术
网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂，需要根据一定的网页分析算法过滤与主题无关的链接，保留有用的链接并将其放入等待抓取的URL队列。然后，它将根据一定的搜索策略从队列中选择下一步要抓取的网页URL，并重复上述过程，直到达到系统的某一条件时停止。另外，所有被爬虫抓取的网页将会被系统存贮，进行一定的分析、过滤，并建立索引，以便之后的查询和检索；对于聚焦爬虫来说，这一过程所得到的分析结果还可能对以后的抓取过程给出反馈和指导。

相对于通用网络爬虫，聚焦爬虫技术还需要解决三个主要问题：(1) 对抓取目标的描述或定义；(2) 对网页或数据的分析与过滤；(3) 对URL的搜索策略。

爬虫技术主要应用于税务稽查。税务局运用“互联网”，依靠"网络爬虫"技术，自主研发了互联网涉税信息监控平台，在互联网信息汪洋大海中实时精准查找上市公司股权交易信息等，让税收征管效率倍增。现在国地税协作，大数据将共享，利用"网络爬虫"原理调用百度、搜狗等知名搜索引擎的接口，获取其他方面诸如实际关联公司、经济案件的法院判决结果等信息数据，是轻松简单的事情。未来，随着大数据技术技术向国际领域衍生，还将积极探索采集外语信息，将境外上市公司纳入监控范围，不断拓展“互联网”应用领域，进一步提升税收征管水平。

BP神经网络模型
人工神经网络就是模拟人思维的一种方式，它是一个并行、分布处理结构，它由处理单元及称为联接的无向信号通道互连而成。人工神经网络是一个非线性动力学系统，其特色在于信息的分布式存储和并行协同处理。人工神经网络的处理单元具有局部内存，并可以完成局部操作。

BP（Back Propagation）神经网络模型是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差反向传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。误差反向传播算法的运行过程，由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息，并传递给中间层各神经元；中间层是内部信息处理层，负责信息变换，根据信息变化能力的需求，中间层可以设计为单隐层或者多隐层结构；最后一个隐层传递到输出层各神经元的信息，经进一步处理后，完成一次学习的正向传播处理过程，由输出层向外界输出信息处理结果。当实际输出与期望输出不符时，进入误差的反向传播阶段。误差通过输出层，按误差梯度下降的方式修正各层权值，向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程，是各层权值不断调整的过程，也是神经网络学习训练的过程，此过程一直进行到网络输出的误差减少到可以接受的程度。BP神经网络模型主要应用于互联网背景下的税收预测领域，有较高的预测精度和较强的实用性。

帐号		自动登录	找回密码
密码			立即注册

[蔡昌] 【2017年9月19日】“互联网+税务”的技术拓展

本帖被以下淘专辑推荐:

相关帖子