Tax100 税百

  • 在线人数 1933
  • Tax100会员 28064
查看: 254|回复: 0

[税务研究] 智能画像技术和服务推荐技术在电子税务局中的应用场景探讨

2万

主题

3万

帖子

3万

积分

专家团队

Rank: 10Rank: 10Rank: 10

积分
36013

2020税务高考

2022-4-16 07:00:11 | 显示全部楼层 |阅读模式
精选公众号文章
公众号名称: 税务研究
标题: 智能画像技术和服务推荐技术在电子税务局中的应用场景探讨
作者:
发布时间: 2022-04-15 08:57
原文链接: http://mp.weixin.qq.com/s?__biz=MzU5MTgxNTQ5OQ==&mid=2247498800&idx=1&sn=e2924e7dc38eb0de20bc0657f6020a48&chksm=fe2b8a14c95c030237f1982c2b6812eadfa4356ae188482ec4a92dba0bf0d29959b3528a9032#rd
备注: -
公众号二维码: -


作者:
单伟力(国家税务总局河北省税务局)
张 晗(国家税务总局河北省税务局)
李 丹(国家税务总局河北省税务局)

随着经济社会不断发展,信息化已加速融入到经济社会各领域,智慧化已经成为当今信息化发展的鲜明特征。2021年3月,中共中央办公厅、国务院办公厅印发了《关于进一步深化税收征管改革的意见》,将智慧税务建设作为征管改革的重要任务进行部署。2021年9月,王军局长在《深化税收征管改革顺应人民群众期盼》一文中进一步明确了智慧税务的发展方向:“深化数据分析应用。智慧税务将如同一个拥有数据生命的‘智慧人’,能够及时感知各方需求并自动灵敏地作出反应,为纳税人缴费人提供精细化、智能化、个性化服务,智慧税务将通过‘算法’准确识别个性化需求并精准提供优质服务,就像在网上买了一双鞋,系统就自动推送袜子信息一样,纳税人缴费人通过信息系统了解某一方面的税收政策,系统就可以向其推送与之相关的政策及操作信息。”为了尽快达成智慧税务建设目标,电子税务局作为面向纳税人服务的第一窗口,需依托最前沿的技术,摒弃传统理念,侧重于关注纳税人个体特征、行为偏好、操作习惯,从后台进行数据化处理、智慧化分析、个性化感知,精准识别纳税人特性,做到功能自动推送、信息自动关联、政策定向匹配,装上“智慧”的大脑,以精准服务满足个性化需求,大幅提升纳税人使用体验。

一、用户画像及推荐技术研究现状
交互设计之父库伯(Cooper)提出了用户画像(persona)的概念,他认为用户画像是真实用户的虚拟代表,是一种建立在真实数据上的用户标签模型。近年来,国内学者对用户画像技术的研究和应用也取得不小的成果。李佳慧 等(2019)从电子商务角度研究了以RFM模型K-means聚类算法用户画像的构建,杨晓梅 等(2021)从互联网金融角度研究了使用K均值算法构建用户画像技术,陈昊 等(2021)动态实时地对不同用户建立能反映该用户权限、职能、角色的可被计算机理解的用户画像。推荐技术是以“推”为关键,利用知识发现、数据挖掘、人工智能等方法为用户主动提供智能化、个性化服务。推荐技术的核心是推荐算法,根据推荐策略的不同,目前主流的推荐算法可分为协同过滤推荐、基于内容的推荐和组合推荐三类。
现阶段,电子商务商品推荐是画像和推荐技术应用最广泛的领域。以京东、淘宝等为代表的电商平台对网购行为带来的海量数据通过筛选后,通过画像技术对用户行为进行数据分析,构建虚拟用户形象、偏好与需求,通过手机App为用户提供个性化的产品与服务。近年来在用户中广泛流传的电商平台年终消费总结等即是依托用户画像技术推出的个性化服务的典型代表。各大电商平台还会根据消费者的消费行为和消费习惯推送符合消费者喜好和需求的产品。除此之外,音乐平台、网约车、外卖等消费平台也都在发展过程中广泛使用了用户画像和推荐技术。
运用画像技术提炼纳税人典型特征,对纳税人数据实施标签化管理,可有效提高服务精准化、差异化和管理高效化,能够有效克服现阶段电子税务局存在的便捷性欠缺(查找难度较大)、针对性不强(难以实现信息服务精准推送)、智慧化水平较低(对纳税人数据挖掘和应用存在欠缺)等问题。与其他行业相比,画像技术在税务系统的应用尚处于尝试阶段。展望当今政务平台的发展方向,电子税务局在大数据、人工智能的大趋势下必将有所作为,寻求突破。精准、优质的服务,是新形势下更高层次的税务信息化服务应当实现的目标。构建纳税人动态画像及推荐技术模型的本质是实现纳税人特征可视化和动态化,即从海量数据中发现数据间的关系和关联规则,并通过挖掘这些对应关系,将定性分析转变为定量分析并直观地展现出来。

二、纳税人画像构建过程分析
纳税人画像的构建过程主要是通过采集、分析与处理纳税人在办理涉税事宜过程中的基础数据和行为数据,采用合适的画像算法有效地运用这些数据,充分释放这些数据的潜在效应,找出各项业务办理的共性规律,进而构建纳税人行为标签库,以纳税人行为标签库为基础对纳税人进行个体与群体的粗略画像,实现对纳税人需求的精准预测和个性化纳税服务的精准推送。后期收集纳税人评价反馈信息,对推荐列表中的信息是否满足需求进行统计分析,进而根据反馈数据重新画像并推送新的服务列表,循环反复直至推荐服务与纳税人的实际需求相契合,最终确定纳税人的精细画像。
图1(略)是一个纳税人的初始画像,后续需不断关联纳税人的动态行为数据对画像进行完善,并在画像的整个生命周期内进行动态更新管理,从而更加准确地分析和识别纳税人的办税偏好。纳税人画像的构建过程主要包括以下几个步骤。
(一)数据获取
数据获取是指通过获取实时变化的纳税人数据,实现纳税人画像持续更新。如图1(略)所示,纳税人画像是刻画纳税人基本属性、直观展现纳税人数据的工具,其中有些是原始数据源,有些数据是通过数据统计挖掘后形成的二次加工的数据。因此对于一个纳税人来说,其信息可划分为静态信息和动态信息两大类。
1.静态信息获取。纳税人画像需要获取的静态信息,主要包括纳税人名称、社会信用代码、企业性质、注册资金、从业人员、税费种认定等基本信息,这些数据的特点是长期固定、变化率低。
2.动态信息获取。纳税人被纳入电子税务局正常管理后,其申报征收,发票开具,违规行为处理,电子税务局网页信息浏览、点击、搜索,业务办理渠道等不断累积的纳税行为数据属于动态数据。这一类数据通常是非结构化的,需要通过后台对用户的数据进行收集处理后进行存储。
(二)数据预处理
完成数据获取后,电子税务局需要将采集到的纳税人数据存储到专属的数据库中,并对数据展开预处理。由于数据获取过程采集到的纳税人网络数据大部分为网络日志的形式,数据预处理需要先对数据进行整理,获取网络数据中完整的数据,再去重、去异常数据,使用数据分析手段提取数据特征字段,最后精简数据,留下更多的有效数据。
(三)建立标签体系
构建标签体系对构建纳税人画像具有至关重要的作用,甚至可能极大影响纳税人纳税行为和纳税偏好的分析结果。标签体系设计既要立足业务领域,也要贴合纳税人画像。标签体系的构建流程主要包括标签定义、标签分类、标签生产、标签更新、标签管理等环节。标签体系中包含的纳税人标签按照数据提炼的维度可以分为事实标签、模型标签、预测标签等。事实标签包括纳税人的所有原生属性和派生属性,多以基础信息和基础属性为主;模型标签是描述个体或群体的规律性标签,往往是凭经验产生;预测标签是根据基本属性、模型属性和过去特定时间段的行为状态,预测纳税人未发生或即将发生的行为所定义的属性。对应这三种类别的标签,建立标签的过程也由浅入深分为三步:第一步是梳理纳税人的基本属性建立事实标签;第二步由业务熟练人员根据经验提炼规则,得到模型标签;第三步是选择合适算法对前两个阶段整理的标签进行分析、建模,构建预测标签。本文结合电子税务局用户的相关特征,采用按上述处理完成的原始纳税人特征数据作为标签体系构建的基础数据,将纳税人画像标签体系按照事实标签、模型标签、预测标签三种类别维度进行分级管理,初步建立了包括纳税人属性、行为习惯、企业特征三个维度的纳税人标签体系。如图2(略)所示。
其中:纳税人属性是纳税人的基本特征,在纳税人设立登记之时便在系统产生,由系统自动标注,是静态的;行为习惯和企业特征是对纳税人上网习惯、兴趣特征进行分析和提取,根据算法预测纳税人的偏好形成的标签属性,是动态的。围绕这两个维度进行的标签管理也是动态的,即根据纳税人信息和偏好变化,通过不断迭代和优化已有标签的方式完成实时画像更新。
在实际应用中,可以根据业务领域选取特定角度的标签集合进行逐级细化和展现。比如,可以调用纳税人属性和行为习惯标签,识别出纳税人的办税能力、年龄层次、心理特征、纳税遵从度等信息,然后有针对性地进行服务推送和提升,后期在新政策推行时选取遵从度高的纳税人试点。又如:可以调取企业特征识别纳税人的业务范围、兴趣偏好等信息,根据算法预测,精准向纳税人推荐符合纳税人偏好的税收政策、优惠政策及业务办理模块;还可以建立稽查法制、信用风险等维度的标签,针对不同维度所代表的特征识别纳税人不同方面的偏好从而更加精准地服务纳税人。

三、服务推荐技术研究
服务推荐技术能够基于前述纳税人动态标签所构建的画像,选取合适的算法将标签数据定量分析预测纳税人的需求偏好,补充画像信息,并实时跟踪纳税人的需求更新情况,主动为其提供智能化、个性化的服务。服务推荐过程的核心主要是推荐算法,如前所述,目前主流的推荐算法包括协同过滤推荐、基于内容的推荐和组合推荐三种。
(一)协同过滤推荐算法
现阶段常用的主流推荐技术为协同过滤推荐技术,它的优势在于对推荐对象没有特殊要求,并且能处理非结构化的复杂对象。基于协同过滤的推荐系统主要立足用户需求,自动从用户日常办税业务模式或浏览行为等隐式信息获得数据,不断累积并分析用户行为,主动为用户推荐可能适合自己兴趣的信息。目前,协同过滤推荐算法中比较常用的是基于模型的协同过滤推荐算法。基于模型的协同过滤推荐算法主要是通过学习用户的有效信息,建立各类用户的喜好模型来进行推荐。基于模型的协同过滤推荐算法主要包括基于贝叶斯的协同过滤推荐算法、基于矩阵分解的协同过滤推荐算法、基于神经网络的协同过滤推荐算法等。本文以基于贝叶斯的协同过滤推荐算法为例,对基于模型的协同过滤推荐算法的主要原理进行说明。贝叶斯模型是一种生成模型,通常用于分类,贝叶斯网络是将贝叶斯概率论与图形化模式相结合而发展起来的模型表示方法,它研究客观的多个因素之间相互依赖的关联关系和因果关系,不仅可以通过有向无环图(网络结构)来定性表示变量间的依赖关系,而且能够通过条件概率分布(网络参数)来定量刻画变量对其父节点的依赖关系。
(二)基于内容的推荐算法
基于内容的推荐算法是利用用户兴趣和信息内容的匹配相似度来过滤信息的,主要包括以下四个部分:一是构建用户网上信息浏览数据库;二是建立用户兴趣模型,描述用户对不同属性信息的喜好程度,并将这些属性集合表示为用户向量;三是提取信息的内容属性,形成特征向量;四是将用户的兴趣模型和所有信息的特征矩阵进行相似度比较,将相关系数较高的信息定向推荐给用户。基于内容的推荐算法的主要原理如图3(略)所示。
由于基于内容的推荐算法以各类信息之间所特有的相似性为依托,对于文本类信息的推送往往有着极佳的推荐效果。以税收政策为例,基于内容的推荐首先围绕政策属性进行建模,将政策属性设置为某税种政策。纳税人A的兴趣模型是政策A,纳税人B和纳税人C的兴趣模型是政策B,而政策A的特征提取为企业所得税,政策B的特征提取为个人所得税,政策C的特征提取为企业所得税。基于内容的推荐算法主要是通过匹配用户兴趣模型和计算政策的特征矩阵的相似度,可以发现纳税人A感兴趣的政策A和政策C同属于企业所得税类别,因此当系统发现纳税人A喜欢政策A的时候,根据基于内容的推荐思想,系统就会自动认为纳税人A是对企业所得税兴趣,进而将政策C推荐给纳税人A。
(三)组合推荐算法
组合推荐算法又称混合推荐算法,能够集成多种算法优势,弥补不同算法间缺陷,是一种实用性极强的推荐技术。混合推荐有一个非常重要的原则:通过组合两种或两种以上的不同推荐策略以在应用场景中弥补单一推荐方法的不足或缺陷,达到推荐效率、推荐精准度最大化的目的。组合推荐算法按照组合方式可以分为加权、级联、特征扩充、混合等。
由于纳税人在企业开办后一段时间内办税过程反馈信息有限,并不会对所有服务都进行评价和反馈导致业务数据样本稀疏。同时,电子税务局用户众多,用户需求差异明显,传统的协同过滤算法难以满足推荐要求。因此,本文推荐采用将改进后的基于贝叶斯的协同过滤推荐算法和基于内容的推荐算法相融合的推荐模式,可以有效解决部分业务采样数据稀疏问题,提升算法效率,解决新用户登记注册后的冷启动问题。
组合推荐算法的核心是利用纳税人特征和纳税人兴趣模型,对传统协同过滤推荐列表进行改进,筛选纳税人真正感兴趣的需求,提高需求推荐的精确性。一是采用规则定义和平均填充来减少纳税人数据的稀疏性。二是以纳税人画像的标签为特征节点,定义节点间联系,以纳税人特征为例构建贝叶斯网络,如图4(略)所示。三是利用公式(1)计算各节点的概率,形成如图5(略)所示的节点条件概率结构及概率表,计算每个特征属于每一个分类的概率,选取概率最大值作为分类结果。四是基于兴趣模型加权考虑基于内容的推荐算法对目标纳税人进行推荐,使用皮尔逊相关系数计算相似性,通过相似性对纳税人需求进行协同过滤操作。选择前M个相似性较大邻居得到推荐列表。其中内容文档的特征表示成如下的特征属性空间向量:T(t1,t2,t3,…,tn),其中tn表示文档的特征词。通过贝叶斯算法学习挖掘纳税人兴趣,建立纳税人兴趣模型,并对纳税人进行分类,当纳税人信息更新时,贝叶斯模型会根据信息的变化关联关系从而调整概率,更新纳税人兴趣模型。

其中,P(X)表示目标节点的概率,Pa(x)表示概率节点的父节点概率。

四、智能画像技术和服务推荐技术在优化电子税务局中的应用
引入推荐服务有利于细化电子税务局业务分类,通过提取纳税人特征数据和兴趣偏好的方式形成直观动态的纳税人画像,在清晰描述纳税人关键需求的基础上,进行有效的信息和服务推荐,提升纳税人的使用体验感。本文认为,引入智能推荐服务能够从以下几个方面优化电子税务局的服务模式。
(一)提高界面智能化水平
1.对网页版电子税务局,引入推荐服务能够在延续原有整体风格的基础上,提高界面智能化水平。由于需要综合考虑电子税务局服务功能、政府门户网站的形象宣传作用和国家税务总局相关政策要求,网页版电子税务局页面整体风格方面仍延续现有页面结构。可在纳税人登录后,系统后台自动加载其画像标签数据,在主体界面最下方新增个性化信息推送区域,自动推送个性化的办税任务、政策信息、风险处理等提示信息,提醒并引导纳税人直接办理,避免重复查找相关模块,降低纳税人查找涉税业务的难度,有效缩短办税时间。
2.对手机App电子税务局,引入推荐服务能够打破其原有界面风格,更加贴合纳税人实际,提高纳税人使用体验。电子税务局手机App可不受政府门户网站要求限制,依托推荐服务技术大胆打破原有的功能模块和界面风格,主界面以画像技术加工后的纳税人画像为展示主体,借鉴电商平台界面布局的先进经验,主要业务模块以小图标固定模式展现,界面主体以经过画像技术加工的纳税人办税需求为主,以更丰富的图片、动画推送提示信息,吸引纳税人的注意力,增强纳税人办税意愿。
(二)改进税收政策查询和推送方式
由于相关法规政策较为庞杂,纳税人查询相关政策往往难度较大。画像技术的应用能够精准预测纳税人服务需求,帮助纳税人及时获得政策的个性化推送服务,提高电子税务局政策服务的效率。税务机关可依托现有政策法规库,对各级政府部门发布的政策文件进行采集加工和精细化拆解,对关键词提取特征进行精准描述和智能化扩展,实现通过后台系统快速、便捷识别政策热词,提高纳税人查询相关政策文件的效率;还可依托画像技术重点提取纳税人特征,对符合税收优惠政策条件的纳税人有针对性地推送其可能感兴趣的税收优惠政策,帮助纳税人依法依规享受税收优惠。同时,还可在法规政策智能推送的基础上,在电子税务局系统后台关联纳税人学堂中视频、课件等图文学习资料,与政策文件一并进行推荐,为纳税人提供更为形象化的学习场景。另外,还可开发依托纳税人的位置信息,动态精准推荐办税地图和办税指南,方便纳税人就近办税,提高纳税人的满意度和获得感。
(三)优化办税业务智能推送
1.可通过画像技术,识别纳税人基本的登记信息,区分纳税人性质、注册规模、所属行业、经营范围等信息,预测纳税人所需办理的业务,向纳税人推荐基础业务综合办理、增值税一般纳税人登记套餐、发票票种核定及领用套餐、发票验领套餐、跨区域经营套餐等不同的办税套餐服务,快速完成企业开办事项,及时将纳税人纳入正常管理。
2.申报类信息智能推荐。申报类信息推送主要结合征期日历、税费种认定和纳税人历史填报数据,系统记录纳税人每次的申报情况,根据纳税人的填报喜好,在下一个征收期自动推送纳税人上一征收期填报的报表。同时根据画像技术分析和归类纳税人申报的相似点,定向精准推荐增值税附加税联合申报套餐、消费税附加税联合申报套餐等多种申报服务。还可通过分析办税特征相似度较高的同质类纳税人的办税情况,实现对纳税人可能遗漏的数据项或者申报表进行智能提醒的服务,依托画像技术的多角度辅助,为纳税人推送完整的申报服务,帮助纳税人完整、准确、快速完成纳税申报。
(四)完善发票业务推荐和提醒
税务机关可依托画像技术和推荐服务,向纳税人推荐其能够申请使用的发票票种、数量及限额,并根据实际情况推送调整建议。在对领票人身份进行识别的基础上,结合办税大厅情况,为领票人推荐领用发票的时间和地点、开票专用设备的领用和维修地点等。还可通过对发票开具、缴销、结存情况进行统计和分析,并结合往期申报信息,对纳税人推送发票风险提示和预警等相关信息。
(五)做好注销业务智能推荐
税务机关可通过调用纳税人后台数据信息,依据既定的注销规则,对符合即办注销和承诺制注销即时办结。对于一般注销流程,合并纳税人后台注销条件判定信息,归类整理出注销未办结事项套餐服务,通过画像技术和推荐服务推荐给纳税人,指导纳税人完成注销前各类事项的办理,提升企业退出市场的便利化程度。
(六)实现信用等级及风险类信息智能推送
通过画像技术对信用等级不同的纳税人进行精准描述,对影响信用等级的违法违规行为进行归类匹配。对信用等级高的纳税人,既要主动推送优惠政策,让纳税人享受遵从红利,鼓励纳税人积极遵法守则,又要主动推送信用降级风险,提醒纳税人积极应对,防止工作疏忽引起信用降级。对信用等级低的纳税人,应当依法依规推送纳税信用修复指引,引导纳税人主动纠正失信行为,增强依法诚信纳税意识。同时,还应实现重大税收违法失信案件的信息和当事人名单动态管理,并向存在违法行为的纳税人和可能存在重大涉税风险的纳税人推送最新的公告、信用修复等相关信息,引导纳税人采用正确的信用修复途径,规范市场主体健康发展。
(七)优化涉税风险防控指标体系和预警机制
结合税收大数据分析和风险指标扫描体系,实时提供风险预测、预警提醒等服务。对存在税收违法风险的纳税人进行“全链条”风险扫描,通过画像技术构建“潜在”税收违法风险特征,对有可能涉及违法违规的纳税人进行“潜在”风险预警,将工作重心由事后管理向事前引导转移,实现“风险+信用”的数据双驱动监管模式,逐步探索建立和谐双赢的税务监管新体系。
用户画像及推荐技术在电子税务局应用后,能够通过综合电子税务局获取的各类数据,从纳税人基础特征、办税需求、任务关联、用户偏好等角度构建纳税人画像,综合分析纳税人兴趣信息,实现信息的精准识别和个性化服务推送。本文只考虑了电子税务局内部数据,未来可以综合分析纳税人在互联网上的各类有效行为,比如各类手机App的政务信息,以及纳税人在社交网络、商务活动等留存的信息,在保证纳税人权益和隐私的情况下预测其办税兴趣爱好,同时进一步对算法进行优化提升,对内容的粒度进行有效过滤,提升定向兴趣推荐的精准度和有效性。
(本文为节选,原文刊发于《税务研究》2022年第4期。)
欢迎按以下格式引用:
单伟力,张晗,李丹.智能画像技术和服务推荐技术在电子税务局中的应用场景探讨[J].税务研究,2022(4):62-68.

-END-
“十四五”时期优化税制问题研究
税收原则发挥与共同富裕——基于国民收入循环框架分析
税收究竟该如何助推共同富裕?
促进共同富裕的税收政策选择与机制保障
法国生育友好型个人所得税政策的启示
多重约束条件下的我国企业所得税改革
支柱二规则对我国的影响及企业所得税应对措施
促进低碳经济发展的企业所得税优惠政策研析
现代治理视域下智慧税务的逻辑建构
“数字经济与税收治理”征文启事


点击“阅读原文”快速投稿~
677_1650063610525.jpg
回复

使用道具 举报

Copyright © 2001-2013 Comsenz Inc. Powered by Discuz! X3.4 京公网安备 11010802035448号 ( 京ICP备19053597号-1,电话18600416813,邮箱liwei03@51shebao.com ) 了解Tax100创始人胡万军 优化与建议 隐私政策
快速回复 返回列表 返回顶部