本发明涉及计算机,并且更具体地,涉及一种商品的税收分类编码推荐方法及装置。
背景技术:
1、商品和服务税收分类与编码是指在增值税发票升级版中,纳税人开具发票时票面上的商品应与税务总局核定的税收编码进行关联,按分类编码上注明的税率和征收率开具发票。也能使税务机关统计、筛选、分析、比对数据等,最终目标是加强征收管理。
2、纳税人开具的增值税专用发票、货物运输业增值税专用发票、增值税普通发票、机动车销售统一发票时,需要选择开票商品对应的分类编码。因此,对于商品类别众多,特别是新录入商品,在4000余个分类编码中,准确选择较为困难。所以,需要有一套分类编码推荐系统,展示匹配度较高的商品,以匹配度由高至低的顺序,展示给纳税人,协助其做出正确选择。
3、通过统计开票系统数据库中商品名称发现,商品名称长度变换很大,对于长商品名称,包含有较为丰富的语义特征,对于经典的textcnn、textrnn等网络,将商品名称做分词处理后,送入分类网络,分类效果较好。但是,商品名称中也存在众多较短的情况,对于这类情况,采用分词方法交由文本分类网络预测,由于缺乏足够的特征信息,分类效果不佳。
技术实现思路
1、针对现有技术的不足,本发明提供一种商品的税收分类编码推荐方法及装置。
2、根据本发明的一个方面,提供了一种商品的税收分类编码推荐方法,包括:
3、分别对商品名称进行分词处理以及字符分离处理,确定商品名称的分词数据以及字符数据;
4、利用word2vec网络对分词数据以及字符数据进行训练,构建词向量以及字符向量;
5、将词向量输入至词分类网络,并将字符向量输入至字符分类网络中,输出商品名称的词分类结果以及字符分类结果;
6、根据预先设置的权重比例,将词分类结果以及字符分类结果进行合并,确定商品名称的税收分类结果。
7、可选地,还包括:
8、在商品名称的长度小于预先设置的阈值并且税收分类结果的top1的置信度小于预设阈值的情况下,利用预先设置的匹配算法将商品名称与预先设置的商品编码查询实例进行匹配,确定商品名称的更新税收分类结果。
9、可选地,词分类网络采用1、2、3三种卷积核,字符分类网络采用1、2、3、5四种卷积核。
10、可选地,还包括:
11、根据商品名称的长度,确定权重比例。
12、可选地,还包括:
13、将预定数量的税收分类结果展示至用户的终端设备。
14、根据本发明的另一个方面,提供了一种商品的税收分类编码推荐装置,包括:
15、第一确定模块,用于分别对商品名称进行分词处理以及字符分离处理,确定商品名称的分词数据以及字符数据;
16、构建模块,用于利用word2vec网络对分词数据以及字符数据进行训练,构建词向量以及字符向量;
17、输出模块,用于将词向量输入至词分类网络,并将字符向量输入至字符分类网络中,输出商品名称的词分类结果以及字符分类结果;
18、第二确定模块,用于根据预先设置的权重比例,将词分类结果以及字符分类结果进行合并,确定商品名称的税收分类结果。
19、根据本发明的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本发明上述任一方面所述的方法。
20、根据本发明的又一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本发明上述任一方面所述的方法。
1.一种商品的税收分类编码推荐方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,还包括:
3.根据权利要求1所述的方法,其特征在于,所述词分类网络采用1、2、3三种卷积核,所述字符分类网络采用1、2、3、5四种卷积核。
4.根据权利要求1所述的方法,其特征在于,还包括:
5.根据权利要求1所述的方法,其特征在于,还包括:
6.一种商品的税收分类编码推荐装置,其特征在于,包括:
7.根据权利要求6所述的装置,其特征在于,还包括:
8.根据权利要求6所述的装置,其特征在于,所述词分类网络采用1、2、3三种卷积核,所述字符分类网络采用1、2、3、5四种卷积核。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5任一所述的方法。