民航标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210516779.7 (22)申请日 2022.05.12 (71)申请人 星环信息科技 (上海) 股份有限公司 地址 200233 上海市徐汇区虹漕 路88号B栋 11-12楼 (72)发明人 闻婷 郭玉杰 徐永达  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 蔡舒野 (51)Int.Cl. G06F 16/55(2019.01) G06V 10/74(2022.01) G06V 10/764(2022.01) (54)发明名称 一种模板图片分类方法、 装置、 设备、 存储介 质及产品 (57)摘要 本发明公开了一种模板图片分类方法、 装 置、 设备、 存储介质及产品。 所述方法包括: 根据 待测试图片是否包含表格, 确定所述待测试图片 对应的至少一张模板图片; 基于所述待测试图片 以及所述待测试图片对应的至少一张模板图片 得到一个多维度的特征矩阵; 将所述特征矩阵输 入预设分类模 型, 输出所述待测试图片与所述待 测试图片 对应的每个模板图片的相似度; 将所述 待测试图片所属的类别作为目标模板图片对应 的类别, 所述目标模板图片为与所述待测试图片 相似度最高的模板图片。 利用该方法, 能够简化 模板图片的分类过程, 提高模板图片分类的准确 率。 权利要求书3页 说明书11页 附图3页 CN 114911963 A 2022.08.16 CN 114911963 A 1.一种模板图片分类方法, 其特 征在于, 所述方法包括: 根据待测试图片是否包 含表格, 确定所述待测试图片对应的至少一张模板图片; 基于所述待测试图片以及所述待测试图片对应的至少一张模板图片得到一个多维度 的特征矩阵; 将所述特征矩阵输入预设分类模型, 输出所述待测试图片与 所述待测试图片对应的每 个模板图片的相似度; 将所述待测试图片所属的类别作为目标模板图片对应的类别, 所述目标模板图片为与 所述待测试图片相似度最高的模板图片。 2.根据权利要求1所述的方法, 其特征在于, 模板 图片由用户预先配置后得到, 配置的 内容包括 提取所述模板图片中的锚点关键 字以及框 选关键待识别区域。 3.根据权利要求1所述的方法, 其特征在于, 所述根据待测试图片是否包含表格, 确定 所述待测试图片对应的至少一张模板图片, 包括: 若所述待测试图片包含表格, 则从用户预先配置的多个模板图片中获取所有包含表格 的模板图片作为所述待测试图片对应的多张第一模板图片; 若所述待测试图片不包含表格, 则从用户预先配置的多个模板图片中获取所有不包含 表格的模板图片作为所述待测试图片对应的多张第二模板图片。 4.根据权利要求3所述的方法, 其特征在于, 若所述待测试图片包含表格, 相应的, 所述 基于所述待测试图片以及所述待测试图片对应的至少一张模板图片得到一个多维度的特 征矩阵, 包括: 对所述待测试图片中的表格信 息和文本信 息分别做特征提取, 得到第 一表格特征以及 第一文本特 征; 针对每张第一模板 图片, 对第一模板 图片中的表格信息和文本信息分别做特征提取, 得到第二表格特 征以及第二文本特 征; 将所述第一文本特征分别与 所述每张模板图片对应的第 二文本特征进行特征匹配, 得 到所述待测试图片与每张第一模板图片的文本匹配信息; 将所述第一表格特征分别与所述每张第一模板图片对应的第二表格特征进行特征匹 配, 得到所述待测试图片与每张第一模板图片的表格匹配信息; 将所述文本匹配信息和所述表格匹配信息进行组合得到一个多维度的特 征矩阵。 5.根据权利要求4所述的方法, 其特征在于, 所述文本匹配信 息包括锚点关键字匹配数 量、 锚点关键字匹配相似度以及 锚点关键字位置相似度, 相应的, 所述将所述第一文本特征 分别与所述每张模板图片对应的第二文本特征进 行匹配, 得到所述待测试图片与每张第一 模板图片的文本匹配信息, 包括: 将所述第二文本特征中包括的锚点关键字的不定长度编码特征与所述第一文本特征 中包括的不定长度编码特征进 行文本对比, 确定锚点关键字匹配数量以及 锚点关键字匹配 相似度; 根据所述第一文本特征中包括的文本位置特征以及所述第二文本特征中包括的文本 位置特征, 确定锚点关键 字位置相似度。 6.根据权利要求4所述的方法, 其特征在于, 将所述第 一表格特征分别与所述每张第 一 模板图片对应的第二表格特征进 行匹配, 得到所述待测试图片与每张第一模板图片的表格权 利 要 求 书 1/3 页 2 CN 114911963 A 2匹配信息, 包括: 根据所述第一表格特征中包括的全局性表格特征以及所述第二表格特征中包括的全 局性表格特征, 确定表格中的行、 列、 单元格数量对比结果以及表格归一化位置对比结果, 并将确定的对比结果作为所述表格匹配信息中的全局表格匹配信息; 根据归一化尺寸、 所述第 一表格特征中包括的单元格局部特征以及所述第 二表格特征 中包括的单元格局部特征, 对表格中的单元格逐一进行匹配, 确定匹配单元格数量和未匹 配单元格数量、 匹配单元格尺 寸相似度、 匹配单元格的重合面积、 跨行单元格的行偏移 量以 及跨列单元格的列偏移 量, 并将确定的匹配结果作为所述表格匹配信息中的单元格匹配信 息; 根据所述第一表格特征中包括的单元格文本特征以及所述第二表格特征中的包括的 单元格文本特征, 确定匹配单元格文本相似度以及匹配单元格文本位置相似度, 并将确定 的相似度结果作为所述表格匹配信息中的单 元格文本匹配信息 。 7.根据权利要求3所述的方法, 其特征在于, 若所述待测试图片不包含表格, 相应的, 所 述基于所述待测试图片以及所述待测试图片对应的至少一个模板图片得到一个多维度的 特征矩阵, 包括: 对所述待测试图片中的文本信息做特 征提取得到第三文本特 征; 针对每张第二模板图片, 对第二模板图片中的文本信息做特征提取得到第四文本特 征; 将所述第三文本特征分别与每张第 二模板图片对应的第四文本特征进行匹配, 得到所 述待测试图片与每张第二模板图片的匹配信息; 将所述待测试图片分别与每张第二模板图片的匹配信息进行组合得到一个多维度的 特征矩阵。 8.根据权利要求7所述的方法, 其特征在于, 所述匹配信息包括锚点关键字匹配数量、 锚点关键字匹配相似度、 锚点关键字位置相似度以及图片文本相似度, 相应的, 所述将所述 第三文本特征分别与每张第二模板图片对应的第四文本特征进行匹配, 得到所述待测试图 片与每张第二模板图片的匹配信息, 包括: 根据所述第四文本特征中包括的锚点关键字的不定长度编码特征与所述第三文本特 征中包括的不定长度编 码特征进 行文本对比, 确定锚点关键字匹配数量以及锚点关键字相 似度; 根据所述第三文本特征中包括的文本位置特征以及所述第四文本特征中包括的文本 位置特征, 确定锚点关键 字位置相似度; 根据所述第三文本特征中包括的词向量特征以及所述第四文本特征中包括的词向量 特征, 确定图片文本相似度。 9.根据权利要求1所述的方法, 其特 征在于, 还 包括: 通过所述目标模板图片对所述待测试图片进行信 息识别, 并将所述目标模板图片的名 称以及识别结果显示给用户; 其中, 所述识别结果为按照所述目标模板图片中的关键待识别区域对所述待测试图片 进行识别后得到的结果。 10.一种模板图片分类装置, 其特 征在于, 所述装置包括:权 利 要 求 书 2/3 页 3 CN 114911963 A 3

PDF文档 专利 一种模板图片分类方法、装置、设备、存储介质及产品

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种模板图片分类方法、装置、设备、存储介质及产品 第 1 页 专利 一种模板图片分类方法、装置、设备、存储介质及产品 第 2 页 专利 一种模板图片分类方法、装置、设备、存储介质及产品 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-24 00:59:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。