金融界2024年12月21日消息,国家知识产权局信息显示,杭州恒生聚源信息技术有限公司申请一项名为“目录生成方法电子设备以及计算机程序产品”的专利,公开号CN119152533A,申请日期为2024年11月。
专利摘要显示,本申请提供了一种目录生成方法、电子设备以及计算机程序产品,其中,该方法包括:对待检测对象进行检测处理,得到待检测对象的多个文本块以及各文本块的文本块信息,根据多个文本块以及各文本块的文本块信息,生成初始文本树,将初始文本树输入预先训练的目录识别模型中,由目录识别模型提取各节点的全局特征和局部特征,并基于各节点的全局特征和局部特征,确定各节点的预测标签,根据各节点的预测标签对初始文本树进行修正,得到待检测对象的目标文本树,并根据目标文本树以及目标文本树中各节点对应的文本块,得到待检测对象的目录生成结果。本申请可以提升标题层级结构复杂的文档目录生成的准确性和效率,且具有良好的通用性。
THE END