专利名称:一种非结构化数据中的特定实体关系的提取方法专利类型:发明专利发明人:束博
申请号:CN201811007387.8申请日:20180831公开号:CN109241295A公开日:20190118
摘要:一种非结构化数据中的特定实体关系的提取方法,所述方法首先限定实体关系类型,然后从语料文本中筛选出仅包含该关系类型的语料,并只对特征窗口中的语料进行特征识别、组合和提取,同时对实体对进行关系标记,得到实体对的上下文特征以及实体对所包含关系的标记,之后对该标记数据进行学习,得到判断模型,并通过模型准确度的计算,将特征窗口的大小调整到最优,最后利用判断模型从非结构化文本中提取某一特定类型关系的实体对。本发明只对特定关系类型的数据进行提取,并选择最适合该关系提取的特征集和最适合该关系提取的窗口大小。该方法避免了多种关系混合提取时的相互干扰,可提高关系提取的准确度,有效降低计算复杂度和人工标注的工作量。
申请人:北京天广汇通科技有限公司
地址:100097 北京市海淀区蓝靛厂南路55号金威大厦10层1006
国籍:CN
代理机构:北京索睿邦知识产权代理有限公司
代理人:陈彩芳
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容