阅读:125回复:0
为了提高知识图谱的覆盖
知识图谱的更新和维护和的关系知识图谱的为了保证其质量由专业团队审核和维护。以知识图谱为例目前定义的数在的数量级。率搜索引擎公司还通过自动化算法从各种数据源抽取新的类型信息也包含关联的信息这些类型信息通过一个称为的数据结构保存。它们不是马上被加入到知识图谱中。有些今天生成后第二天就被删除了有些则能长期的保留在中如果中的某一种类型能够长期的保留发展到一定程度后由专业的人员进行决策和命名并最终成为一种新的。结构化站点包装器的维护站点的更新常常会导致原有模式失效。
搜索引擎会定期检查站点是否存在更新。当检测到现有页面原先已爬取发生了变化搜索引擎会检查这些页面的变化量同时使用最新的站点包装器进行抽取。如果 阿尔巴尼亚 Whatsapp 数据 变化量超过事先设定的阈值且抽取结果与原先标注的答案差别较大则表明现有的站点包装器失效了。在这种情况下需要对最新的页面进行重新标注并学习新的模式从而构建更新的包装器。知识图谱的更新频率加入到知识图谱中的数据不是一成不变的。对应的实例往往是动态变化的。例如美国总统随着时间的推移可能对应不同的人。 ![]() 由于数据层的规模和更新频度都远超层搜索引擎公司利用其强大的计算保证图谱每天的更新都能在个小时内完成而实时的热点也能保证在事件发生个小时内在搜索结果中反映出来。众包反馈机制除了搜索引擎公司内部的专业团队对构建的知识图谱进行审核和维护它们还依赖用户来帮助改善图谱。具体来说用户可以对搜索结果中展现的知识卡片所列出的实体相关的事实进行纠错。当很多用户都指出某个错误时搜索引擎将采纳并修正。这种利用群体智慧的协同式知识编辑是对专业团队集中式管理的互补。 |
|