LOFTER for ipad —— 让兴趣,更有趣

点击下载 关闭

LOFTER-网易轻博

知识图谱

225浏览    33参与
沉淀书会2020
0202-知识图谱-Tao 弱...

0202-知识图谱-Tao

弱监督事件抽取主要两种方法,一种是基于Bootstrapping,即利用少部分人工标注的数据训练得到分类器,然后利用该分类器从未标注数据中选取可信的数据加入训练数据中继续训练,如此迭代完成数据扩充和事件抽取,。另一种是Distant Supervison 的方法,利用结构化的事件知识库在非结构化的样本中回标训练样本,从而训练模型完成事件抽取。

0202-知识图谱-Tao

弱监督事件抽取主要两种方法,一种是基于Bootstrapping,即利用少部分人工标注的数据训练得到分类器,然后利用该分类器从未标注数据中选取可信的数据加入训练数据中继续训练,如此迭代完成数据扩充和事件抽取,。另一种是Distant Supervison 的方法,利用结构化的事件知识库在非结构化的样本中回标训练样本,从而训练模型完成事件抽取。

沉淀书会2020
0201-知识图谱-Tao实体...

0201-知识图谱-Tao实体抽取和关系抽取之后为事件抽取。对于事件的定义在不同的领域有着不同的阐述,大体上包括时间,地点,人物和行为等特征。KBP事件抽取任务分为以下几个子任务,事件识别(detection),消岐(coreference),抽取和链接(extraction and linking),验证和链接(verification and linking)。基于模式匹配的时间抽取方法主要是通过定义模式从文本中抽取事件,其在特定领域中性能较好。

0201-知识图谱-Tao实体抽取和关系抽取之后为事件抽取。对于事件的定义在不同的领域有着不同的阐述,大体上包括时间,地点,人物和行为等特征。KBP事件抽取任务分为以下几个子任务,事件识别(detection),消岐(coreference),抽取和链接(extraction and linking),验证和链接(verification and linking)。基于模式匹配的时间抽取方法主要是通过定义模式从文本中抽取事件,其在特定领域中性能较好。

沉淀书会2020
0131-知识图谱-Tao 开...

0131-知识图谱-Tao

开放域关系抽取不需要预先定义关系,而是使用上下文中的词语来表示关系。TextRunner作为一个开放域实体关系抽取系统,其主要有三个模块。首先是语料的自动生成和分类器的训练,其使用的是朴素贝叶斯分类器训练。然后是三元组的抽取,最后是可信度计算,合并之前要把相似的三元组合并起来,如(arg1,married,arg2)和(arg1,marries,arg2).

0131-知识图谱-Tao

开放域关系抽取不需要预先定义关系,而是使用上下文中的词语来表示关系。TextRunner作为一个开放域实体关系抽取系统,其主要有三个模块。首先是语料的自动生成和分类器的训练,其使用的是朴素贝叶斯分类器训练。然后是三元组的抽取,最后是可信度计算,合并之前要把相似的三元组合并起来,如(arg1,married,arg2)和(arg1,marries,arg2).

沉淀书会2020
0130-知识图谱-Tao 弱...

0130-知识图谱-Tao

弱监督关系抽取方法基于距离监督假设:如果两个实体之间存在某种关系,则包含这两个实体的句子都表达了这种关系,这些句子集合被称为一个“包”。因此便可以从这些句子中抽取特征进行分类。

0130-知识图谱-Tao

弱监督关系抽取方法基于距离监督假设:如果两个实体之间存在某种关系,则包含这两个实体的句子都表达了这种关系,这些句子集合被称为一个“包”。因此便可以从这些句子中抽取特征进行分类。

沉淀书会2020
0129-知识图谱-Tao 有...

0129-知识图谱-Tao

有监督的关系抽取方法主要有三种,基于特征工程,基于核函数,基于神经网络。前面两者限制较多,推广性差,依赖于自然语言处理工具的性能。

0129-知识图谱-Tao

有监督的关系抽取方法主要有三种,基于特征工程,基于核函数,基于神经网络。前面两者限制较多,推广性差,依赖于自然语言处理工具的性能。

沉淀书会2020
0125-知识图谱-Tao 关...

0125-知识图谱-Tao

关系抽取指的是自动识别实体间的语义关系。关系抽取分为限定域关系抽取和开放域关系抽取。限定域关系抽取有基于模板的方法,该方法首先对句子进行词性标注,然后抽取出相应的语法模板,把得到的模板利用矩阵进行聚类,把同一类的模板聚在一起。

0125-知识图谱-Tao

关系抽取指的是自动识别实体间的语义关系。关系抽取分为限定域关系抽取和开放域关系抽取。限定域关系抽取有基于模板的方法,该方法首先对句子进行词性标注,然后抽取出相应的语法模板,把得到的模板利用矩阵进行聚类,把同一类的模板聚在一起。

沉淀书会2020
0124-知识图谱-Tao 实...

0124-知识图谱-Tao

实体消岐还有基于实体链接的方法。实体链接主要分两个步骤:一是链接候选过滤,也就是根据规则或知识过滤掉实体指称项不可能指向的大部分实体,仅剩下少部分供候选。二就是实体链接过程,实体链接有多种方法,有基于向量空间的方法,也就是把实体和实体指称项都表示为向量,计算向量的相似度来实现一致性打分,还有主题一致性模型,即计算上下文实体集合和候选实体概念间的关系进行一致性打分,以上方法均针对单个实体指称项,考虑到所有实体指称项时称为协同实体链接,该方法主要思想是把协同实体链接看作一个优化任务,其目标函数由两部分组成,一部分对所有实体指称项的目标实体间的关系进行建模,另一部分对实...

0124-知识图谱-Tao

实体消岐还有基于实体链接的方法。实体链接主要分两个步骤:一是链接候选过滤,也就是根据规则或知识过滤掉实体指称项不可能指向的大部分实体,仅剩下少部分供候选。二就是实体链接过程,实体链接有多种方法,有基于向量空间的方法,也就是把实体和实体指称项都表示为向量,计算向量的相似度来实现一致性打分,还有主题一致性模型,即计算上下文实体集合和候选实体概念间的关系进行一致性打分,以上方法均针对单个实体指称项,考虑到所有实体指称项时称为协同实体链接,该方法主要思想是把协同实体链接看作一个优化任务,其目标函数由两部分组成,一部分对所有实体指称项的目标实体间的关系进行建模,另一部分对实体指称项与其目标实体间一致性进行建模。后来出现了基于神经网络的实体消岐方法,一般为利用神经网络得到实体表示,通过学习到的实体表示来计算与候选实体的相似度,从而提升实体消岐的效果。基于神经网络的方法易于捕捉深层语义,性能较好。

沉淀书会2020
0123-知识图谱-Tao 计...

0123-知识图谱-Tao

计算实体指称相似度主要有三种方法,一是计算表层特征,这种方法通常是BoW模型的延伸,或者使用CRF模型和n-gram特征。二是基于拓展特征,主要思想就是利用现有的知识库如Wikipedia抽取到实体的各种属性,可以利用这些属性信息来重构聚类,若两聚类指称项使用同一E-Mail地址则可合并这两个聚类。三是使用社会化网络,为实体建立社会化网络,通过图算法来计算实体指称项间的相似度,相关的应用有利用网页链接结构来判断人物实体间的相似度从而实现实体消岐。

0123-知识图谱-Tao

计算实体指称相似度主要有三种方法,一是计算表层特征,这种方法通常是BoW模型的延伸,或者使用CRF模型和n-gram特征。二是基于拓展特征,主要思想就是利用现有的知识库如Wikipedia抽取到实体的各种属性,可以利用这些属性信息来重构聚类,若两聚类指称项使用同一E-Mail地址则可合并这两个聚类。三是使用社会化网络,为实体建立社会化网络,通过图算法来计算实体指称项间的相似度,相关的应用有利用网页链接结构来判断人物实体间的相似度从而实现实体消岐。

沉淀书会2020
0122-知识图谱-Tao 实...

0122-知识图谱-Tao

实体消岐任务这里才开始用到一些无监督学习方法,绝大多数实体消岐系统都采用聚类算法来消岐,通过聚类来使类别对应到一个实体,从而实现消岐。

0122-知识图谱-Tao

实体消岐任务这里才开始用到一些无监督学习方法,绝大多数实体消岐系统都采用聚类算法来消岐,通过聚类来使类别对应到一个实体,从而实现消岐。

沉淀书会2020
0119-知识图谱-Tao 细...

0119-知识图谱-Tao

细粒度实体识别重要的是人工制定类别以及提供高质量的语料,其效果与人工关系密切。这样一来,实体拓展就显得尤为必要。给定一些实体,让机器学会举一反三,从文本中提取出同类实体。这本书看到现在感觉就是一篇大综述,具体实践还是要找到对应的论文做进一步研究。

0119-知识图谱-Tao

细粒度实体识别重要的是人工制定类别以及提供高质量的语料,其效果与人工关系密切。这样一来,实体拓展就显得尤为必要。给定一些实体,让机器学会举一反三,从文本中提取出同类实体。这本书看到现在感觉就是一篇大综述,具体实践还是要找到对应的论文做进一步研究。

沉淀书会2020
0117-知识图谱-Tao 命...

0117-知识图谱-Tao

命名实体识别经历了从基于规则到基于神经网络的发展历程。之前试过用隐马尔科夫做命名实体识别,效果还可以,其主要依赖于训练语料。基于神经网络的方法一般是使用双向LSTM对文本进行特征表示。

0117-知识图谱-Tao

命名实体识别经历了从基于规则到基于神经网络的发展历程。之前试过用隐马尔科夫做命名实体识别,效果还可以,其主要依赖于训练语料。基于神经网络的方法一般是使用双向LSTM对文本进行特征表示。

沉淀书会2020
0116-知识图谱-Tao 知...

0116-知识图谱-Tao

知识融合主要有三个任务,框架匹配,实体对齐,冲突检测与消解。表示学习中的很多东西都可以用到实体对齐上来,把两个知识库映射到同一语义空间上,然后计算向量相似度来完成实体对齐。

现有许多知识融合框架大体上的思路是先计算相似度,然后采用一些策略如贪心进行对齐融合,例如Falcon和SigMa,Anchor-Flood的策略有点类似归并。而PARIS比较特别,其基于全局概率进行知识融合,可以在没有先验知识和参数调节的情况下完成对齐过程。

0116-知识图谱-Tao

知识融合主要有三个任务,框架匹配,实体对齐,冲突检测与消解。表示学习中的很多东西都可以用到实体对齐上来,把两个知识库映射到同一语义空间上,然后计算向量相似度来完成实体对齐。

现有许多知识融合框架大体上的思路是先计算相似度,然后采用一些策略如贪心进行对齐融合,例如Falcon和SigMa,Anchor-Flood的策略有点类似归并。而PARIS比较特别,其基于全局概率进行知识融合,可以在没有先验知识和参数调节的情况下完成对齐过程。

沉淀书会2020
0115-知识图谱-Tao 1...

0115-知识图谱-Tao

1.知识图谱的数值化表示主要有两种方式,基于张量分解的表示学习方法和基于能量函数的表示学习方法。

2.人工构建知识图谱主要可以分为如下六个主要阶段,确定领域和任务,体系复用,罗列要素,确定分类体系,定义属性及关系,定义约束。

0115-知识图谱-Tao

1.知识图谱的数值化表示主要有两种方式,基于张量分解的表示学习方法和基于能量函数的表示学习方法。

2.人工构建知识图谱主要可以分为如下六个主要阶段,确定领域和任务,体系复用,罗列要素,确定分类体系,定义属性及关系,定义约束。

神仙科技
  1. 2019年天猫双11商家作战图
  2. 2019苏宁双11商家作战图
  3. 2019有赞双11商家社交电商作战攻略
  4. 2019京东618作战地图

2019年(天猫 苏宁 京东 有赞)双11商家活动作战图

2019年(天猫 苏宁 京东 有赞)双11商家活动作战图

神仙科技
  1. 餐饮选址开发
  2. 餐饮特许经营
  3. 餐饮菜单规划
  4. 餐饮门店管理

餐饮(选址 特许经营 门店运营 菜单规划)知识图谱

餐饮(选址 特许经营 门店运营 菜单规划)知识图谱

神仙科技

高中全学科(语文 数学 英语 物理 化学 政治 生物 历史)考点知识图谱

高中全学科(语文 数学 英语 物理 化学 政治 生物 历史)考点知识图谱

神仙科技
2019运营技能地图2.0:互...

2019运营技能地图2.0:互联网圈清明上河图

2019运营技能地图2.0:互联网圈清明上河图

神仙科技
  1. 抖音运营红宝书
  2. 抖音生态破解图
  3. 抖音算法
  4. 抖音算法地图
  5. 抖音运营攻略
  6. 抖音短视频运营

抖音(运营 算法 生态 电商)知识图谱

抖音(运营 算法 生态 电商)知识图谱

LOFTER

让兴趣,更有趣

简单随性的记录
丰富多彩的内容
让生活更加充实

下载移动端
关注最新消息