知识图谱主要术语 郝伟,2020/12/23 [TOC]

1. 知识图谱

2. 术语列表

2.1. 独热编码(One-Hot Encoding)

2.2. LabelEncoder标签编码

2.3. 实体嵌入(Entity Embeddings)

Entity Embedding是一种类别特征的方法,最早提出此方法的文章为《Entity Embeddings of Categorical Variables》。其核心思想把正整数(索引)转换为固定大小的稠密向量后,再进行相应的处理。

文章 使用实体嵌入的结构化数据进行深度学习 比较系统地解读了实体嵌入的原理和应用方法。

浅谈Entity Embedding 根据 类别特征处理与实体嵌入 描述,Embedding 的起源和火爆都是在NLP中的,经典的word2vec都是在做word embedding这件事情,而真正首先在结构数据探索embedding的是在kaggle上的《Rossmann Store Sales》中的rank 3的解决方案,作者在比赛完后为此方法整理一篇论文放在了arXiv,文章名:《Entity Embeddings of Categorical Variables》。

2.4. 实体对齐(Entity Alignment)

文章Introduction to entity embeddings with neural networks介绍得很好:

2.5. 论文浅尝 - ICLR2020 | You Can Teach an Old Dog New Tricks!关于训练知识图谱嵌入,ICLR2020

论文下载:https://openreview.net/pdf?id=BkxSmlBFvr, 参考 这篇文章是一篇关于知识图谱嵌入的多种已有模型的性能调研。作者通过扎实的大量的实验对选择了七种模型进行验证(源代码发布在Github上)。通过对实验数据的分析,文章给出重要的结论:随着时间变化而导致数据集、评价模型和评估算法的变化,而对研究者论文本身的结论会产生重要影响(甚至是相反的)对,所以应该对过去的和现在的常见的KGM的模型的性能重新审视,从而准确评估和理解这些方法的主要特性和优缺点。

3. 漏洞网站

results matching ""

    No results matching ""