NLP | Leacock Chordorow (LCH)和 Synset 的路径相似性
原文:https://www.geesforgeks.org/NLP-leacock-chordorow-lch-和-path-相似性-for-synset/
基于路径的相似性:它是一种相似性度量,用于找出两个合成集之间最短路径的长度。
Leacock Chordorow (LCH) : 这是一种相似性度量,是基于路径的相似性的扩展版本,因为它结合了分类学的深度。因此,它是两个概念(synset_1 和 synset_2)之间最短路径(spath)的负对数除以分类法总深度(D)的两倍,如下图所示。 T3】
代码#1:引入 Synsets。
from nltk.corpus import wordnet
syn1 = wordnet.synsets('hello')[0]
syn2 = wordnet.synsets('selling')[0]
print ("hello name : ", syn1.name())
print ("selling name : ", syn2.name())
输出:
hello name : hello.n.01
selling name : selling.n.01
代码#2:路径相似性
syn1.path_similarity(syn2)
输出:
0.08333333333333333
代码#3 : Leacock Chordorow (LCH)相似度
syn1.lch_similarity(syn2)
输出:
1.1526795099383855