句子的相似度计算方法是什么？ #64

bigrat911 · 2018-05-30T03:11:06Z

比如，句子的向量表示为每个词的vector取平均，然后cos
或者用softcos、WMD之类？

hailiang-wang · 2018-06-06T04:01:33Z

使用词向量和编辑距离
根据词向量距离，采取梯度方式设置权重
采取平滑策略

wuyang0329 · 2018-07-17T02:25:29Z

请问这个平滑策略的根据是什么呢，谢谢！

hailiang-wang · 2018-07-17T02:59:40Z

曲线形状

wuyang0329 · 2018-07-18T02:56:26Z

还有两个问题想问一下您，您的代码中_flat_sum_array这个函数是将句子中各个词的词向量叠加吗？
还有nearby_levenshtein_distance这个函数是将两个句子计算出来的编辑距离做了归一化吗？

fremcode · 2019-01-15T02:46:22Z

请教一下，是我用法不对还是词库的问题，"舒服"的近义词为什么是"难受"？

hailiang-wang · 2019-01-15T03:20:02Z

计算依据非监督的word2vec, 是利用前后词作为特征，所以也会出现反义词的时候。使用机器学习会有准确率的问题，并不保证100%都是准确的近义词。

…

------------------ Cheers. Hai Liang Wang, CEO, Chatopera

------------------ Original ------------------ From: "fremcode"; Date: 2019年1月15日(星期二) 上午10:46 To: "huyingxi/Synonyms"; Cc: "Samurais"; "State change"; Subject: Re: [huyingxi/Synonyms] 句子的相似度计算方法是什么？ (#64) 请教一下，是我用法不对还是词库的问题，"舒服"的近义词为什么是"难受"？ — You are receiving this because you modified the open/close state. Reply to this email directly, view it on GitHub, or mute the thread.

AlexYoung757 · 2019-04-02T03:06:17Z

句子相似度比较每次得到的结果居然不一致。。。
第一次运行结果：
相似度：1.0
相似度：0.304
相似度：0.626

第二次运行结果：
相似度：1.0
相似度：0.326
相似度：0.635

第三次运行结果：
相似度：1.0
相似度：0.291
相似度：0.618

luluyouyue · 2019-07-03T03:00:08Z

为什么是词向量相似度和编辑距离相似度相乘而不是相加呢？

NancyGu · 2020-04-15T12:05:19Z

在这个问题下学到很多，我的理解是：
1- 用编辑距离和词向量相似度cos值相乘
cos起到方向上的修正作用
2-word2vec是根据上下文做推断，的确有无法区分同义词和反义词的问题
3-词权，我刚看到一种单个文档自适应设词权的方法
用的是词向量-文档中所有词池化后的向量 = 权重

hailiang-wang closed this as completed Jun 6, 2018

hailiang-wang added a commit that referenced this issue Jun 6, 2018

#64 update README

ad05843

hailiang-wang mentioned this issue Aug 13, 2023

请问这个synonyms的计算相似度的公式是什么，采用什么思想计算相似度，看了很多文章都是应用，并没有介绍计算方式 #138

Closed

3 tasks

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

句子的相似度计算方法是什么？ #64

句子的相似度计算方法是什么？ #64

bigrat911 commented May 30, 2018

hailiang-wang commented Jun 6, 2018

wuyang0329 commented Jul 17, 2018

hailiang-wang commented Jul 17, 2018

wuyang0329 commented Jul 18, 2018

fremcode commented Jan 15, 2019

hailiang-wang commented Jan 15, 2019 via email

AlexYoung757 commented Apr 2, 2019

luluyouyue commented Jul 3, 2019

NancyGu commented Apr 15, 2020

句子的相似度计算方法是什么？ #64

句子的相似度计算方法是什么？ #64

Comments

bigrat911 commented May 30, 2018

hailiang-wang commented Jun 6, 2018

wuyang0329 commented Jul 17, 2018

hailiang-wang commented Jul 17, 2018

wuyang0329 commented Jul 18, 2018

fremcode commented Jan 15, 2019

hailiang-wang commented Jan 15, 2019 via email

AlexYoung757 commented Apr 2, 2019

luluyouyue commented Jul 3, 2019

NancyGu commented Apr 15, 2020