从EMD、WMD、WRD:文本向量序列的相似度计算
在NLP中,我们经常要比较两个句子的相似度,其标准方法是将句子编码为固定大小的向量,然后用某种几何距离(欧氏距离、cos距离等)作为相似度。这种方案相对来说比较简单,而且检索起来比较快速,一定程度上能满足工程需求
比赛必备 ︱ 省力搞定三款词向量训练 + OOV词向量问题的可性方案
glove:
NLP︱高级词向量表达(一)——GloVe(理论、相关测评结果、R&python实现、相关应用)
极简使用︱Glove-python词向量训练与使用