从RNN到Transformer(1)
RNN背后的想法是利用顺序的信息。
RNN背后的想法是利用顺序的信息。
静态词向量指的是一个单词用一个唯一的词向量表示并不考虑上下文的变化,它最大的缺点是无法表达多意性。为此,诞生了动态词向量。
使用gensim加载中文预训练词向量。
使用gensim加载英文预训练词向量。
使用gensim库中的word2vec函数来训练词向量。
pytorch训练Skip-Gram模型实践。
pytorch训练CBOW模型实践。
pytorch训练Glove模型实践。
分布表示研究了上下文的概率分布,认为上下文相似的词,其语义也相似,由此将语义引入到文本表示中,词与词之间有了距离的概念。
BM25是基于TF-IDF的改进算法,BM 是Best Match最佳匹配的缩写,25指的是第25次算法迭代。