欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页

训练Word2Vec报错:RuntimeError: you must first build vocabulary before training the model

程序员文章站 2024-01-17 19:42:34
...

原文地址

在定义模型时

model = word2vec.Word2Vec(sentences, min_count=5)

有一个min_count的属性,它的默认值是5,Word2Vec在训练时会忽略词频小于该属性值的词,发生这个报错是因为你传入的此列表中的所有词的词频都小于这个值。

  • 解决方案

    减小该值的设定