Не существует универсального определения «хорошо выступать».Это зависит от ваших конечных целей.
Почему вы хотите создавать слова-векторы?Какую ценность вы ожидаете от них?
Получив ответы на эти вопросы, вы можете сначала просмотреть результаты неформальным, специальным образом: посмотрите на некоторые слова ближайших соседей (результаты wordvecs.most_similar(query_word)
), чтобы увидеть,смысл для вас, для ваших нужд и проблемных областей.
Но для того, чтобы действительно проверить, улучшаются ли ваши модели с течением времени, когда вы улучшаете свои данные или параметры модели, вы должны создать несколько повторяющихся количественных тестов, которые соответствуют вашей конечной цели.(Например: нужны ли вам определенные пары слов, чтобы они были ближе друг к другу, чем к какому-либо третьему слову? Используете ли вы слова-слова в качестве входных данных для некоторого другого процесса классификации или поиска информации, который имеет некоторые известные, желательные результаты?)
Запустите эти тесты, чтобы оценить модель, затем сравните оценку одной модели с другой.