Glove Word Embeddeds поддерживаемые языки - PullRequest
0 голосов
/ 18 февраля 2019

Недавно я начал читать больше о НЛП и следовать учебным пособиям на Python, чтобы узнать больше об этом предмете.Я также начал экспериментировать со встраиванием слов и нашел интересные результаты, которые не знаю, как их интерпретировать.Сначала я использовал английский корпус как для обучения, так и для тестирования, а затем я использовал английский корпус для обучения и небольшой французский корпус для тестирования (все корпуса были аннотированы для одной и той же задачи двоичной классификации).В обоих случаях я использовал предварительно обученные твиты перчаточных вложений.Поскольку результаты в случае, когда я также использовал французский корпус, улучшились (почти на 5%, достигнув ~ точности = 0,8), мне стало интересно, обучался ли Глове на многоязычных данных, так как я не видел, чтобы кто-то делал это заявление (яя знаю, сколько данных используется) по сравнению с FastText, например, если у вас есть вложения для разных языков.

Кроме того, если Glove поддерживает многоязычную информацию, это также устранит необходимость отображения различныхвложение слов в одно и то же пространство (как в случае с FastText).

Любые разъяснения будут с благодарностью.

...