Универсального показателя качества или «точности» модели word2vec не существует.
Обычно сообщаемая "точность", как правило, основана на ряде вопросов об аналогиях на английском языке, которые были использованы Google в их оригинальной статье word2vec (и включены в их выпуск исходного кода). См. Например:
https://github.com/tmikolov/word2vec/blob/master/questions-words.txt
Чтобы сделать аналогичный расчет для другого языка, вам необходимо предоставить аналогичный набор вопросов для оценки для этого языка. Я не знаю ни одной коллекции таких вопросов для сингальского или других языков, поэтому вам, возможно, придется найти или создать ее самостоятельно. (Вы можете создать альтернативный файл в том же формате и использовать существующие методы оценки, указав альтернативный файл.)