Лучший способ проверить, является ли слово английским, это найти его в словаре. Если это в словаре английских слов, то это английское слово. Возможно, что слово может быть в английском словаре и французском словаре также. Например, «я» является французским и английским словом.
Я уверен, что вы можете найти много загружаемых словарей в Интернете. Вы также можете сделать свой собственный. Например, вы можете загрузить английскую версию Википедии и предположить, что все найденные слова являются английскими. Вы можете или не можете отфильтровать числа.
Регулярное выражение не скажет вам, является ли слово английским. Например, xyvfg соответствует вашему шаблону \ w ', но определенно не является английским словом.
Edit:
Теоретически, используя фонологию английского языка, можно было бы определить, может ли фонетическая транскрипция слова произноситься носителем английского языка. Носителям английского языка доступно много слов, которые на самом деле не являются английскими. Это может учитывать слова, которые могут появиться на английском языке в будущем. Однако перевод между фонетической транскрипцией и текстом является довольно сложной проблемой, поскольку может быть много разных вариантов написания одной и той же фонетической транскрипции. Я не знаю, делал ли кто-нибудь что-нибудь подобное. Это может быть интересным теоретическим упражнением. Я не уверен, что это было бы очень полезно в реальном мире НЛП, хотя.