Мне нужно разбить строку текста на составляющие слова, поэтому я использую регулярное выражение для разбиения ее на пустые места (в файле Typescript, кстати).
splitIntoWords(text: string) : Array<string> {
const separator = ' ';
const words = text.split(new RegExp(separator, 'g'));
return words;
}
Это в основном работает, но я заметил, что я регулярно получаю слова в массиве, которые все еще содержат пробелы. Если я копирую текст в консоль Chrome и разделяю его (''), я получаю правильное количество слов, но когда я использую переменную (даже в консоли), в некоторых случаях она всегда терпит неудачу. Я не могу понять, в чем разница. Это пример моего текста:
"Le coronavirus en France : la décrue se poursuit en réanimation, la reprise économique au cœur des préoccupations. La mise en œuvre du plan de déconfinement élaboré par le gouvernement doit encore faire l’objet, jeudi, d’un « travail de concertation et d’adaptation aux réalités de terrain » avec les responsables et les élus locaux."
Регулярному выражению никогда не удается, например, разделить подстроку "économique au" на два компонента. Кто-нибудь знает, почему это происходит?