У меня есть строка, которая может содержать что угодно, но 99% времени - это пара английских предложений.
Мне нужно взять эту строку и получить список индексов, которые представляют начало каждого слова (или, другими словами, в конце каждого куска пробела).Если требуется определение пробела, как минимум, Пробел, CR, LF и Период.
Какой самый простой способ сделать это?Я предполагаю, что есть лучший способ, чем цикл For
- я думал об использовании лямбды, но не могу найти способ сделать это, который не был бы рекурсивным - и кажется, что он просит переполнения стека.
Пример данных:
Peter Piper picked a peck
of pickled peppers
Желаемый вывод - числа ниже.Комментарии рядом с иллюстрацией:
6, 'Peter '
12, 'Peter Piper '
19, 'Peter Piper picked '
21, 'Peter Piper picked a '
26, 'Peter Piper picked a peck[CR]'
29, 'Peter Piper picked a peck[CR]of '
37 'Peter Piper picked a peck[CR]of pickled '