Есть ли способ вернуть предложения из разбитых слов? Например, у меня есть текст ниже:
THIS IS
A TITLE
hello my
name
is Sam
Some of the text is formatted.
But others
are
not
То, что я сейчас делаю, - это придание ему некоторой структуры.
- Если я вижу заглавные буквы, я предполагаю, что это заголовок, а затем я получаю все заглавные буквы в последовательности и формирую заголовок.
- Если я увижу заглавный символ и через несколько символов полностью остановлюсь, то это будет одно полное предложение.
Результат, который я хотел бы получить сверху:
THIS IS A TITLE
----
hello my name is Sam
----
Some of the text is formatted.
----
But others are not
----
Где выше «----» - это предложение. (Форматирование)
Тем не менее, мне кажется, что мне нужно учитывать множество угловых случаев.
Есть ли обработка естественного языка, которую я мог бы сделать, чтобы сделать это проще?