Python NLP для извлечения первого абзаца из предложения - PullRequest
0 голосов
/ 27 апреля 2018

У меня есть сценарий использования, в котором мне нужно извлечь первый абзац из длинного текста.

Нужно знать, возможно ли это сделать в НЛП с использованием python?

Доступна ли поддержка плагинов?

1 Ответ

0 голосов
/ 27 апреля 2018

Вам не нужен плагин для этого. В зависимости от того, как хранится ваш текст, абзац обозначается как 1, введите \n или 2 вводит \n\n. Помимо этого, вопрос заключается в том, хранится ли ваш текст в огне, если вы прочитали его как строку.

если строка:

paragraph = text.split(sep)[0]

где sep равно \n или \n\n, в зависимости от ситуации

если он хранится в виде файла, если ваш разделитель \n:

with open(filename) as f:
    paragraph = f.readline()

если он хранится в виде файла, если ваш разделитель \n\n, вам действительно нужно больше, чем одна строка:

paragraph = ''
with open(filename) as f:
    while True:
        line = f.readline()
        if line == '\n':
            break
        paragraph += line.strip('\n')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...