Как я могу извлечь предложения из фрейма данных в Python и сохранить ключ абзаца? - PullRequest
0 голосов
/ 05 ноября 2019

У меня есть фрейм данных, который включает в себя 1604 абзац следующим образом:

enter image description here

Я хочу извлечь все предложения (даже наивно используяточки) и предоставить новый фрейм данных, в каждой строке которого есть одно предложение и значения предыдущего столбца, особенно ключ абзаца (в основном это индекс в первом столбце слева)

Я работал над этим и мог бы предоставитьстолбец главы для каждого предложения следующим образом:

 # Create lists to fill with values
l_col1 = []
l_col2 = []

# iterrate over each row and fill our lists
for ix, row in dfAstroNova.iterrows():
    for value in row['sentences']:
        l_col1.append(value)
        l_col2.append(row['chapter'])

# Create new dataframe from the two lists
df= pd.DataFrame({'sentences': l_col1 ,
                         'chapter': l_col2 })
df=df.rename(columns={"sentences":"sents"});

, который дает мне этот фрейм данных (dfAstroNova - имя исходного фрейма данных)

, как вы видите, у меня есть ключ главы. Мой вопрос заключается в том, как добавить ключ абзаца (который представляет собой номер текста столбца в главном фрейме данных в новый фрейм данных)

Затем у меня есть еще один столбец, который показывает, что это предложение принадлежит тому абзацу в оригиналефрейм данных или лучше один дополнительный столбец, который включает для каждого предложения соответствующий параграф?

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...