У меня есть фрейм данных, который включает в себя 1604 абзац следующим образом:
Я хочу извлечь все предложения (даже наивно используяточки) и предоставить новый фрейм данных, в каждой строке которого есть одно предложение и значения предыдущего столбца, особенно ключ абзаца (в основном это индекс в первом столбце слева)
Я работал над этим и мог бы предоставитьстолбец главы для каждого предложения следующим образом:
# Create lists to fill with values
l_col1 = []
l_col2 = []
# iterrate over each row and fill our lists
for ix, row in dfAstroNova.iterrows():
for value in row['sentences']:
l_col1.append(value)
l_col2.append(row['chapter'])
# Create new dataframe from the two lists
df= pd.DataFrame({'sentences': l_col1 ,
'chapter': l_col2 })
df=df.rename(columns={"sentences":"sents"});
, который дает мне этот фрейм данных (dfAstroNova - имя исходного фрейма данных)
, как вы видите, у меня есть ключ главы. Мой вопрос заключается в том, как добавить ключ абзаца (который представляет собой номер текста столбца в главном фрейме данных в новый фрейм данных)
Затем у меня есть еще один столбец, который показывает, что это предложение принадлежит тому абзацу в оригиналефрейм данных или лучше один дополнительный столбец, который включает для каждого предложения соответствующий параграф?