Question

Учитывая предложение «Здравствуйте. Я пишу вопрос», я хочу разбить предложение на пунктуацию и добавить каждое из под-предложений в отдельный столбец в Pandas, например:

dummy = ['Hello', 'I am writing a question']
pd.DataFrame(dummy).T

И я буду sh делать это итеративно, например:

for subsentence in sentence:
    subsentence = re.split(r'[.|,|?|!]', str(subsentence))
    df['item'] = subsentence

Это, однако, дает:

jezrael · Answer 1 · 25 апреля 2020

Использовать понимание списка с выравниванием:

sentence = ["Hello. I am writing a question", "Hello. I am writing a question"]

L = [x for subsentence in sentence for x in re.split(r'[.|,|?|!]', str(subsentence))]

df = pd.DataFrame({'item':L})
print (df)
                       item
0                     Hello
1   I am writing a question
2                     Hello
3   I am writing a question

Добавление столбцов в Pandas в зависимости от длины массива?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Добавление столбцов в Pandas в зависимости от длины массива?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов