Добавление столбцов в Pandas в зависимости от длины массива? - PullRequest
1 голос
/ 25 апреля 2020

Учитывая предложение «Здравствуйте. Я пишу вопрос», я хочу разбить предложение на пунктуацию и добавить каждое из под-предложений в отдельный столбец в Pandas, например:

dummy = ['Hello', 'I am writing a question']
pd.DataFrame(dummy).T

И я буду sh делать это итеративно, например:

for subsentence in sentence:
    subsentence = re.split(r'[.|,|?|!]', str(subsentence))
    df['item'] = subsentence

Это, однако, дает:

enter image description here

1 Ответ

2 голосов
/ 25 апреля 2020

Использовать понимание списка с выравниванием:

sentence = ["Hello. I am writing a question", "Hello. I am writing a question"]

L = [x for subsentence in sentence for x in re.split(r'[.|,|?|!]', str(subsentence))]

df = pd.DataFrame({'item':L})
print (df)
                       item
0                     Hello
1   I am writing a question
2                     Hello
3   I am writing a question
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...