Я хочу сделать это с python
и pandas
.
Предположим, у меня есть следующее:
file_id text
1 I am the first document. I am a nice document.
2 I am the second document. I am an even nicer document.
и я наконец хочу получить следующее:
file_id text
1 I am the first document
1 I am a nice document
2 I am the second document
2 I am an even nicer document
Итак, я хочу, чтобы текст каждого файла был разбит при каждом останове, и чтобы были созданы новые строки для каждого из токенов этих текстов.
Какой самый эффективный способ сделать это?