Как удалить лишние символы новой строки из строк в Pandas DataFrame - PullRequest
0 голосов
/ 24 февраля 2020

Мое намерение состоит в том, чтобы удалить ненужные символы новой строки из строк внутри фрейма данных.

Пример:

import pandas as pd

data = ['I like this product\n\nThe product is good']
dataf = pd.DataFrame(data)

Исходные данные:

I like this product

The product is good

Я попробовал следующее, но безуспешно, поскольку все символы новой строки были удалены, а я хотел оставить один из них.

dataf['new'] = dataf.replace('\\n','', regex=True)

В результате все символы новой строки были удалены. :

I like this productThe product is good

Результат, которого я пытаюсь достичь, таков:

I like this product
The product is good

1 Ответ

0 голосов
/ 27 марта 2020

Это должно работать:

dataf['new'] = dataf.replace(r'(\n)+', r'\n', regex=True)

+ указывает на одно или несколько вхождений предыдущего шаблона, и сколько бы их ни было, все они будут заменены только одним символом новой строки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...