заменить мультипространства в один пробел из ряда в кадре данных и вернуть его обратно в ряд - PullRequest
0 голосов
/ 16 января 2020

У меня есть многоколонный фрейм данных тегов Flickr с 41 000 строк. Я хочу удалить несколько пустых элементов в столбце, оставив остальные столбцы без изменений.

, вот так выглядит мой столбец:

column1                            column2                                              column3
<a href="www.asia.com>Breda</a>    result    thisIs    Somany     multiplespace   s     25,000

и вот как я хочу Столбец2 выглядит после удаления в нем нескольких пробелов:

column1                            column2                                 column3
<a href="www.asia.com>Breda</a>    result thisIs Somany multiplespace s    25,000

Ответы [ 2 ]

0 голосов
/ 16 января 2020

это также работает с использованием функции, подобной приведенной ниже. это хороший функционал для использования в разных столбцах.

 def replaceWhiteSpace(text):
    res = []
    for i in text:
        res = text.str.split()
    res = res.str.join(' ')
    return res

df['column2'] = replaceWhiteSpace(df['column2'])
0 голосов
/ 16 января 2020
df['column2'] = df['column2'].replace('\s+', ' ', regex=True)

выполнит вашу работу, s\+ означает более одного пробела.

Вы можете использовать этот вопрос , чтобы получить другое представление о том, как это работает, команда replace работает с ним.

...