Избавьтесь от начальных пробелов в указанных c ячейках в Pandas - PullRequest
0 голосов
/ 10 апреля 2020

Я работаю с большим набором данных (более 2 миллионов строк × 10 столбцов), в котором есть столбец со строковыми значениями, которые были странным образом заполнены. Некоторые строки начинаются и заканчиваются множеством пробелов, а другие нет.

То, что у меня выглядит, выглядит так:

   col1                    
0 (spaces)string(spaces)    
1 (spaces)string(spaces)  
2 string    
3 string   
4 (spaces)string(spaces) 

Я хочу избавиться от этих пробелов в начале и в конце и получите что-то вроде этого:

   col1                    
0 string   
1 string 
2 string    
3 string   
4 string

Обычно для небольшого набора данных я бы использовал для итерации (я знаю, что это далеко от оптимального), но теперь это не вариант, учитывая время, которое потребуется .

Как я могу использовать силу pandas, чтобы избежать for l oop здесь?

Спасибо!

edit: я не могу получить избавиться от всех пробелов, поскольку строки содержат пробелы.

1 Ответ

1 голос
/ 10 апреля 2020
df['col1'].apply(lambda x: x.strip())

может помочь

...