Допустим, df
- это DataFrame, созданный для файлов CSV следующим образом:
df = pd.read_csv('filename.csv')
Предположим, что comments
- это имя столбца, в котором возникает проблема, т.е. вы хотите заменитькаждые двойные кавычки (") с нулевой строкой ().
Для вас это сделает следующий однострочный. Он заменит все двойные кавычки для каждой строки в df['comments']
пустой строкой.
df['comments'] = df['comments'].apply(lambda x: x.replace('"', ''))
Лямбда захватывает каждую строку в df['comments']
в переменной x
.
РЕДАКТИРОВАТЬ: Чтобы избежать двойных кавычек, вам нужно преобразовать строку в ее необработанный формат. Снова еще один однострочныйаналогично приведенному выше.
df['comments'] = df['comments'].apply(lambda x: r'{0}'.format(x))
r
перед строкой является экранированием для экранирования символов в python.