Имеет ли pandas.read_csv () способ удалить символы '\ s' и '\ t' при чтении файла в DataFrame? - PullRequest
0 голосов
/ 18 января 2019

Мне нужно прочитать файл .csv в DataFrame, но этот файл содержит символы / s и / t, которые ставят под угрозу дальнейший анализ. Лучше сначала манипулировать файлом и удалить \ s \ t char? Или у pandas.read_csv () есть способ сделать это?

Я попытался изменить файл .csv, но мне кажется, что это не очень хорошее решение, особенно если код работает в конкретной среде, требующей разрешения на запись на диск.

with open(file, 'r+') as fl:
    stream = str()
    for char in fl.read():
        if char != ' ':
            stream += char
        fl.seek(0)
        fl.flush()
        fl.write(stream)
data = pd.read_csv(file)

Для меня было бы лучше, если бы я мог сделать это при чтении (pd.read_csv ()) или с данными в объекте pandas.DataFrame ().

1 Ответ

0 голосов
/ 18 января 2019

До этого момента я загружал данные в DataFrame, а затем вызывал df.columns = df.columns.str.strip(). Я надеюсь, что это то, что вы имели в виду.

...