Мне дали csv-файл с данными о покупке, но у него есть проблема: у него есть 4 столбца, все разделены запятыми, но в одном столбце с ценой есть много значений с запятой, используемой в качестве десятичного разделителя.Таким образом, в конце концов, когда я пытаюсь прочитать файл, он читает эти строки как имеющие 5 столбцов и сталкивается с ошибкой.Примерно так:
transaction id,user id,purchase price,purchase date
1009497,490408,10,41674
1077573,490408,8,95,41676
Итак, pd.read_csv
может читать метки, читать первую строку, но останавливается на второй строке, потому что думает, что я даю ему 5 столбцов вместо 4.Какой самый эффективный способ исправить мои данные?Невозможно вручную изменить все десятичные разделители с запятой на точку.
ОБНОВЛЕНИЕ: я думаю о том, чтобы прочитать каждую строку как строку, а затем подсчитать запятые в каждой строке, и если в ней 4 запятых, я бы использовал регулярное выражениевзять замену данных вокруг запятой как ". " вместо ", "