У меня есть CSV-файл, такой как
идентификатор, тело, категория, подкатегория, номер, smstype, smsflag
50043, «Уважаемый клиент, спасибо за регистрацию» ,,, DM-YEBA, входящие, 0
30082, Поздравляю!Ваша учетная запись была активирована. ,,, DM-SBAW, входящие, 0
, когда я использую pd.read_csv()
, тогда все первое наблюдение включается в столбец id
и не разделяетсясреди других столбцов из-за двойных кавычек, используемых для тела сообщения, в то время как во втором наблюдении строка должным образом разделена между столбцами.
Что делать, чтобы первое наблюдение было разделено среди всех столбцов, как в этомimage 
Посмотрите, что на самом деле делает pd.read_csv.Он берет все наблюдение в столбце id 
, когда я открываю CSV-файл в блокноте, он добавляет дополнительные кавычки ко всей строке, что в конечном итоге вызывает фиаско и цитатуметка, уже находящаяся в файле, экранируется с другим символом "" ", как показано ниже.
id, тело, категория, подкатегория, номер, smstype, smsflag
" 50043, "" УважаемыйКлиент, Благодарим Вас за регистрацию "" ,, DM-YEBA, входящие, 0 "
30082, Поздравляем! Ваш аккаунт был активирован. ,,, DM-SBAW, Входящие, 0