Извлечение и импорт файла Csv.gz в Excel / SPSS ... проблема с распознаванием текстового классификатора? - PullRequest
0 голосов
/ 03 ноября 2018

Я использую файл из Insideairbnb.com для своей диссертации. Это файл csv.gz, поэтому сначала я извлек его, используя «Archive Utility» для Mac.

Он разделен запятыми и использует двойные кавычки в качестве квалификатора текста, который я указал во всплывающем окне «Импорт», но Excel / SPSS по-прежнему разделяет запятые в тексте.

Это большой файл, содержащий полные описания и обзоры airbnb, которые содержатся в двойных кавычках. К сожалению, в строках текста много запятых. Я никогда не видел CSV-файл с таким форматом, но я считаю, что он был составлен правильно, потому что я видел Insideairbnb цитируется для данных в довольно многих научных статьях.

Я включил ссылку на изображения фрагмента данных в окне импорта SPSS. Если кто-нибудь знает, как импортировать это, я буду очень признателен за ваш отзыв :)

Заранее спасибо!

[[1]: https://i.stack.imgur.com/Iy3dA.png][1][SPSS снимок экрана] [1]: https://i.stack.imgur.com/i7KcG.png[SPSS снимок экрана 2] [1]

1 Ответ

0 голосов
/ 14 ноября 2018

Я согласен с комментарием @ sarawhite выше; если это разовая проблема, я бы попробовал пару вещей.

  1. откройте CSV в Excel, и если он выглядит правильно, сохраните его и попробуйте импортировать его в SPSS или сохранить как файл .xlsx и импортировать его (хотя может быть глупость со строковыми переменными в любом сценарий)

OR

  1. откройте в блокноте ++ и посмотрите на необработанные данные. вы можете найти и заменить двойные разрывы строк довольно легко.
...