Проблемы импорта CSV в R - PullRequest
0 голосов
/ 28 ноября 2018

Я пытаюсь научить себя R (только начал).Я решил импортировать 2 CSV-файла, чтобы попрактиковаться в их объединении.

Один файл импортирован просто отлично, другой выдает следующие ошибки:

Вот ссылка на файл CSV:

https://data.world/jonathankkizer/occupation-computerization

Я использовал следующее утверждение

occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",")

Предупреждающие сообщения: 1: в read.table ("C:/ Users / Admin / Desktop / - = Data Science = - / 11-27-2018 / jonathankkizer-оккупация-computerization / OccComp.csv ",: строка 1 содержит встроенные нули 2: в read.table (" C: /Пользователи / Администратор / Рабочий стол / - = Наука о данных = - / 11-27-2018 / jonathankkizer-профессия-компьютеризация / OccComp.csv ",: строка 2 содержит встроенные нули 3: В read.table (" C: / Users/ Admin / Desktop / - = Data Science = - / 11-27-2018 / jonathankkizer-оккупация-компьютеризация / OccComp.csv ",: строка 3 содержит встроенные нули 4: в read.table (" C: / Users /Admin / Desktop / - = Data Science = - / 11-27-2018 / jonathankkizer-оккупация-компьютеризация / OccComp.csv ",: строка 4 содержит встроенные нули 5: In read.table ("C: / Users / Admin / Desktop / - = Наука о данных = - / 11-27-2018 / jonathankkizer-занятие-компьютеризация / OccComp.csv ",: строка 5 содержит встроенные нули 6: При сканировании (файл = файл,что = что, sep = sep, цитата = цитата, dec = dec,: EOF внутри строки в кавычках 7: при сканировании (файл = файл, что = что, sep = sep, цитата = цитата, dec = dec,: встроенный нуль (s) найдено во входных данных

Я обнаружил в StackOverflow, что это может быть связано с кодировкой, поэтому я использовал предложенное решение и выполнил оператор

occupationforjoin<-read.table("C:/Users/Admin/Desktop/-=Data
Science=-/11-27-2018/jonathankkizer-occupation-computerization/OccComp.csv",
header=TRUE, sep=",", fileEncoding="UTF-16LE")

Это дало мне другоесообщение об ошибке:

Ошибка в read.table ("C: / Users / Admin / Desktop / - = Data Science = - / 11-27-2018 / jonathankkizer-оккупация-компьютеризация / OccComp.csv",: больше столбцов, чем имен столбцов

Я также пытался использовать функцию read.csv безрезультатно.

Как исправить эту проблему и успешно импортировать набор данных?Ни одно из решений (например, с использованием параметров "skipNul = TRUE", "comment.char =" ""), которые я нашел в Интернете, не помогло.

UPD: вот вставка набора данных, если выне хочу загружать CSV-файл из мира данных: https://pastebin.com/SPEtWT6f

Ответы [ 3 ]

0 голосов
/ 28 ноября 2018

Использовать dataframe = read.csv ("name_of_file.csv")

или

dataframe = read.csv (file.choose ()).

Надеюсь, что этобудет работать.

0 голосов
/ 04 декабря 2018

Я наконец нашел решение!Я сходил с ума;даже мой инструктор не знал, как это исправить!

Это утверждение работает:

o<-read.csv("C:/Users/Admin/Desktop/-=Data Science=-/11-27-2018/Occ.txt", header=T, sep="\t", fileEncoding="UTF-16LE")

Как я уже говорил в своем первоначальном вопросе: я пытался использовать fileEncoding = "UTF-16LE " и это не помогло.Задав вопрос, я попытался использовать sep = "\ t" , и это не помогло.Но с помощью оба сделали свое дело!

0 голосов
/ 28 ноября 2018

Попробуйте использовать функцию read_csv () из пакета readr .

...