R неправильно читает мой файл, в нем три переменные - PullRequest
0 голосов
/ 07 ноября 2019

Я пытаюсь импортировать данные в R, набор данных о браке. Набор данных имеет штаты, год (1990-2016) и годовой показатель. Однако это не правильное направление. Год переводится в X.1, X.2, X.3 и т. Д. Четвертый. Он также прикрепляет числа к штатам, например, Алабама - 1, хотя я не уверен, что эта часть может быть исправлена.

Ссылка на данные https://drive.google.com/file/d/1eLdPZKZBMDkoObl4tLemQSGTnhiAlvOT/view?usp=sharing

Я удалил файл для всего, кроме необработанных данных, а также для года и состояния заголовка. Это было после того, как он не читал мой xslx файл правильно, поэтому я преобразовал в csv.

> csvfile<-read.csv(file="~/Desktop/datah.csv")
> csvfile
                  X   Year    X.1    X.2  X.3  X.4    X.5    X.6    
 X.7
1                 State 2017.0 2016.0 2015.0 2014 2013 2012.0 
2011.0 2010.0
2               Alabama    7.0    7.1    7.4  7.8  7.8    8.2    
8.4    8.2
3                Alaska    6.9    7.1    7.4  7.5  7.3    7.2    
7.8    8.0
4               Arizona    5.8    5.9    5.9  5.8  5.4    5.6    
5.7    5.9
5              Arkansas    9.5    9.9   10.0 10.1  9.8   10.9   

Я показал, как выглядят первые несколько результатов.

Ответы [ 2 ]

0 голосов
/ 07 ноября 2019

Вам необходимо пропустить первую строку, так как она не содержит вашего заголовка:

My_data_frame <- read.csv(file="~/Desktop/datah.csv", skip = 1, stringsAsFactors = FALSE)

Это также хороший способ удалить автоматическое преобразование stringsAsFactors .

Я настоятельно рекомендую использовать dplyr впоследствии, чтобы привести в порядок ваши данные. Это поможет вам проанализировать и подготовить график позже, если хотите.

0 голосов
/ 07 ноября 2019

Если ваш CSV-файл имеет заголовок, просто скажите это R. Попробуйте:

csvfile<-read.csv(file="~/Desktop/datah.csv", header=T, sep=",")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...