При создании кадра данных в R почему некоторые столбцы возвращаются как NA, несмотря на наличие данных - PullRequest
0 голосов
/ 29 апреля 2019

Я пытаюсь импортировать 100k + данных из файла tsv в data frame. Я использовал read.csv.raw из iotools пакета в R для более быстрого выполнения, так как обычные занимают слишком много времени. Это работало как очарование, и я смог прочитать данные в течение секунды. Позже я заметил, что некоторые столбцы содержат данные в базе данных, но при импорте они отображаются как NA.

Может кто-нибудь помочь объяснить, почему это происходит?

32 столбца с 100k + строками (просто назвав его псевдонимом, потому что я не мог скопировать все данные, так как они огромные).

Student Roll NO Student Name    Student Total  Marks    Students Marks English  Students Marks Maths    Students Marks Science  FinalYearProjectMarks   FinalYearProjectName
1   ABC 20  24  23  12  98  Smart City
2   DEF 20  21  22  15  56  City as a Wifi Hub
3   GHI 18  8   21  23  73  Oil And Gas
4   XYZ 15  10  10  23  72  Mobile Pro and cons
5   SEW 20  25  11  25  85  Smart City 2
library(iotools)
 refdata <- read.csv.raw("D:\\Final Report\\Students_all.tsv", header=TRUE, sep="\t",quote = "")
 names(refdata)
[1] "Student_Roll_No"                "Students_Name"                  "Student_Total_Marks"           
 [4] "Students_Marks_English"         "Students_Marks_Maths"           "Students_Marks_Science"        
 [7] "Students_Marks_History"         "Students_Marks_Geography"       "Students_Marks_Social_Work"    
[10] "FinalYearProjectName"        "FinalYearProjectMarks"       "Students_Address"              
[13] "Students_Admission_Date"        "Students_Enrollment_No"         "Student_Ethinic"               
[16] "Students_Parents_Enrollment_No" "Contact_No"                     "Review_Performace_Grade"       
[19] "X"                              "Last_Years_Grade"               "Current_Years_Grade"           
[22] "Last_Years_Marks"               "Percentage"                     "Grade_Review"                  
[25] "Performace_Remark"              "Date_of_Issue"          

Теперь после импорта таблицы мы можем увидеть refdata$FinalYearProjectName,

Actual
FinalYearProjectName:-
NA,
NA,
NA,
NA,
NA,

Он четко показывает NA вместо фактических данных.

Ожидаемое

FinalYearProjectName:-
Smart City,
City as a Wifi Hub,
Oil And Gas,
Mobile Pro and cons,
Smart City 2,
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...