Я пытаюсь импортировать 100k + данных из файла tsv
в data frame
. Я использовал read.csv.raw
из iotools
пакета в R
для более быстрого выполнения, так как обычные занимают слишком много времени. Это работало как очарование, и я смог прочитать данные в течение секунды. Позже я заметил, что некоторые столбцы содержат данные в базе данных, но при импорте они отображаются как NA
.
Может кто-нибудь помочь объяснить, почему это происходит?
32 столбца с 100k + строками
(просто назвав его псевдонимом, потому что я не мог скопировать все данные, так как они огромные).
Student Roll NO Student Name Student Total Marks Students Marks English Students Marks Maths Students Marks Science FinalYearProjectMarks FinalYearProjectName
1 ABC 20 24 23 12 98 Smart City
2 DEF 20 21 22 15 56 City as a Wifi Hub
3 GHI 18 8 21 23 73 Oil And Gas
4 XYZ 15 10 10 23 72 Mobile Pro and cons
5 SEW 20 25 11 25 85 Smart City 2
library(iotools)
refdata <- read.csv.raw("D:\\Final Report\\Students_all.tsv", header=TRUE, sep="\t",quote = "")
names(refdata)
[1] "Student_Roll_No" "Students_Name" "Student_Total_Marks"
[4] "Students_Marks_English" "Students_Marks_Maths" "Students_Marks_Science"
[7] "Students_Marks_History" "Students_Marks_Geography" "Students_Marks_Social_Work"
[10] "FinalYearProjectName" "FinalYearProjectMarks" "Students_Address"
[13] "Students_Admission_Date" "Students_Enrollment_No" "Student_Ethinic"
[16] "Students_Parents_Enrollment_No" "Contact_No" "Review_Performace_Grade"
[19] "X" "Last_Years_Grade" "Current_Years_Grade"
[22] "Last_Years_Marks" "Percentage" "Grade_Review"
[25] "Performace_Remark" "Date_of_Issue"
Теперь после импорта таблицы мы можем увидеть refdata$FinalYearProjectName
,
Actual
FinalYearProjectName:-
NA,
NA,
NA,
NA,
NA,
Он четко показывает NA
вместо фактических данных.
Ожидаемое
FinalYearProjectName:-
Smart City,
City as a Wifi Hub,
Oil And Gas,
Mobile Pro and cons,
Smart City 2,