Как импортировать набор данных урду - PullRequest
0 голосов
/ 13 сентября 2018

Как мне импортировать набор данных из файла CSV, в котором написан урду? Я пытаюсь сделать таким образом, но получаю ошибку. Я что-то не так делаю?

Код:

library(rio)
Sys.setlocale("LC_ALL","Urdu") 
fil <- read.csv("D:/PycharmProjects/shiny-examples-master/shiny-examples-master/Data_set.csv",encoding='UTF-8')

Data_set.csv:

Reg No.     address
13  Nazim ud Din Road, F-11, ICT,  دارالحکومت اسلام آباد, 44000, ‏پاکستان‎
45  Street 34, F-7/1, F-7, ICT, دارالحکومت اسلام آباد, 44000, ‏پاکستان‎
5564    Lane 11, DHA Phase II, ICT,  دارالحکومت اسلام آباد, 44000, ‏پاکستان

Ошибка:

Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 2 appears to contain embedded nulls
3: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 3 appears to contain embedded nulls
4: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 4 appears to contain embedded nulls
5: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 5 appears to contain embedded nulls
6: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  incomplete final line found by readTableHeader on 'D:/PycharmProjects/shiny-examples-master/shiny-examples-master/12000.csv'

1 Ответ

0 голосов
/ 13 сентября 2018

Попробуйте использовать флаг skipNul и посмотрите, работает ли это.

read.csv("Data_set.csv", header = TRUE, sep="\t", encoding="UTF-8", skipNul = TRUE)

                                                           Reg.No......address
1    13  Nazim ud Din Road, F-11, ICT,  دارالحکومت اسلام آباد, 44000, ‏پاکستان‎
2       45  Street 34, F-7/1, F-7, ICT, دارالحکومت اسلام آباد, 44000, ‏پاکستان‎
3  5564    Lane 11, DHA Phase II, ICT,  دارالحکومت اسلام آباد, 44000, ‏پاکستان

Или установите кодировку на UTF-16E, но UTF-8 выглядит правильно.

read.csv("test.csv", header = TRUE, sep="\t", encoding="UTF-16E", skipNul = TRUE)
                                                                                   Reg.No......address
1 13  Nazim ud Din Road, F-11, ICT,  ط¯ط§ط±ط§ظ„ط­ع©ظˆظ…طھ ط§ط³ظ„ط§ظ… ط¢ط¨ط§ط¯, 44000, â€ڈظ¾ط§ع©ط³طھط§ظ†â€ژ
2    45  Street 34, F-7/1, F-7, ICT, ط¯ط§ط±ط§ظ„ط­ع©ظˆظ…طھ ط§ط³ظ„ط§ظ… ط¢ط¨ط§ط¯, 44000, â€ڈظ¾ط§ع©ط³طھط§ظ†â€ژ
3  5564    Lane 11, DHA Phase II, ICT,  ط¯ط§ط±ط§ظ„ط­ع©ظˆظ…طھ ط§ط³ظ„ط§ظ… ط¢ط¨ط§ط¯, 44000, â€ڈظ¾ط§ع©ط³طھط§ظ†
...