readHTMLTable создает дополнительные строки с нулевыми переменными - PullRequest
0 голосов
/ 21 ноября 2018

Я пытаюсь прочитать таблицу из HTML-файла.Я сделал это следующим образом:

mnydata = "file:///D:/Mampi/EastSinghbhum_updated/Treasury/TREASURY_DATA_EAST_SINGHBHUM/GHATSHILA_TREASURY_DATA/GHATSHILA_2016-17/GTSDAD001.html"
data2 <- readHTMLTable(mnydata, which = 2)

Команда создает дополнительные строки с нулевыми значениями.Как решить проблему?

Image of the data set is attached

Спасибо, Мампи

1 Ответ

0 голосов
/ 21 ноября 2018

Пожалуйста, прочитайте здесь о разнице NULL и NA , чтобы вы могли правильно использовать имена.

IND <- apply(data2, 1, function(x) !all(is.na(x)))

data2[IND,]

Так что этот подход использует apply с margin = 1 (по строкам), чтобы получить индекс всех НЕ - (всех) -NA-строк.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...