Подмножество данных с использованием вектора - PullRequest
0 голосов
/ 31 октября 2018

У меня большой фрейм данных My_Data, который содержит несколько тысяч имен. Я пытаюсь установить подкадр данных, используя вектор имен Names.rm, но продолжаю получать фрейм данных, возвращаемый с 0 строками (несмотря на то, что имена присутствуют в My_Data).

Вот что я пробовал:

My_Data[My_Data$Author_name %in% Names.rm, ]

subset(My_Data, Author_name %in% Names.rm)

EDIT:

Извините, я не уверен в правильном способе форматирования данных, но я попытаюсь привести пример:

My_Data

Author Time.period Gender 8 AERTS R Rien ECOLOGY 2001-2005 M 10 AGRAWAL AA Anurag ECOLOGY 2001-2005 M 12 AINSLIE G George NEUROSCIENCES 2001-2005 M 73 BLOB RW Richard ZOOLOGY 2001-2005 M

Names.rm

1 AERTS R Rien ECOLOGY<br> 2 BLOB RW Richard ZOOLOGY

Используемый код: My_Data[My_Data$Author %in% Names.rm, ]

Ожидаемый результат: Author Time.period Gender 8 AERTS R Rien ECOLOGY 2001-2005 M 73 BLOB RW Richard ZOOLOGY 2001-2005 M

Фактический вывод (при попытке использовать весь фрейм данных):

[1] Author Time.period Gender<br> <0 rows> (or 0-length row.names)

РЕДАКТИРОВАТЬ 2: Хорошо, поэтому он работал там с этим подмножеством данных, но он не работает, когда я пытаюсь сделать это для всего моего набора данных. Существует ли ограничение на размер набора данных, для которого вы можете сделать это?

Я прочитал: Выбор столбцов в кадре данных R на основе этих * не * в векторе а также Выбор строк из фрейма данных на основе значений в векторе

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...