У меня большой фрейм данных My_Data
, который содержит несколько тысяч имен. Я пытаюсь установить подкадр данных, используя вектор имен Names.rm
, но продолжаю получать фрейм данных, возвращаемый с 0 строками (несмотря на то, что имена присутствуют в My_Data).
Вот что я пробовал:
My_Data[My_Data$Author_name %in% Names.rm, ]
subset(My_Data, Author_name %in% Names.rm)
EDIT:
Извините, я не уверен в правильном способе форматирования данных, но я попытаюсь привести пример:
My_Data
Author Time.period Gender
8 AERTS R Rien ECOLOGY 2001-2005 M
10 AGRAWAL AA Anurag ECOLOGY 2001-2005 M
12 AINSLIE G George NEUROSCIENCES 2001-2005 M
73 BLOB RW Richard ZOOLOGY 2001-2005 M
Names.rm
1 AERTS R Rien ECOLOGY<br>
2 BLOB RW Richard ZOOLOGY
Используемый код: My_Data[My_Data$Author %in% Names.rm, ]
Ожидаемый результат:
Author Time.period Gender
8 AERTS R Rien ECOLOGY 2001-2005 M
73 BLOB RW Richard ZOOLOGY 2001-2005 M
Фактический вывод (при попытке использовать весь фрейм данных):
[1] Author Time.period Gender<br>
<0 rows> (or 0-length row.names)
РЕДАКТИРОВАТЬ 2:
Хорошо, поэтому он работал там с этим подмножеством данных, но он не работает, когда я пытаюсь сделать это для всего моего набора данных. Существует ли ограничение на размер набора данных, для которого вы можете сделать это?
Я прочитал:
Выбор столбцов в кадре данных R на основе этих * не * в векторе
а также
Выбор строк из фрейма данных на основе значений в векторе