Извлечение строк из фрейма данных R - PullRequest
0 голосов
/ 17 сентября 2018

У меня небольшая проблема. Мне удалось создать фрейм данных из двух других фреймов, и это хорошо, но у меня слишком много строк. Пример:

**PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|F106|2017-09-05**
PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|F106|2017-09-07
PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|F106|2017-09-11
PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|F106|2017-09-14
PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|F107|2018-03-04
PL|WPLF05652203|Terytorium_nowe|F109|2017-05-14|KB|2018-05-13
**PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|F109|2017-09-06**
PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|F109|2017-09-10
PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|F109|2017-09-12
PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|F109|2017-09-17
PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|F107|2018-03-04
PL|WPLF05652203|Terytorium_nowe|F106|2017-09-05|KB|2018-05-13
**PL|WPLF05652203|Terytorium_nowe|F109|2017-09-06|F106|2017-09-07**

У меня должны быть только строки с **. Вопрос в том, как их извлечь, какое правило или условие я должен создать или как извлечь все остальное, чтобы оставить только релевантные. Условие для данных с созданием этого было

   If FullDataSet$date[i] <= FullDataSet1$date[j]

Итак, ясно, что первое свидание раньше, чем второе, но я не хочу иметь столько записей. Новая дата должна соответствовать старой дате из следующей строки.

Спасибо за помощь. С наилучшими пожеланиями

1 Ответ

0 голосов
/ 17 сентября 2018

Я воспроизвел вашу ситуацию, удалив звездочки из вашего текста и прочитав из файла команду

df <- read.table('text.txt', sep = '|')

Вы можете проверить уникальные строки в первых 5 столбцах.

df[which(!duplicated(df[,1:5])),]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...