У меня есть несколько фреймов данных в R следующей формы:
> pos.sentence
doc_id token_id token pos
1 d1 1 Ik PRON
2 d1 2 weet VERB
3 d1 3 dat SCONJ
4 d1 4 jij PRON
5 d1 5 dat SCONJ
6 d1 6 wil AUX
7 d1 7 en CCONJ
8 d1 8 ik PRON
9 d1 9 heb AUX
10 d1 10 het DET
11 d1 11 al ADV
12 d1 12 gekocht VERB
Что я хотел бы сделать, это создать подмножества данных, где все строки из PRON (который появляется в столбце pos)до следующего экземпляра PRON собраны.Таким образом, в данном случае получается три отдельных подмножества / фрейма данных:
doc_id token_id token pos
1 d1 1 Ik PRON
2 d1 2 weet VERB
3 d1 3 dat SCONJ
doc_id token_id token pos
4 d1 4 jij PRON
5 d1 5 dat SCONJ
6 d1 6 wil AUX
7 d1 7 en CCONJ
doc_id token_id token pos
8 d1 8 ik PRON
9 d1 9 heb AUX
10 d1 10 het DET
11 d1 11 al ADV
12 d1 12 gekocht VERB
Есть ли кто-нибудь, кто знает способ сделать это?Фреймы данных, служащие моим входом, различаются по размеру, поэтому я не могу создавать подмножества на основе номера строки.