Примеры случайных выборок KWIC в Quanteda - PullRequest
0 голосов
/ 28 февраля 2019

Я пытаюсь случайным образом отобрать примеры KWIC из довольно большого корпуса.Для небольших корпусов я смог полностью просмотреть вывод KWIC с помощью xtable, а затем создать списки случайных чисел для идентификации, копирования и вставки случайных примеров.Но для больших корпусов это не работает, потому что объект KWIC содержит более 500 000 примеров.

Есть ли способ закодировать это, чтобы я мог ограничить объект KWIC только случайной выборкой из 30 или 40 попаданий, а не списком всех попаданий?Большое спасибо за вашу помощь.Я не вижу очевидных подходов в документации.

1 Ответ

0 голосов
/ 28 февраля 2019

Хорошо, я должен был потрудиться, пытаясь найти ответ на свой вопрос.Следующий код работает для того, что я надеялся сделать:

requirekwic <- kwic (cfrcorpus, pattern = "Requir *", window = 50) </p>

samplerequirekwic <- requirekwic [sample (nrow(requirekwic), 15),] </p>

...