Внесение изменений в файл ntriples с python - PullRequest
0 голосов
/ 29 марта 2019

Сценарий: Я только что получил большой файл ntriples (6,5 ГБ без сжатия). Я пытаюсь открыть его и выполнить некоторые операции (например, очистить некоторые содержащиеся в нем данные).

Проблема: Я не смог проверить содержимое этого файла. Notepad ++ не может справиться с этим, и в RDFlib мне удалось загрузить файл, но я, похоже, не могу найти способ редактирования без анализа всего этого. Я также пытался использовать пакет RDF (из как анализировать большие наборы данных с помощью RDFLib? ), но я не могу найти способ установить его в Python 3.

Вопрос: Как лучше всего выполнить такую ​​операцию? Есть ли в rdflib какая-либо команда, позволяющая редактировать этот вид?

1 Ответ

0 голосов
/ 13 июня 2019

если это ntriples, то в основном это строка за строкой.Таким образом, вы можете прочитать файл небольшими порциями (несколько N строк из файла) и проанализировать порцию с помощью rdflib, а затем выполнить любую операцию очистки на графике.

...