как преобразовать файл .nt в файл tsv через pyspark? - PullRequest
0 голосов
/ 31 мая 2019

У меня есть файл в формате .nt.Каждая строка - триплет.Например:

0 <dbo:class> <dbp:aconoidasida>
0 <dbo:class> bla bla

Я хочу преобразовать этот файл в действительный формат .tsv.Каков наилучший способ сделать это в pyspark?

Я не знаю, будет ли хорошей идеей разбивать каждую строку по следующей схеме: «несколько пробелов, несколько символов>»? `

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...