Чтение большого файла tsv с другим столбцом через pandas - PullRequest
0 голосов
/ 18 февраля 2020

У меня есть большой файл TSV около 140 миллионов строк. Однако, когда я пытаюсь прочитать файл через разные коды, я страдаю от разных ошибок.

  • pd.read_csv('abc.tsv',delimiter='\t',encoding='utf-8') Считывает только 35988840 строк без каких-либо ошибок или предупреждений.
  • np.genfromtxt("abc.tsv", names=True, delimiter="\t", invalid_raise = False) -
    Считывает строки 35988840 со следующим сообщением.

    main : 1: Предупреждение о преобразовании: Обнаружены некоторые ошибки! Строка № 35988840 (получено 3 столбца вместо 8)

  • np.genfromtxt("abc.tsv", names=True, delimiter="\t")

  • np.genfromtxt("abc.tsv", names=True, delimiter="\t", skip_header=1)

  • np.genfromtxt("abc.tsv", names=True, delimiter="\t", invalid_raise = False)

Та же ошибка в последних трех, что количество столбцов отличается. Как мы go об этом? Пожалуйста, помогите

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...