Импортировать таблицу в DataFrame и установить группу столбцов в виде списка - PullRequest
0 голосов
/ 16 апреля 2019

У меня есть таблица (файл .txt с разделителями табуляции) в следующем виде:

  • каждая строка является записью;
  • первый ряд заголовков
  • первые 5 столбцов представляют собой простые числовые параметры
  • все столбцы после 7-го столбца должны быть списком значений

Моя проблема в том, как я могу импортировать и создать фрейм данных, где последний столбец содержит список значений?

----- Задача 1 ----

Заголовок (первая строка) «короче», содержит просто название некоторых столбцов. Все значения после 7-го не имеют заголовка (потому что это должен быть список). Если я импортирую файл как есть, это может сбить с толку функции импорта

Если, например, я импортирую как следует

df = pd.read_table( path , sep="\t")

созданный DataFrame имеет столько столбцов, сколько элементов в первой строке. Кроме того, назначенные значения данных не совпадают.

---- Задача 2 -----

Что меня действительно смущает, так это то, что если я открою .txt в Excel и сохраню его как разделенный табуляцией (без каких-либо изменений), я могу затем импортировать его без проблем, также с заголовками: столбцы без заголовка просто с тегом «Безымянный XYZ». Почему сохранение в Excel изменит это? Используя Note ++, я вижу только одно отличие: исходный файл .txt находится в форме «Unix (LF)», а файл, сохраненный в Excel, - «Windows (CR LF)». Оба UTF-8, поэтому я не понимаю, как это может быть проблемой?!?

Тем не менее, отсюда я мог бы манипулировать данными и пытаться собрать все желаемые столбцы и сделать их списком. Тем не менее, я надеюсь, что есть более элегантный и быстрый способ сделать это.

Вот скриншот файла .txt

enter image description here

Спасибо,

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...