У меня есть таблица (файл .txt с разделителями табуляции) в следующем виде:
- каждая строка является записью;
- первый ряд заголовков
- первые 5 столбцов представляют собой простые числовые параметры
- все столбцы после 7-го столбца должны быть списком значений
Моя проблема в том, как я могу импортировать и создать фрейм данных, где последний столбец содержит список значений?
----- Задача 1 ----
Заголовок (первая строка) «короче», содержит просто название некоторых столбцов. Все значения после 7-го не имеют заголовка (потому что это должен быть список). Если я импортирую файл как есть, это может сбить с толку функции импорта
Если, например, я импортирую как следует
df = pd.read_table( path , sep="\t")
созданный DataFrame
имеет столько столбцов, сколько элементов в первой строке. Кроме того, назначенные значения данных не совпадают.
---- Задача 2 -----
Что меня действительно смущает, так это то, что если я открою .txt в Excel и сохраню его как разделенный табуляцией (без каких-либо изменений), я могу затем импортировать его без проблем, также с заголовками: столбцы без заголовка просто с тегом «Безымянный XYZ».
Почему сохранение в Excel изменит это? Используя Note ++, я вижу только одно отличие: исходный файл .txt находится в форме «Unix (LF)», а файл, сохраненный в Excel, - «Windows (CR LF)». Оба UTF-8, поэтому я не понимаю, как это может быть проблемой?!?
Тем не менее, отсюда я мог бы манипулировать данными и пытаться собрать все желаемые столбцы и сделать их списком. Тем не менее, я надеюсь, что есть более элегантный и быстрый способ сделать это.
Вот скриншот файла .txt
Спасибо,