Список записей в заголовке в текстовом файле с использованием Python - PullRequest
0 голосов
/ 25 октября 2018

У меня есть файл .txt, где у меня есть текстовые заголовки и числовые данные.Я работаю с Python 2.7, и я использую панды и NumPy в моей работе.Структура файла похожа на изображение, показанное ниже:

enter image description here

Данные для этого файла могут быть получены из здесь .В этом файле я хочу получить список всех тегов.Например, на рисунке выше я хочу, чтобы список выглядел следующим образом:

[Tag1, Tag1, Tag1, Tag5, Tag5, Tag6, Tag6]

В настоящее время я читаю файл, используя:

df = pd.read_csv('dum.txt',sep='\t', header=[0,1], index_col=0)

Когда я пытаюсьlst = df.columns.levels[1], я получаю Index([u'Tag1', u'Tag5', u'Tag6'], dtype='object', name=u'Tag') в качестве вывода вместо списка, который мне нужен.

Как я могу получить список тегов в моей задаче, то есть [Tag1, Tag1, Tag1, Tag5, Tag5, Tag6, Tag6]?Заранее спасибо.

1 Ответ

0 голосов
/ 25 октября 2018

Вы можете использовать get_level_values(1) вместо levels[1], а затем преобразовать в список, используя tolist():

>>> df.columns.get_level_values(1).tolist()
['Tag1', 'Tag1', 'Tag1', 'Tag5', 'Tag5', 'Tag6', 'Tag6']

Причина в том, что levels[1] даст вам,как вы видели, список всех уникальных уровней, тогда как get_level_values фактически вернет:

Возвращает вектор значений метки для запрошенного уровня, равный длине индекса

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...