Я получаю странное поведение, которого я никогда раньше не видел в своем коде, который я много раз использовал ранее для небольших наборов данных. Я анализирую VCF-файлы с помощью Pandas dataframe read_table. VCF-файлы имеют заголовок, а затем 9 столбцов + однако много столбцов отдельных лиц. Раньше, когда я использовал for row in genomes_df.itertuples():
для итерации по каждой строке кадра данных, я мог вызывать столбец "SVLEN" с row.SVLEN
. Когда я проверяю type(row)
, это объект Pandas. Сегодня я запустил свой скрипт для файла большего размера (350 столбцов против 10 столбцов ранее) того же формата VCF, он дает мне AttributeError: 'tuple' object has no attribute 'SVLEN'
, потому что теперь type(row)
- это кортеж!
Что здесь происходит? Имена столбцов разные (NWD107911.mark_dupes
против NWD107911
), но я проверил, что в именах нет пробелов (читайте в другом посте, что это может вызвать другое поведение).