У меня довольно грязный текстовый файл, который мне нужно преобразовать в фрейм данных, чтобы использовать в качестве справочных данных. Ниже приведен отрывок:
http://amdc.in2p3.fr/nubase/nubase2016.txt
Я вычистил его как можно лучше, но коротко говоря Я хотел бы разделить пробелом большую часть каждой строки, а затем исправить разделитель в последнем столбце. т.е. игнорируйте пробелы в последнем разделе.
Текст очищенного файла данных
Может ли кто-нибудь указать мне правильное направление ресурса, который может это сделать? Не уверен, справится ли Pandas с этим?
Кенни
PS Я нашел несколько замечательных ресурсов для очистки нескольких пробелов и замены разрывов строк. Извините, не могу найти исходную ссылку, поэтому смотрите прикрепленный.
fin = open("Input.txt", "rt")
fout = open("Ouput.txt", "wt")
for line in fin:
fout.write(re.sub(' +', ' ', line).strip() + "\n")
fin.close()
fout.close()