У меня есть текстовый файл в виде таблицы, каждая строка содержит от 0 до 4 слов, разделенных на произвольное количество пробелов.
hello world this is
an example file
is there a good
way to clean this
your help is
highly appreciated
Моя цель - отредактировать этот файл в формате, где начинаются элементыв одной и той же позиции между строками, например:
hello world this is
an example file
is there a good
way to clean this
your help is
highly appreciated
Число пробелов является произвольным.Я предпочитаю, чтобы строки, начинающиеся с пробела, пропускали первый элемент, но это не является строгим.
Я считаю, что есть много способов сделать это, мой порядок предпочтений:
- В vim с некоторыми хитростями
- По команде bash
- В текстовом редакторе с такой функциональностью
- По языку сценариев (возможно, python)
Поскольку это часть процесса подготовки / проверки данных, мне не нужен идеальный метод;Я все-таки проведу ручную проверку.Я ищу способ, который делает, скажем, от 80 до 90% работы.
Может кто-нибудь предложить эффективный подход?
Если это полезно, файл примера здесь .