Если каждая строка начинается со времени, объединить строки и затем отсортировать несложно.Я пытаюсь объединить десятилетия логов чата, которые в противном случае представляют собой простой текст, разделенный в начале и в конце метками времени.Каждый файл имеет несколько из этих разделов.
Session Start (Bob): Sun Nov 30 19:33:38 2003
Bob: hey what's up?
Michael: oh nothing
Session Close (Bob): Mon Dec 1 02:22:18 2003
Session Start (Bob): Thu Dec 4 09:33:38 2003
Michael: long time no hear
Session Close (Bob): Thu Dec 4 13:22:18 2003
Существует несколько файлов для каждого человека, представляющих перекрывающиеся блоки времени.Если у одного файла есть сессии в ноябре и январе, у другого могут быть сессии в декабре и феврале.Я хотел бы объединить их все в один хронологический файл.
Еще больше усложняет то, что иногда нет закрытия сеанса из-за сбоя, а вместо этого просто еще один запуск сеанса.Предполагается, что закрытие сеанса произошло непосредственно перед этим.Если есть двусмысленность или совпадение, сценарий не должен объединять блоки.
Открыт для решений на любом языке или в среде командной строки.