В зависимости от того, какие именно нарушения в жизни вы хотите найти или исправить, эта проблема радикально отличается.
Вот ваш пример с реальным текстом:
1. Lazarus Long, Get the first shot off fast.
2. Hiro Protagonist, Greatest swordfighter[sic] in the world.
3. Alice , Down the rabbit hole.
5. Orem, Sink of power.
В этом примере ошибки можно исправить с помощью приличного текстового редактора с функцией find replace. Текстовые редакторы и шестнадцатеричные редакторы могут творить чудеса, если вы проявляете творческий подход с подстановочными знаками. Проблема остается простой, пока существуют ваши факторы разграничения (. Или,). Как вы, наверное, уже знаете; как только один из них отсутствует, проблема становится гораздо более сложной.
Пример сложной проблемы:
1. Lazarus Long, Get the first shot off fast.
2. Hiro Protagonist Greatest swordfighter[sic] in the world.
3. Alice , Down the rabbit hole.
5 . Orem, , Sink of power.
Я бы, вероятно, атаковал это в несколько шагов.
1. Уберите лишние места.
2. Узнайте ключевые статистические данные, такие как количество разделителей в строке и среднее количество слов или символов в столбце с разделителями. Большинство имен состоят из одного или двух слов, комментарии неизвестны или ограничены вводом.
3. Найдите строки со статистически невероятным количеством ключевых особенностей.
4. Постарайтесь их исправить.
Я понимаю, что это не решает вашу проблему напрямую, но, возможно, одна идея может немного исправить вашу проблему. Вполне возможно, что прошедшие райты никогда не создавали никаких проектов.