Хотя я не вижу другого пути, кроме как догадываться, я бы сказал об этом примерно так:
Я бы уменьшил то, что я знаю, я могу надежно разобрать. Оставив тебя с ABE WOMAN IN THE DUNES (INT'L ED) 1st 64 RANDOM
Оттуда я бы попытался найти издание и разделить строку на две части в этой позиции после сохранения и удаления издания, оставив вам ABE WOMAN IN THE DUNES (INT'L ED)
& 64 RANDOM
, другой вариант - попытаться указать год, но, конечно же, заголовки. например, 1984 может представлять проблему. (Гадание, конечно, предполагает, что оно будет 7-м, 51-м и т. Д. Для всех выпусков).
Наконец, я бы предположил, что смогу достаточно надежно угадать год 64
в начале второй строки и еще больше ограничить часть Publisher (/ Comment).
Все остальное - просто догадки, если у вас нет списка авторов / издателей, с которым можно было бы сравнивать, поскольку я предполагаю, что есть не только комментарии с пробелами, но и издатели с пробелами в их именах. Но по крайней мере у вас должно быть до 2 строк, содержащих Автор / Заголовок в одном и Издатель (/ Комментарии) в другом.
В целом, это должно немного ограничить ручную часть.
Как только я это сделаю, я также сохраню его в лучшем формате где-нибудь, чтобы мне больше не приходилось анализировать его;)