Давайте предположим, что есть файл, который выглядит следующим образом:
xxxx aa whatever
yyyy bb whatever
zzzz aa whatever
Я хотел бы разбить его на 2 файла, содержащие:
first:
xxxx aa whatever
zzzz aa whatever
second:
yyyy bb whatever
Т.е. я хочу сгруппировать строки на основе некоторого значения в строках (правило может быть: 2-е слово, разделенное пробелами), но не переупорядочивать строки в группах.
Конечно, я могу написать программу для этого, но мне интересно, есть ли какой-нибудь готовый инструмент, который может сделать что-то подобное?
Извините, я не упомянул об этом, так какПредполагается, что это довольно очевидно - количество различных «слов» огромно.речь идет как минимум о 10000 из них.Т.е. любое решение, основанное на перечислении слов перед рукой, не будет работать.
А также - я бы не хотел многопроходного разбиения - рассматриваемые файлы обычно довольно большие.