Я хочу просмотреть весь доступный исходный код Java (или любого другого языка) в данном проекте и:
- настроить статистическое распределение перестановок ключевых слов и их отношений
- выделить повторяющиеся последовательности символов, конструкций (шаблонов) из него.
Какой набор инструментов вы бы мне порекомендовали?
Например:
Я хочу, чтобы он мог выбрать:
* ( * ) {
*
}
из
public static void main ( String[] args ) {
System.err.println( "Specific Text" );
}
или
\n;
из
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );
System.err.println( "Specific Text" );