Сначала скачайте GATE, это как 320 Мб или что-то. Затем, если вы используете NetBeans, вы можете добавить GATE к себе, перейдя в проект -> Библиотека -> щелкните правой кнопкой мыши, добавьте JAR-файлы и перейдите к установочному файлу GATE и выберите все JAR-файлы в папке lib. После того, как все файлы JAR есть, вы можете использовать GATE. (См. Главу GATE.7 GATE Embedded).
Простой пример - использовать ANNIE, есть standAloneAnnie, где вам нужно только передать файл, и он обработает его для вас.
http://gate.ac.uk/wiki/code-repository/src/sheffield/examples/StandAloneAnnie.java
Как только вы добавите ANNIE в свой проект, вы можете использовать его, вызвав его основной метод / вы можете изменить его имя позже и передать массив File в качестве параметра. Массив файла должен содержать файл, который вы хотите обработать.