В зависимости от сложности ваших потребностей, вы можете просто использовать Apache Tika CLI. Тика обрабатывает POI (и другие библиотеки) и возвращает вам XHTML или текстовую версию документа. Если вам нужна простая команда linux, этого может быть достаточно.
В противном случае, это может зависеть от ваших навыков работы с Java. POI должен делать все, что вам нужно, но вам нужно написать немного кода, чтобы получить интересующие вас биты. Для начала ознакомьтесь с кратким руководством .
(я не знаю про xlrd, извините)