Я был очень впечатлен системой OpenCalais. Это (есть / имеет) веб-служба, куда вы отправляете ваш текст, они анализируют его, а затем вам предоставляется серия категоризованных (с поддержкой RDF) тегов, к которым относится ваш документ.
Но - на данный момент - единственный поддерживаемый язык - английский.
Вам известны подобные системы, которые обрабатывают многоязычные документы? (Мне интересен итальянский, но многоязычность, конечно, плюс)