Существует продукт от Basis Technologies под названием Rosette Language Platform, который выполняет автоопределение языков, на которые вы можете посмотреть.
Solr поддерживает JSON для результатов (и индексации ???), если это ключевой механизм интеграции. Я бы поставил поддержку «JSON» чуть ниже в списке вещей, по которым нужно составить оценочную карту, и сосредоточился бы на том, насколько релевантными будут результаты от поисковой системы X для моего домена.