Учитывая, что орфография, грамматика и наборы символов английского и русского языков существенно различаются, любой стеммер, который попытался сделать оба, был бы либо массивно большим, либо плохо работоспособным (скорее всего, оба).
Вероятно, было бы намного лучше использовать стеммер для каждого языка и выбирать, какой из них использовать, основываясь на подсказках пользовательского интерфейса (какой язык используется для запроса) или путем явного выбора.
Сказав это, маловероятно, что какой-либо русский текст будет соответствовать поисковому запросу на английском языке правильно или наоборот.
Это похоже на случай, когда немного больше бизнес-анализа помогло бы больше, чем код.