В Java есть класс BreakItterator, который позволяет мне передавать абзац текста на любом языке (язык, на котором он написан, известен), и он разбивает текст на отдельные предложения. Волшебство заключается в том, что он может принимать в качестве аргумента локаль языка, на котором написан текст, и он будет разбивать текст в соответствии с правилами этих языков (если вы посмотрите на него, на самом деле это очень сложная проблема даже на английском языке - этоконечно, это не случай «деления на полные остановки / периоды»).
Кто-нибудь знает, как бы я сделал это в эликсире? Я ничего не могу найти в поиске Google.
Я почти на пороге развертывания очень тонкого общедоступного API, который выполняет только ту базовую задачу, к которой я могу обратиться из эликсира - но это действительно нежелательно.
Любая помощь будет очень признательна.