У меня есть небольшой фрагмент кода, который принимает входную строку, выполняет часть очистки (удаляет специальные символы, такие как '' \ и заменяет любые другие символы пробелом), а затем генерирует новую строку.
public class Example
{
public static void main(String... args)
{
charFilter("I.T rocks. It's time to get a job.Come on");
}
public static String charFilter(String inText) {
String outText="";
inText = inText.replaceAll("['’\\.]", "");
outText = inText.replaceAll("[^a-zA-Z0-9- ]", " ");
System.out.println(outText);
return outText;
}
}
Вывод вышеприведенного кода выглядит так: «IT-время пришло пора найти работу». Но мне нужно получить вывод, что «ИТ тянет время найти работу Давай» (работа и приход должны отображаться как отдельные слова, а ИТ должны отображаться как ИТ), потому что мы можем ожидать, что пользователь, вводящий данные, забудет добавить пробел после полной остановки.
Может ли кто-нибудь подсказать мне, какой подход мне нужен?