Я работаю над одной особенностью, то есть над применением правил языковой сегментации (грамматических) для латинского языка (английский в настоящее время).
В настоящее время я нахожусь в фазе разрыва предложений пользовательского ввода.
e.g.:
"I am working in language translation". "I have used Google MT API for this"
В вышеприведенном примере я разбиваю вышеупомянутое предложение на точку (.) Это нормальные случаи, когда я разбиваю предложение на точку, но существует n символов для разбивания предложения, например (.!? Etc).
У меня есть следующие правила SRX для сегментации.
Вот мой вопрос: -
1) Есть ли какая-либо ссылка? , которую я могу использовать для разрешения моих правил сегментации языка.
2) Или есть ли форумы по языковой сегментации? , чтобы я мог эффективно обсудить
Пожалуйста, дайте мне знать, если кто-нибудь знает об этом?
Большое спасибо.