Надеюсь, вы мне поможете:).
Я работаю в переводческой компании.
Как вы знаете, каждый перевод состоит в том, чтобы разбить оригинальный текст на небольшие сегменты и затем снова объединить их в конечный продукт.
Другими словами, сегменты рассматриваются как " единицы перевода".
Часто, особенно для больших документов, переводчики допускают некоторые ошибки c непротиворечивости, я пытаюсь объяснить это на примере.
В испанском sh, вы можете использовать «tu» или «usted», в зависимости от контекста, и это определяет тон формальности-неформальности предложения.
Итак, если вы рассмотрите эти два предложения документа:
Lara, te has lavado las manos? (TU)
Lara usted se lavò las manos? (USTED)
Они ОБА правильны, но если вы рассматриваете весь документ, есть несоответствие языковой c.
В свободное время я изучаю основы НЛП c и выясняю, как создать инструмент для анализа лингвистической c согласованности набора предложений.
В частности, я смотрю на Standford CoreNLP (я предпочитаю от Java до Python). Я думаю, что мне нужны некоторые инструменты linguisti c, чтобы в первую очередь выполнить анализ глаголов. И, естественно, инструмент сможет работать с разными языками (EN, IT, ES, FR, PT).
Кто-нибудь может помочь мне разобраться, как начать это?
Буду признателен за любую помощь,
Заранее спасибо!