Microsoft Translator Text API ломает нон-переводные промежутки - PullRequest
0 голосов
/ 02 мая 2018

Я использую Microsoft Translator Text API для перевода некоторых предложений. Мои предложения содержат некоторые части текста, которые мне не нужны для перевода.

Для этого я использую <span class="notranslate"></span>, оборачивая непереводимый текст. Это работает хорошо в большинстве случаев, в некоторых случаях MT API нарушает этот диапазон.

Примеры (Ввод -> Вывод):

  • some <span class="notranslate">1</span> text -> деякий 1 текст

  • some <span class="notranslate">1</span> another text -> деякий <span class="notranslate">1 інший </span> текст

Хороший пример:

  • some <span class="notranslate">1</span> text -> деякий <span class="notranslate">1</span> текст

Я не наблюдаю никаких закономерностей, это происходит случайно. Может я что то пропустил?

UPD:

Я пытался отправить заголовки Content-Type: text/xml или Content-Type: text/html - один и тот же результат в обоих случаях: двигатель ломает некоторые промежутки.

1 Ответ

0 голосов
/ 04 мая 2018

Я нашел решение.

Документация Microsoft Translator API 3.0 рекомендует использовать <div class="notranslate"></div> вместо <span class="notranslate"></span>.

Я использую версию API 2, но, похоже, после изменения оболочки на <div> MT API прекратил ломать мои notranslate оболочки.

...