Я получаю текст из документа, используя
var doc = context.document;
var originalRange = doc.body;
originalRange.load("text");
return context.sync()
.then(function () {
// have some fun with the text
}
Затем я отправляю текст на сервер в формате UTF-8.Но линия обрывается () в пробегах не разрешаются.Они отправляются в виде пустых квадратных символов (□) и возвращаются в виде черных алмазных вопросительных знаков (�).
<w:p w:rsidR="00A739D5" w:rsidRDefault="00A739D5" w:rsidP="00A739D5">
<w:pPr>
<w:rPr>
<w:rFonts w:asciiTheme="minorHAnsi" w:hAnsiTheme="minorHAnsi" w:cs="Calibri"/>
</w:rPr>
</w:pPr>
<w:r>
<w:rPr>
<w:rFonts w:asciiTheme="minorHAnsi" w:hAnsiTheme="minorHAnsi" w:cs="Calibri"/>
</w:rPr>
<w:br/>
</w:r>
<w:r>
<w:rPr>
<w:rFonts w:asciiTheme="minorHAnsi" w:hAnsiTheme="minorHAnsi" w:cs="Calibri"/>
</w:rPr>
<w:br/>
<w:t xml:space="preserve">Under "Default Web Site" you </w:t>
</w:r>
</w:p>
Когда я смотрю на то, что отправляется, я вижу ...
"□□ Под" Веб-сайтом по умолчанию "вы"
Когда я смотрю на то, что возвращается, я вижу ...
"“По« Веб-сайту по умолчанию »вы"
Когда я ищу текст, неудивительно, что я получаю 0 результатов.
searchResults = context.document.body.search(myText, { matchCase: true, ignorePunct: true, ignoreSpace:true});
Это связано с атрибутами rFonts w: asciiTheme = "minorHAnsi" и w: hAnsiTheme = "minorHAnsi"?
Если так, что я могу сделать, чтобы правильно разрешить эти символы?Нужно ли сначала определить стили, используемые в документе, а затем преобразовать текст диапазона перед отправкой на сервер?