C # Найден неизвестный текст - PullRequest
0 голосов
/ 27 октября 2011

Я создаю программу для переноса текста из текстового документа в базу данных. Во время некоторого тестирования я наткнулся на некоторый текст внутри текстового поля после установки его текста в диапазон ячейки таблицы следующим образом:

textBox1.Text = oDoc.Tables[1].Cell(1, 3).Range.Text;

В форме появилось:

enter image description here

Чего не ожидалось, так это точки в конце текста, и я понятия не имею, что она должна представлять. Точка может быть выделена, но если вы попытаетесь скопировать и вставить ее, ничего не появится. Вы можете удалить точку вручную. Может кто-нибудь помочь мне определить, что это такое?

1 Ответ

2 голосов
/ 27 октября 2011

Идентификационный бит не должен быть слишком сложным:

string text = oDoc.Tables[1].Cell(1, 3).Range.Text;
textBox1.Text = ((int) text[4]).ToString("x4");

Это даст вам кодовую единицу Unicode UTF-16 для этого символа ... затем вы можете узнать, что это за Веб-сайт Unicode .(Я обычно смотрю на страницу Графики или каталог PDF-файлов и думаю, в каком графике она будет основана на нумерации - это не идеальный вариант, и, возможно, есть лучшие способы, ноэто всегда работало достаточно хорошо для меня ...)

Конечно, когда вы определили это, вам все равно нужно будет разобраться, какого черта он там делает ... у оригинального документа Word просто есть "HOLD "?

...