Очистить данные значения поля из PDF с помощью UIPath - PullRequest
0 голосов
/ 06 июня 2019

Я хочу собрать данные из «формы w2» (pdf), чтобы я мог использовать их для сохранения в базе данных, но не смог получить полевые данные.

  1. Я попытался « Читать PDF-текст », который читает весь документ, выбирает весь текст, но я хочу найти значения в поле, например,

    Номер социального страхования сотрудника => 1234 56 7890

    Идентификационный номер работодателя => 11-22334455

  2. Я пытался « Очистка экрана », « Очистка данных », но не смог получить какой-либо конкретный элемент.

  3. Я попытался выполнить действие « Anchorbase » с «Найти изображение» и «Получить текст», но не смог выбрать конкретный элемент.

Пожалуйста, ознакомьтесь с приложенным документом в формате PDF.

W2 Форма pdf

Любая помощь будет оценена.

Спасибо.

1 Ответ

0 голосов
/ 06 июня 2019

Это полностью читаемый файл .pdf, поэтому это не должно быть проблемой для достижения этой цели. Вы должны прочитать текст документа и затем использовать Regex, чтобы найти то, что вы хотите. Номер социального страхования или идентификационный номер являются довольно структурированными данными, поэтому вы можете легко составить регулярное выражение. https://regex101.com/ может быть полезным для этого.

Вы должны:

  1. Используйте операцию «Чтение PDF-текста» для получения текста .pdf,
  2. Назначить действие, создать новую переменную типа System.Text.RegularExpressions.Match
  3. Импортировать пространство имен: System.Text.RegularExpressions
  4. Справа от назначения использования: Regex.Match(readedText, "\d{2}-\d{8}") в кавычках есть регулярное выражение для идентификационного номера работодателя,
  5. Если UiPath показывает, что 'Regex' не объявлено, сохраните рабочий процесс, закройте его, снова откройте, снова импортируйте пространство имен, удалите действие назначения и снова создайте его.
  6. Вот и все, таким же образом вы можете найти второе число.

редактировать. example.xaml

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...