Как зациклить на ExampleSets в Rapidminer? - PullRequest
0 голосов
/ 08 июля 2019

Я пытаюсь извлечь данные из PDF без данных в таблицах.

  • Я использовал «Read PDF Table», которая извлекает каждую таблицу из pdf как один ExampleSet. Таким образом, вывод представляет собой набор объектов ioo ExampleSets.
  • Я пытался использовать разные операторы "Loop" для извлечения текста из этой коллекции объектов ioo (из вышеприведенного шага), но, похоже, операторы извлекают только ПЕРВЫЙ ExampleSet в коллекции объектов ioo.

Может кто-нибудь подсказать, как перебрать ВСЕ ExampleSets в коллекции объектов ioo?

Примечание. Поскольку все ExampleSets относятся к разным типам, я не могу добавить или присоединить их.

1 Ответ

3 голосов
/ 09 июля 2019

Специфично для вашего вопроса: Используйте оператор «Append (Superset)» из «Расширения панели инструментов оператора». Это позволяет вам добавлять ExampleSets, даже если есть новые атрибуты или атрибуты имеют другой тип значения.

В целом, касательно зацикливания на коллекции: Оператором по вашему выбору будет «Loop Collection». Операторы внутри этого вложенного оператора применяются к каждому ExampleSet в коллекции, и выходные данные снова являются коллекцией ExampleSets.

Happy Mining, Эдин

P.S .: Вы уже проверили сайт сообщества RapidMiner (https://community.rapidminer.com)? Может быть, вы можете найти возможные будущие вопросы, на которые уже есть ответы?

...