Как выбрать записи зависят от ПК, чтобы уменьшить размерность в Rapidminer? - PullRequest
0 голосов
/ 16 февраля 2019

Я новичок в Rapidminer, поэтому у меня огромный набор данных, и я использую Принципиальный компонентный анализ, чтобы уменьшить размерность, проблема в том, что когда я получаю ПК, я не знаю, как выбирать записи, зависит от него, как я могу сделатьновый набор данных, который уменьшен?

это то, что я пытаюсь использовать:

и это то, что я получаю:

1 Ответ

0 голосов
/ 19 февраля 2019

Вы можете использовать оператор «Weight by PCA» для вычисления весов для важности атрибута, а затем использовать оператор «Select by Weights», чтобы уменьшить количество атрибутов в исходном наборе данных.

Проверьте прикрепленныепример процесса ниже (просто зафиксируйте XML в окне процесса RapidMiner).Также не стесняйтесь посмотреть или задать вопросы в сообществе RapidMiner

enter image description here

<?xml version="1.0" encoding="UTF-8"?><process version="9.2.000">
<context>
<input/>
<output/>
<macros/>
</context>
<operator activated="true" class="process" compatibility="6.0.002" expanded="true" name="Root" origin="GENERATED_TUTORIAL">
<parameter key="logverbosity" value="init"/>
<parameter key="random_seed" value="2001"/>
<parameter key="send_mail" value="never"/>
<parameter key="notification_email" value=""/>
<parameter key="process_duration_for_mail" value="30"/>
<parameter key="encoding" value="SYSTEM"/>
<process expanded="true">
  <operator activated="true" class="retrieve" compatibility="9.2.000" expanded="true" height="68" name="Sonar" origin="GENERATED_TUTORIAL" width="90" x="112" y="34">
    <parameter key="repository_entry" value="//Samples/data/Sonar"/>
  </operator>
  <operator activated="true" class="weight_by_pca" compatibility="9.2.000" expanded="true" height="82" name="Weight by PCA" width="90" x="313" y="34">
    <parameter key="normalize_weights" value="true"/>
    <parameter key="sort_weights" value="true"/>
    <parameter key="sort_direction" value="ascending"/>
    <parameter key="component_number" value="1"/>
  </operator>
  <operator activated="true" class="select_by_weights" compatibility="9.2.000" expanded="true" height="103" name="Select by Weights" width="90" x="581" y="34">
    <parameter key="weight_relation" value="greater equals"/>
    <parameter key="weight" value="0.5"/>
    <parameter key="k" value="10"/>
    <parameter key="p" value="0.5"/>
    <parameter key="deselect_unknown" value="true"/>
    <parameter key="use_absolute_weights" value="true"/>
  </operator>
  <connect from_op="Sonar" from_port="output" to_op="Weight by PCA" to_port="example set"/>
  <connect from_op="Weight by PCA" from_port="weights" to_op="Select by Weights" to_port="weights"/>
  <connect from_op="Weight by PCA" from_port="example set" to_op="Select by Weights" to_port="example set input"/>
  <connect from_op="Select by Weights" from_port="example set output" to_port="result 1"/>
  <portSpacing port="source_input 1" spacing="0"/>
  <portSpacing port="sink_result 1" spacing="0"/>
  <portSpacing port="sink_result 2" spacing="162"/>
</process>
</operator>
</process>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...