Проверка кластера с помощью R: концептуальная, а также практическая проблема - PullRequest
0 голосов
/ 08 апреля 2020

У меня проблема с выяснением, может ли R помочь мне с моей работой. Я хочу начать с того, что я новичок в этом мире, я недавно начал писать команды и вообще использую эти системы. Я здесь, чтобы узнать, почему я хочу добавить эти навыки и связать свою степень в области медицинской химии с этими навыками (и, возможно, даже иметь возможность работать в областях, связанных с вычислительной химией). Так что любые советы, даже просто ссылающиеся на прочтение других работ, будут приветствоваться в отношении продолжения этой жизненной миссии!

У меня был начальный файл, который содержал эту информацию:


ИМЯ ИМЯ_два столбца1 столбец2 столбец3 до столбца10 и, наконец, КЛАСС Aa aae 5 3 4 3 3 0 5 1 2 4 ДА Ab и 11 3 5 6 4 5 5 2 3 2 НЕ A c acd 9 4 4 2 7 5 5 3 6 1 NOT Ad aaqff 0 2 0 1 0 2 1 1 0 YES Ae ewg 1 0 2 1 1 0 4 1 0 0 NOT Af wegv 10 5 9 5 6 0 3 2 3 7 NOT Ag rwg 10 5 10 6 5 0 3 1 4 4 NOT Ah wfq 1 0 2 0 1 0 2 1 1 0 NOT Ai he 1 0 2 2 2 0 4 1 0 0 NOT Al efgwa 0 0 1 0 1 0 1 0 1 0 NOT Am h4h 0 0 3 1 1 0 1 0 1 0 NOT


Таким образом, имеется 10 столбцов с переменными номерами (от 0 и далее) и в конце имя класса (это два класса: YES или NOT). Изученных таким образом элементов около 17 000. С SOMbrero я создал кластеры. На этом этапе я хотел бы посмотреть, имеют ли смысл эти созданные кластеры, были ли они выполнены хорошо, или если бы даже те же самые кластеры могли быть созданы случайно.

Так что я здесь с вопросом: могу ли я сделать этот тип анализа с R? Есть ли способ понять, оценить эти кластеры и понять, кто работал лучше, а кто хуже? Я видел, что есть пакет clValid, который может быть полезен для меня: в частности, функции BSI или индекс Дэвиса Болдина. Но я не понимал, как я могу использовать их в моем случае, я не знаю, как написать этот анализ на R. И прежде всего, если эти анализы действительно служат для выполнения того, что я хочу.

Спасибо за Ваше внимание и для тех, кто может мне помочь. С уважением Франческо Коппола

...