Категория, которую я удалил, все еще отображается в некоторых вычислениях, но как NA в R - PullRequest
0 голосов
/ 29 февраля 2020

Мой оригинальный вопрос (решение в конце)

Я удалил указанные c строки из моих метаданных, которых не было в моем файле альфа-разнесения в R. Это два из моих фреймов данных. Затем я объединил их, используя слияние и столбец, которым они поделились, который был идентификатором. Однако, что странно, так это то, что одна из категорий для одной из переменных (вода как категория в переменной, называемой видами), все еще отображается в блокпосту (но пусто) или в среднем (но как NA). Я дважды проверил мой файл, и все образцы воды были удалены. Может кто-нибудь помочь мне разобраться в проблеме?

Удаление лишних строк из моих метаданных

metadata<-read.delim2("../../metadata/20190304-sample-metadata-v3v4.txt") colnames(metadata)[1]<- "SampleID" # Change the first column name metadata <- metadata[-c(21:23,25, 36), ]

Файл альфа-разнесения

shannon = read.table("shannon_vector_nNC/alpha-diversity.tsv", header = T) shannon <- tibble::rownames_to_column(shannon, "SampleID") # Преобразовать имена строк в столбец shannon<-merge(shannon, metadata, by="SampleID") # Объединить этот файл с файлом метаданных

Рассчитать средние значения для каждого вида

tapply(shannon$shannon, shannon$Species, mean)

Виды1 Виды2 Виды3 Виды4 Вода 2.667927 3.270748 3.473404 3.333535 NA

Обновление

Я выяснил, в чем проблема. Проблема состояла в том, что категории были удалены, но уровни Видов фактора все еще были там. Я исправил это, используя следующий код:

Удалить дополнительный уровень

shannon$Species <- droplevels(shannon$Species) 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...