Набор данных 1: golub.txt
, содержащий значения экспрессии 3051 гена (строки) от 38 больных лейкемией (столбцы). Двадцать семь пациентов (столбцы с 1 по 27) диагностированы как острый лимфобластный c лейкоз (ОЛЛ) и одиннадцать (столбцы 28-38) как острый миелоидный лейкоз (ОМЛ). Класс опухоли ALL равен 0 (отрицательный), тогда как класс опухоли AML равен 1 (положительный результат). Имена генов собраны в golub.gnames.txt
, где столбцы соответствуют индексу гена, ID и имени, соответственно. Строки генов в golub.gnames
соответствуют строкам в golub.txt
. Важный ген CD33 является одним из исследованных генов. Его значения выражения находятся в строке 808 данных golub
. Предполагается, что исследована нормальность значений экспрессии ALL и AML. Проверьте равенство средних с помощью соответствующего теста. Сформулируйте нулевую гипотезу, p-значение и свой вывод.
Здравствуйте, в настоящее время я застрял даже в том, чтобы задать этот вопрос. Как указано в тексте выше, два файла соответствуют друг другу с точки зрения значений экспрессии гена, а также его индекса гена, идентификатора и имени. Я прочитал два файла .txt
с read.table()
, но я не совсем уверен, что делать после этого с точки зрения объединения обоих файлов в один?
* 1013 начать! Спасибо!