Выполнение l oop множественной линейной регрессии на данных Epigeneti c в R - PullRequest
0 голосов
/ 29 марта 2020

Я работаю над данными массива метилирования как значения эпигенетии c метилирования (бета). данные изначально были матричными данными, но я преобразовал их во фрейм данных. столбцы данных матрицы представляют 450 тыс. сайтов метилирования (CpG-сайты). Я объединил в этот фрейм данных независимые переменные, которые я хочу проверить их связь с каждым сайтом метилирования 450k сайтов метилирования. Для всех этих переменных (столбцов) у меня есть измерения метилирования в виде значений бета в диапазоне от 0 до 1 для 440 образцов, взятых у 440 участников.

Я хочу провести регрессионный анализ, чтобы проверить влияние независимой переменной (высокий / средний / низкий белок в рационе) (один из столбцов) на каждом отдельном сайте метилирования 450k сайтов, иными словами, я хочу провести регрессионный анализ 450 раз, как каждый сайт метилирования, как результат, чтобы увидеть эффект протиена (высокий / средний / низкий белок) в рационе на метилирование. я хочу получить только значимые результаты ассоциаций на каждом уровне из всех 450k регрессий, запущенных в виде итогов или манхэттенского графика.

Я думаю, что функция lapply может сделать это, но я не не знает, как написать код и как указать столбцы, которые являются выходной переменной, и столбец, которые являются независимыми переменными. также я не знаю, как отфильтровать значимые результаты трехуровневой белковой диеты (низкая диета является эталонной).

Я знаю, что в пакете «limma »есть что-то, но это было очень сложный, и я немного новичок в R.

примечание: данные метилирования нормализованы и проверены на качество.

Спасибо за вашу помощь.

лучше всего.

...