Мощи найдены между 2 регионами - PullRequest
0 голосов
/ 22 ноября 2018

Я пытаюсь использовать LASSO для предсказания женских геномов.Я построил гистограмму высоты.Результат показывает, как показано ниже.enter image description here

Регрессия требует, чтобы данные были нормальными.Форма гистограммы выглядит как нормальное распределение, если эти впадины между двумя пиками не такие глубокие.Мне интересно, что вызывает это.Не имеет смысла, что частота высоты между 164 и 165 равна 100, а частота высоты между 165 и 166 меньше 40, но частота высоты между 168 и 169 возвращается почти к 100. Указывает ли это на то, что нам нужно больше данных?или есть какие-то вероятные причины этого?Есть ли хорошие методы, которые могут сделать этот набор данных более нормальным?Любая помощь приветствуется.

...