Я учусь JBoss Drools , и я играю с генетическими данными из проекта hapmap: (http://hapmap.ncbi.nlm.nih.gov/genotypes/latest/forward/non-redundant/).Каждый файл в этом каталоге представляет собой таблицу с индивидуумами вверху, позициями в геноме слева и наблюдаемыми мутациями для каждого индивидуума /position.
Здесь я хотел бы найти некоторые потенциальные ошибки в файле (например, у детей нет мутаций от его родителей) с помощью Drools.
1) Я хочу загрузитьэти данные в слюни.Это может быть большой объем данных (например, genotypes_chr2_YRI_r27_nr.b36_fwd.txt.gz - 20Mo gzip) Будут ли эти данные храниться в памяти?или Drools хранит его где-нибудь?или я должен использовать систему персистентности?
2) о модели:
Я думал о включении следующих классов в StatefulKnowledgeSession :
class Individual
{
private String name;
//constructor, getters, setters etc...
}
class Position
{
private String name;
private String chromosome;
private int position;
//constructor, getters, setters etc...
}
class ObservedMutation
{
private String individualName;
private String positionName;
private String observed;
//constructor, getters, setters etc...
}
или ObservedMutation должно быть:
class ObservedMutation
{
private Individual individual;
private Position position;
private String observed;
//constructor, getters, setters etc...
}
спасибо за ваши предложения
Пьер
обновление : мой первый тест: http://plindenbaum.blogspot.com/2010/07/rules-engine-for-bioinformatics-playing.html