Как удалить избыточные кортежи в данных микрочипов с помощью Java-программирования? - PullRequest
0 голосов
/ 12 января 2010

Как я могу удалить избыточные кортежи из существующего набора данных в программном обеспечении для интеллектуального анализа данных WEKA-A для MICROARRAY DATA? Код для удаления избыточности должен быть в JAVA.

т.е. набор данных содержит такие данные, как

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0
H,A,X,1,3,1,1,1,1,1,0,0,0

здесь кортежи 1,4,5 являются избыточными.

Код должен возвращать следующий набор данных REDUNDANCY REMOVED ...

H,A,X,1,3,1,1,1,1,1,0,0,0
D,R,O,1,3,1,1,2,1,1,0,0,0
C,S,O,1,3,1,1,2,1,1,0,0,0

1 Ответ

2 голосов
/ 12 января 2010

Вы можете использовать один из классов, который реализует Set , такой как java.util.HashSet .

Вы можете загрузить свой набор данных в набор, а затем извлечь их либо путем преобразования в массив с помощью метода Set.toArray (), либо путем перебора набора.

Set<Tuple> tupleSet = new HashSet<Tuple>();

      
for (Tuple tuple: tupleList) {    
    tupleSet.add(tuple);    
}  

// now all of your tuples are unique  
for (Tuple tuple: tupleSet) {    
    System.out.println("tuple: " + tuple);  
}  
...