Почему мой оператор if не работает для длины> 1? - PullRequest
0 голосов
/ 08 апреля 2019
associationRules.csv = #I'm only displaying some lines here for my case
,antecedents,consequents,confidence
19,"(LM = 20, SMOK = y)",(DIAB = n),0.5   
20,(LM = 20),"(DIAB = n, SMOK = y)",0.5
21,"(DIAB = n, RCA = 85, LM = 15)",(SMOK = y),1.0
175,(RCA = 85),(LAD = 40),0.6666666666666667
176,(LAD = 40),(RCA = 85),1.0
177,"(DIAB = y, CHOL = 200, SMOK = y)",(LAD = 90),0.6666666666666667
178,"(DIAB = y, CHOL = 200, LAD = 90)",(SMOK = y),1.0 
200,(LM = 20),"(RCA = 75, DIAB = n)",0.5
203,"(SEX = F, DIAB = y, SMOK = y)",(LM = 20),1.0
239,(CHOL = 200),"(DIAB = y, SMOK = y)",1.0

Я перебираю строки правил ассоциации и хотел бы извлечь только строки, если: столбец "antecedent" имеет наборы данных, принадлежащие только к g1 или g2. и не принадлежит вам. Это означает, что следует извлечь только строки (175, 176, 203).

y = ['CHOL = 200', 'LM = 20', 'LM = 25', 'LM = 30', 'LM = 15', 'LM = 35' ]

#g1 and g2 are the rest of other values of antecedents s.a: DIAB, RCA, LAD..etc 

Мой код работает, только если len (antecedents) == 1, и не работает, когда len (antecedents)> 1.

antecedents_list = []

for i, row in associationRules.iterrows():
    antecedents = row.iloc[0]

    flag1 = False
    flag2 = False
    single_antecedent = False

    for j, v in enumerate(antecedents): 

        if len(antecedents) == 1 and (v not in y): #print single items
            single_antecedent = True

        elif len(antecedents) > 1 and (v not in y):
            if v in g1:
                flag1 = True
            if v in g2:
                flag2 = True


    if single_antecedent or (flag1 and flag2):
     antecedents_list.append(antecedents)
     rules['antecedents'] = antecedents_list

Что я делаю не так? Может ли кто-нибудь помочь

1 Ответ

1 голос
/ 08 апреля 2019

Если вы имеете в виду belongs to g1 or g2 only и DOES NOT belong to y, а g1 g2 - остальные остальные значения из y. Я думаю, что вы можете просто проверить, есть ли какой-либо элемент, принадлежащий y. Если ответ «нет», вам нужен столбец, например (175, 176, 203).

Кроме того, я думаю, условие len(antecedents) == 1 здесь не является необходимым. Вы можете попробовать это:

antecedents_list = []

for i, row in associationRules.iterrows():
    antecedents = row.iloc[0]

    flag = True
    for v in antecedents:
        # belong to y, break out
        if v in y:
            flag = False
            break

    # or more pythonic way
    # flag = all(v not in y for v in antecedents)

    if flag:
        antecedents_list.append(antecedents)
        rules['antecedents'] = antecedents_list

Не могу отладить себя, можно попробовать.


если вы настаиваете на своей версии кода, я могу сказать, где это не так:

if single_antecedent or (flag1 and flag2):

здесь должно измениться на flag1 or flag2

Надеюсь, что это поможет вам, и прокомментируйте, если у вас есть дополнительные вопросы. :)

...