из списка с неуместными словами к списку с подходящими словами - PullRequest
0 голосов
/ 13 марта 2019

Я просто начинающий в Python.Что я делаю неправильно?Я сравниваю два списка друг с другом, и когда я нахожу подходящие слова, я хочу добавить его в другой список.Приведенный ниже код просто добавляет все в список :( Конечно, я мог бы сделать из этих двух списков набор (), но потом он перепутался с порядком слов. Заранее спасибо! Оба списка вроде как. Я мог бы использовать удалить (элемент), но этотакже не дает удовлетворительного решения.

irreleventWords = []
irreleventWords = open("irreleventWords.txt").read().split("\n")
print(irreleventWords)
materialList = []
for filename in glob.glob("./rijopdrachten/"+"*.*"):
    box_extraction(filename, "./Cropped/")
    os.remove("./Cropped/"+"1.png")#not needed creates a full image of itself
    os.remove("./Cropped/"+"2.png")#not needed is a image with only one table
    for images in glob.glob("./Cropped/"+"*.*"):
        text = pytesseract.image_to_string(images, config=config)
        if "Datum" in text:
            list1 = re.split(r'[`\=~!@#$%^&*()_+\[\]{};\'\\"|<,./<>?]',text)
            list1 = list(filter(None, list1))
            list1 = "\n".join(list1)
            list1 = list1.split("\n")
            list1 = list(filter(None, list1))
            print("list1")
            print(list1)
            for item in [list1]:
                if item not in [irreleventWords]:
                    print("item wordt toegevoegd: ")
                    materialList.extend(item)                    
                else:
                    continue
            os.remove(images)
        else:
            os.remove(images)

    print(filename)
#materialList = "\n".join(materialList)
#materialList = materialList.split("\n")
materialList = list(filter(None, materialList))
print("materialList:")    
print(materialList)
...