Question

Я пытаюсь найти соответствующие ключи в двух разных словарях. Каждый имеет около 600 тыс. Записей.

Скажите, например:

    myRDP = { 'Actinobacter': 'GATCGA...TCA', 'subtilus sp.': 'ATCGATT...ACT' }
    myNames = { 'Actinobacter': '8924342' }

Я хочу распечатать значение Actinobacter (8924342), поскольку оно соответствует значению в myRDP.

Следующий код работает, но очень медленно:

    for key in myRDP:
        for jey in myNames:
            if key == jey:
                print key, myNames[key]

Я пробовал следующее, но это всегда приводит к ключевой ошибке:

    for key in myRDP:
        print myNames[key]

Возможно, для этого в C реализована функция? Я гуглил, но ничего не получается.

Спасибо.

John Fouhy · Answer 1 · 23 августа 2009

Вы можете сделать это:

for key in myRDP:
    if key in myNames:
        print key, myNames[key]

Ваша первая попытка была медленной, потому что вы сравнивали каждый ключ в myRDP с каждый ключ в myNames. В алгоритмическом жаргоне, если myRDP имеет n элементов, а myNames имеет m элементов, тогда этот алгоритм будет принимать O ( n × m ) операции. Для 600 тыс. Элементов каждый это 360 000 000 000 сравнений!

Но проверка того, является ли тот или иной элемент ключом словаря, выполняется быстро - фактически это одна из определяющих характеристик словарей. В алгоритмическом смысле тест key in dict равен O (1) или постоянному времени. Таким образом, мой алгоритм займет время O ( n ), что составляет 60000 тысячных.

RichieHindle · Answer 2 · 23 августа 2009

Используйте наборы, потому что они имеют встроенный метод intersection, который должен быть быстрым:

myRDP = { 'Actinobacter': 'GATCGA...TCA', 'subtilus sp.': 'ATCGATT...ACT' }
myNames = { 'Actinobacter': '8924342' }

rdpSet = set(myRDP)
namesSet = set(myNames)

for name in rdpSet.intersection(namesSet):
    print name, myNames[name]

# Prints: Actinobacter 8924342

Andrew Keeton · Answer 3 · 23 августа 2009

for key in myRDP:
    name = myNames.get(key, None)
    if name:
        print key, name

dict.get возвращает заданное вами значение по умолчанию (в данном случае None), если ключ не существует.

Roberto Bonvallet · Answer 4 · 23 августа 2009

Вы можете начать с поиска общих ключей, а затем перебирать их. Операции над множествами должны быть быстрыми, потому что они реализованы на C, по крайней мере, в современных версиях Python.

common_keys = set(myRDP).intersection(myNames)
for key in common_keys:
    print key, myNames[key]

João Silva · Answer 5 · 23 августа 2009

Вместо этого используйте метод get:

 for key in myRDP:
    value = myNames.get(key)
    if value != None:
      print key, "=", value

vikas0713 · Answer 6 · 31 мая 2019

Лучшим и простым способом было бы просто выполнить обычные операции над множествами (Python 3).

a = {"a": 1, "b":2, "c":3, "d":4}
b = {"t1": 1, "b":2, "e":5, "c":3}
res = a.items() & b.items() # {('b', 2), ('c', 3)} For common Key and Value
res = {i[0]:i[1] for i in res}  # In dict format
common_keys = a.keys() & b.keys()  # {'b', 'c'}

Ура! * * 1004

hughdbrown · Answer 7 · 23 августа 2009

Вот мой код для выполнения пересечений, объединений, различий и других операций над множествами в словарях:

class DictDiffer(object):
    """
    Calculate the difference between two dictionaries as:
    (1) items added
    (2) items removed
    (3) keys same in both but changed values
    (4) keys same in both and unchanged values
    """
    def __init__(self, current_dict, past_dict):
        self.current_dict, self.past_dict = current_dict, past_dict
        self.set_current, self.set_past = set(current_dict.keys()), set(past_dict.keys())
        self.intersect = self.set_current.intersection(self.set_past)
    def added(self):
        return self.set_current - self.intersect 
    def removed(self):
        return self.set_past - self.intersect 
    def changed(self):
        return set(o for o in self.intersect if self.past_dict[o] != self.current_dict[o])
    def unchanged(self):
        return set(o for o in self.intersect if self.past_dict[o] == self.current_dict[o])

if __name__ == '__main__':
    import unittest
    class TestDictDifferNoChanged(unittest.TestCase):
        def setUp(self):
            self.past = dict((k, 2*k) for k in range(5))
            self.current = dict((k, 2*k) for k in range(3,8))
            self.d = DictDiffer(self.current, self.past)
        def testAdded(self):
            self.assertEqual(self.d.added(), set((5,6,7)))
        def testRemoved(self):      
            self.assertEqual(self.d.removed(), set((0,1,2)))
        def testChanged(self):
            self.assertEqual(self.d.changed(), set())
        def testUnchanged(self):
            self.assertEqual(self.d.unchanged(), set((3,4)))
    class TestDictDifferNoCUnchanged(unittest.TestCase):
        def setUp(self):
            self.past = dict((k, 2*k) for k in range(5))
            self.current = dict((k, 2*k+1) for k in range(3,8))
            self.d = DictDiffer(self.current, self.past)
        def testAdded(self):
            self.assertEqual(self.d.added(), set((5,6,7)))
        def testRemoved(self):      
            self.assertEqual(self.d.removed(), set((0,1,2)))
        def testChanged(self):
            self.assertEqual(self.d.changed(), set((3,4)))
        def testUnchanged(self):
            self.assertEqual(self.d.unchanged(), set())
    unittest.main()

Alex · Answer 8 · 23 августа 2009

Скопируйте оба словаря в один словарь / массив. Это имеет смысл, поскольку у вас есть связанные значения 1: 1. Тогда вам нужен только один поиск, без цикла сравнения, и вы можете напрямую получить доступ к связанному значению.

Пример результирующего словаря / массива:

</p> <pre><code>[Name][Value1][Value2] [Actinobacter][GATCGA...TCA][8924342] [XYZbacter][BCABCA...ABC][43594344]

...

Найти подходящие ключи в двух больших словарях и сделать это быстро

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Найти подходящие ключи в двух больших словарях и сделать это быстро

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 9 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы