Я довольно новичок вasticsearch, поэтому я приеду сюда в надежде найти советы. У меня есть два индекса в эластичных из двух разных CSV-файлов.
У index_1 есть это отображение:
{'settings': {
'number_of_shards' : 3
},
'mappings': {
'properties': {
'place': {'type': 'keyword' },
'address': {'type': 'keyword' },
}
}
}
Файл имеет длину около 400 000 документов. Индекс_2 с гораздо меньшим файлом (около 50 документов) имеет это отображение:
{'settings': {
"number_of_shards" : 1
},
'mappings': {
'properties': {
'place': {'type': 'text' },
'address': {'type': 'keyword' },
}
}
}
Поле «место» в индексе_2 - это все уникальные значения из поля «место» в индексе_1. В обоих индексах поля «address» являются почтовыми индексами ключевого слова типа данных со структурой: 0000AZ.
На основе ключевого слова field «place» в index_1 я хочу назначить термин поля «address» из index_2.
Я пытался использовать библиотеку панд, но файл index_1 слишком велик. Я также попытался создать модули на основе панд и эластичного поиска, но безуспешно. Хотя я считаю, что это перспективное направление. Хорошим решением было бы как можно больше оставаться в библиотекеasticsearch, так как эти индексы будут позже использованы для дальнейшего анализа.