Я хочу проанализировать таблицы с похожими данными, которые структурированы по-разному, и где заголовки также могут немного отличаться.
При сборе всех данных из суммирующих их таблиц я сталкиваюсь с несколькими проблемами.
Шаг 1: Я ищу ключевые слова заголовка.Поиск, если «cars == cars» невозможен, поскольку заголовок может выглядеть как «car», «Car» или «Cars».Существует также вероятность того, что в слове есть орфографическая ошибка.Таким образом, перебор всех возможных вариантов также может привести к ложному.Когда я искал решения этой проблемы, я узнал о нечеткой логике, но я был бы благодарен за другие подходы.
Шаг 2. Я нашел нужное ключевое слово в таблице, но как узнать, где находитсясвязанные данные размещены?Это может быть ниже этого, но также и правая ячейка рядом с ним.Существуют ли подходы для получения информации об общей структуре таблицы?