Я составляю простой список с возможностью поиска, который в итоге будет содержать около 100 000 ссылок на различные медицинские темы - в основном, медицинские состояния / заболевания.Теперь, на первый взгляд, это звучит просто ... фактически я настроил свои таблицы следующим образом:
- Ссылки: id, url, name, topic
- Темы (например, кардиология, педиатрия и т. Д.): Идентификатор, имя
- Условия (например, астма, грипп и т. Д.): Идентификатор, имя, псевдонимы
И, возможно, другая таблица:
- Ссылка и условие (поскольку 1 ссылка может относиться к нескольким условиям): идентификатор ссылки, идентификатор условия
Так что, в основном, поскольку врачи (включая меня) очень привередливы, я хочу сделать этотак что если вы ищете условие - будь то аббревиатура, британский или американский английский или альтернативное древнее имя - вы получите релевантные результаты (например, «ангиоотек», «ангионевротический отек», «отек Квинке» и т. д.)те же результаты, аналогично «гастроэзофагеальной рефлюксной болезни», «гастроэзофагеальной рефлюксной болезни», GERD, GORD, GOR).Кроме того, в верхней части результатов было бы хорошо сгруппировать ссылки для диагностики, которая соответствует поисковой строке, затем найти совпадения для имени ссылки и, наконец, соответствовать теме.
Моя главная проблема заключается в том, чтоСуществуют тысячи, если не десятки тысяч состояний, каждое из которых содержит до 20 синонимов / написаний и т. д. Один из вариантов - получить данные из MeSH , который является своего рода медицинским тезаурусом (но только в американском английском).так что должен был быть способ конвертации с британского английского).Проблема в том, что XML, который они предоставляют, БЕЗУМЕН и около 250 МБ.Чтобы помочь им получить руководство по элементам данных.
Честно говоря, я в растерянности относительно того, как решить эту задачу наиболее эффективно, поскольку я только начал программировать и работать с базами данных и большей частьювозможности того, что делать, кажутся трудными / неоптимальными.
Интересно, кто-нибудь может мне помочь?С удовольствием уточню все, что неясно.