На самом деле в вашем вопросе довольно много вопросов, которые я бы назвал так:
- Какие поля данных мне нужно искать?
- Как я буду искать эти поля?
- Какие данные мне нужно получить из поискового запроса?
Ваш дизайн схемы не может быть определен без ответа на эти вопросы.
Эти вопросы - гораздо более длинная тема, поэтому я не собираюсь подробно останавливаться на этом (то есть документы Solr для большего понимания.)
При работе со специальными символами вам важен этап анализа в индексировании, поскольку вы хотите, чтобы ваши термины хранились таким образом, чтобы вы могли логически получать их. Анализаторы (могут) используют различные стратегии токенизации для применения основанных на изменениях индексированного контента.
Анализаторы предназначены для разбиения текста термина; вы захотите убедиться, что ваши специальные символы выдержат анализ и будут проиндексированы. Я бы начал смотреть на WhitespaceAnalyzer, который оставляет термины из исходного контента в их точном состоянии в индексе. Вики-страница Solr на анализаторах даст вам представление о том, сколько из этих функций.