Я создал корпус постов в социальных сетях и хочу описать этот корпус, используя формальный язык, но я не уверен, возможно ли это вообще.
Например, если я скачал все посты в социальных сетях, связанные с пирожными, выполнив поиск в каждом посте определенного списка слов, и если пост содержал одно из этих слов, я бы добавил его. Можно ли описать этот корпус формальным языком или есть какой-то лучший способ сделать это?
Делая что-то вроде:
Σ = (все сообщения),
a = (сообщения, связанные с пирожными)
Наш корпус = Σ -! A
Я уверен, что прочитал исследование, в котором они описали текстовый корпус, используя какой-то тип формального языка, но я не могу вспомнить, что это такое и как. Может ли кто-нибудь помочь направить меня в правильном направлении?