Если вы посмотрите на примеры из реальной жизни, где унификация используется и полезна, взгляните на грамматики на основе унификации, которые используются в компьютерной лингвистике, например, HPSG и LFG. На первый взгляд, это похоже на еще один аромат объединения, но они действительно одинаковы.
Грамматику, основанную на унификации, можно рассматривать как CFG (контекстно-свободную грамматику), в которой производство расширяется с помощью унификации. Каждый член в CGF получает AVM (матрицу значений атрибутов), которая представляет собой ориентированный ациклический граф признаков и значений. Идея здесь сродни грамматике атрибутов, используемой в компиляторах.
Представьте себе эту игрушечную грамматику:
S -> NP VP
NP -> Kim
NP -> The cats
VP -> V NP
V -> see
V -> sees
У нас есть небольшое превышение в соглашении:
* Кошки видят Ким
[S [NP Коты] [VP [V видит] [NP Kim]]]
Чтобы исправить это, мы могли бы уточнить CFG, включив в него понятие соглашения:
S -> NP_sg VP_sg
S -> NP_sg VP_pl
NP_sg -> Kim
NP_pl -> The cats
VP_sg -> V_sg NP_sg
VP_sg -> V_sg NP_pl
V_sg -> sees
V_pl -> see
VP_pl -> V_pl NP_pl
VP_pl -> V_pl NP_sg
Здесь мы откажемся от перерождения от ранее. Но это приводит к комбинаторной эксплуатации очень быстро. Однако мы могли бы дополнить каждый термин AVM и объединить их вместе при разборе:
S -> NP VP , C = A unified with B.
NP -> kim /[ AGR sg ]. We mark Kim as being singular
NP -> The cats / [ AGR pl ]
VP[ AGR #1 ] -> V [ AGR #1 ] NP
Обозначения # 1 - это повторные входы, что означает, что значение этой функции должно быть одинаковым, фактически они будут указывать на один и тот же узел в графе после объединения, если это удастся. Здесь на практике мы говорим, что особенность согласия глагольной фразы такая же, как согласие глагола во фразе.
V -> See / [ AGR pl ]
V -> Sees / [ AGR sg ]
С нашей расширенной грамматикой игрушек «Ким смотри на кошек» отклоняется, потому что NP и VP не будут объединяться, имея другое значение для своей функции AGR.
Когда мы анализируем, мы объединяем AVM вместе, и поэтому получаем большую выразительность, облегчая грамматическим инженерам писать грамматики. Обычно UBG с широким охватом имеет порядок сотен правил, в то время как эквивалентные CFG, которые могут не существовать, CFG с унификацией являются полными по Тьюрингу, будут иметь правила в количестве тысяч и более.
Подробнее см.
HPSG и
биогаз .