У меня есть POS-теги на английском языке фразы вида: the_DT flower_NN pot_NN
и я хочу объединить все существительные последовательности в одно существительное, разделенное подчеркиванием: the_DT flower_pot_NN
.
Я пытаюсь сделать следующее:
s.gsub!(/ ([^ ]+)_NN ([^ ]+)_NN/, " #{$1}_#{$2}_NN")
Это решение не работает, если в строке несколько существительных, например: the_DT monster_NN truck_NN wallpaper_NN
, которое должно стать the_DT monster_truck_wallpaper_NN
.
Что мне делать?