У меня есть столбец в виде строки без пробелов:
clear
input str100 var
"ihaveanewspaper"
"watchingthenewsonthetv"
"watchthenewsandreadthenewspaper"
end
Я использую следующую команду:
gen = regex,(var, "(news)")
Выводит 1 1 1
, поскольку обнаруживает, что строки 3
в столбце var
содержат слово news.
Я пытаюсь изменить регулярное выражение "(news)"
, чтобы создать два столбца. Один для новостей и один для газеты. regexm(var, "(newspaper)")
удостоверяется, что в строке содержится газета, но мне нужна команда, чтобы символы после новостей не были "бумажными", так как я пытаюсь количественно их определить.
EDIT:
Есть ли способ считать третью запись как 1
, потому что она имеет вхождение news
, но не является газетой?