Как работает Google In Quotes? - PullRequest
4 голосов
/ 25 октября 2008

Я нахожу Google In Quotes действительно изящным приложением, и как парень из CS, я должен понять, как оно работает. Как, по вашему мнению, новостные статьи превращаются в список цитат, приписываемых конкретным лицам? Конечно, есть некоторые ошибки, но их алгоритм кажется умнее, чем простая эвристика или несколько регулярных выражений. Например, цитату можно приписать кому-либо, даже если его / ее имя упоминалось только в последнем абзаце.

Есть идеи? Любая известная статья на эту тему?

Ответы [ 3 ]

1 голос
/ 25 декабря 2008

Все просто, он проверяет слова, но между ними может быть что угодно, лишь бы они были в порядке. "Привет, мир!" станет регулярным выражением / привет [.] * world /

0 голосов
/ 26 октября 2008

У меня нет ответа на ваш вопрос, но я предлагаю вам обратиться к инженеру Google напрямую через Модератор Google . Вы можете не получить ответ быстро (или вообще), но получите точный ответ там.

0 голосов
/ 25 октября 2008

У меня нет бумаги, но есть идея. Google берет цитаты из набора людей. Легко для них с Новостями Google и другим доступом к СМИ.

У них есть другой набор предметов. Тема соответствия Google установлена ​​с набором человека (оба набора являются конечными). Последний набор - вся цитата,

Если вы заметили, тема содержит 1 слово, которое выделено в цитате. Таким образом, он имеет отношение между набором предмета и набором цитаты для каждого набора человека. Поскольку Google является хозяином информации, очень легко получить связь между всеми этими наборами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...