В частности, я хотел бы иметь возможность извлекать объекты людей, мест, фильмов, музыки и т. Д. И иметь объекты, доступные в широко используемых идентификаторах связанных данных, таких как DBpedia, Freebase или OpenCyc.
Extractiv - аналогичный сервис, который объединяет веб-сканер от 80legs с обработкой естественного языка от Language Computer Corporation (LCC).В настоящее время эта служба предоставляет более 150 типов сущностей, таких как те, которые вы перечислили, и связывает их с DBpedia.
Пока еще не развернут в Extractiv как веб-служба, LCC CiceroLite Именованная сущность tagger поддерживает китайский и японский языки.Это можно приобрести как отдельное приложение.Другой такой компанией будет Базовая технология , хотя я не знаю, связаны ли эти объекты.