Подготовка к использованию Bert Прежде чем приступать к уточнению последующих задач, давайте начнем с нескольких общих вопросов о NLP, сказав, что это должно подчеркнуть универсальность Bert.В целом, большинство проблем НЛП делятся на четыре типа задач, показанных на рисунке выше:
Один тип - это маркировка последовательности.Это наиболее типичная задача НЛП.Например, сегментация китайских слов, маркировка части речи, распознавание именованных объектов, маркировка семантических ролей и т. Д. Могут быть классифицированы по типу проблемы.Он характеризуется требованием каждого слова в модели предложения.Контекст должен давать классификационную категорию.
Вторая категория - это классификационные задачи, такие как наша общая классификация текста, эмоциональные вычисления и т. Д., Которые можно классифицировать в эту категорию.Для него характерен тот факт, что независимо от того, насколько длинна статья, ей обычно присваивается классификационная категория.
Третий тип задачи - это суждение о соотношении предложений.Например, Entailment, QA, семантическое переписывание, рассуждения на естественном языке и другие задачи - все это модель.Его характерная особенность заключается в том, что по двум предложениям модель определяет, имеют ли два предложения какие-либо семантические отношения.
Четвертая категория - это генеративные задачи, такие как машинный перевод, текстовые резюме, написание стихов, чтение картинок и т. Д.Он характеризуется необходимостью генерировать другой фрагмент текста автономно после ввода текстового содержимого.
Первые три задачи очень распространены, и теперь я хочу выполнить задачу с заголовком изображения в четвертой задаче. Моя нормальнаяреализация основана на densecap: Иерархический подход для генерации описательных абзацев изображения . код здесь