обучающий word2vec из вебинара с субтитрами - PullRequest
0 голосов
/ 10 мая 2019

Я строю модель для начала воспроизведения видео с таймфрейма, в зависимости от контекста. Например, воспроизведение климакса фильма начинается с 59-й минуты.

Я использую субтитры к видео, сопоставляю текст в определенной последовательности и определяю временные рамки. Я пытаюсь найти точные слова с реальными выражениями $$ не так эффективно $$. Я наткнулся на word2vec, который может найти одинаковые слова с косинусным сходством

1 Ответ

0 голосов
/ 11 мая 2019

Пожалуйста, публикуйте примеры названий веб-семинаров и поисковых запросов, чтобы получить лучший ответ, но основываясь на том, что вы опубликовали.Вам не обязательно обучать новую модель word2vec, если вы используете такой язык, как английский, с несколькими уже подготовленными векторами.Вот шаги:

1) Рассчитайте вектор для вашего поискового запроса, используя предварительно обученные векторы word2vec.

2) Рассчитайте вектор для каждого субтитра и сохраните в подходящем списке

3) Использовать функцию cosine_simility из библиотеки ML для вычисления сходства между вектором из шага 1 и каждым из векторов в списке из шага 2.

4) Субтитры с показателем сходства, ближайшим к 1это то, что вы ищете, и вы можете отменить поиск соответствующего времени для этого кадра

...