Я прочитал статью под названием «Многозадачная модель обучения для классификации полярности аспектов и извлечения аспектов аспекта в китайском языке», предложенную Янгом и др. al (2019). Код доступен здесь: https://github.com/yangheng95/LCF-ATEPC Код работает с набором данных SemEval 2014, но когда я пытаюсь использовать свой набор данных, у меня возникает проблема преобразовать его в структуру, которая работает с кодом.
это мой набор данных (json файл) со следующей структурой https://github.com/afi1289/LCF-ATEPC/blob/master/atepc_datasets/restaurant/restaurant_sentences_for_ABSA.json:
"98497_5": {"true token": ["Мидии", "-" , "So", "много", "аромат", "!"], "Label": ["BA", "O", "BS", "IS", "IS", "O"], "ссылка ": [" "," "," 1 "," "," "," "]," полярность ": [" "," "," 2 "," "," "," "]," аспект category ": [" f "," "," "," "," "," "]," modifier ": [[], [], [" STR "], [], [], []] , "предложение": "Мидии - столько аромата!"}
Только следующая структура работает с LCF-ATEP C Модель: Но O -1 штатный O -1 B- ASP 0 был O -1 так что O -1 ужасно O -1 до O -1 us O -1. O -1
мы пытались его преобразовать, получаем:
Мидии B- ASP 2
- O -1 Итак O -1 много O -1 аромат O -1! O -1
Тем не менее, модель LCF-ATEP C не смогла начать тренироваться? Как я мог преобразовать свой json набор данных для работы с моделью LCF-ATEP C?
Заранее спасибо!