У меня есть json файл, похожий на этот:
[
{
"_id": {
"$oid": "5e7f429480102400074a9b78"
},
"text": "schnelle bearbeitung meiner bedürfnisse"
},
{
"_id": {
"$oid": "5e7f429480102400074a9b79"
},
"text": "traditionelle werte, z. B. pünktlichkeit jeden tag kommt der bote um 8:30",
"user_rating": 4
},
{
"_id": {
"$oid": "5e7f429480102400074a9b7a"
},
"text": "Ehrlichkeit",
"user_rating": 4
},
...
]
Я хочу создать классификатор текста с Tensorflow и керасом, который учится с использованием записей text и user_rating и может добавить оценку в записи без рейтинга (как первый в верхнем примере).
Как мне перевести этот набор данных в дружественный Tensorflow формат? Я использую введение в https://www.tensorflow.org/tutorials/keras/text_classification_with_hub, но я не знаю, какой формат мне нужен и как предварительно обработать мой набор данных.