Используйте JSON -данный набор данных, чтобы сделать классификацию текста с тензорным потоком - PullRequest
0 голосов
/ 02 апреля 2020

У меня есть json файл, похожий на этот:

[
    {
        "_id": {
            "$oid": "5e7f429480102400074a9b78"
        },
        "text": "schnelle bearbeitung meiner bedürfnisse"
    },
    {
        "_id": {
            "$oid": "5e7f429480102400074a9b79"
        },
        "text": "traditionelle werte, z. B. pünktlichkeit jeden tag kommt der bote um 8:30",
        "user_rating": 4
    },
    {
        "_id": {
            "$oid": "5e7f429480102400074a9b7a"
        },
        "text": "Ehrlichkeit",
        "user_rating": 4
    },
    ...
]

Я хочу создать классификатор текста с Tensorflow и керасом, который учится с использованием записей text и user_rating и может добавить оценку в записи без рейтинга (как первый в верхнем примере).

Как мне перевести этот набор данных в дружественный Tensorflow формат? Я использую введение в https://www.tensorflow.org/tutorials/keras/text_classification_with_hub, но я не знаю, какой формат мне нужен и как предварительно обработать мой набор данных.

...