Как я могу выполнить передискретизацию после или до встраивания? - PullRequest
0 голосов
/ 08 апреля 2019

Я сталкивался с реализацией Денни Брица в тензорном потоке ссылка работы Юна Кима (Сверточные нейронные сети для классификации предложений), я хотел бы выполнить SMOTE (избыточную выборку) для векторов вложения каждого предложения, неуверен, как получить их вложения, или если я могу сделать передискретизацию перед встраиванием, вот часть вложения Денни:

    with tf.device('/cpu:0'), tf.name_scope("embedding"):
        self.W = tf.Variable(
            tf.random_uniform([vocab_size, embedding_size], -1.0, 1.0),
            name="W",trainable=True)
        self.embedded_chars = tf.nn.embedding_lookup(self.W, self.input_x)
        self.embedded_chars_expanded = tf.expand_dims(self.embedded_chars, -1)

1 Ответ

0 голосов
/ 08 апреля 2019

Я полагаю, что вы хотите перевыборы встраивания предложений на основе их классов с использованием SMOTE.Вот самый простой способ:

1 - установить библиотеку imblearn pip install imblearn

2 - вы можете использовать SMOTE oversamplig или ADASYN oversampling,

импортировать тот, которыйВы хотите:

from imblearn.over_sampling import SMOTE или from imblearn.over_sampling import ADASYN

3 - создать экземпляр и выбрать предпочитаемые параметры (зависит от вашей проблемы):

sm = SMOTE(random_state=12, ratio=1.0)

4 - предоставьте свой список внедрения и соответствующий список меток, и вы получите результаты с перевыбором: oversampled_embeddings,oversamples_labeles= sm.fit_sample(embeding_list,labels_list)

5 - наслаждайтесь обучением и тестированием своей сети:)

Надеюсь, это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...