срез 2d тензора задан индексным тензором в тензорном потоке - PullRequest
0 голосов
/ 04 января 2019

У меня есть двумерный тензор, и я хочу извлечь несколько стартовых элементов из каждой строки.
У меня есть индекс столбца (для каждой строки), до которого элементы должны быть захвачены.
Обратите внимание, что индекс столбца отличается для разных строк.
Следующий пример делает это конкретным:
2d тензор это:

[[4 2 4 4 1 1 1 1 1 1 1 1 1 1 1 1]  
 [4 4 4 4 4 4 4 1 1 1 1 1 1 1 1 1]  
 [4 4 4 5 4 4 4 1 1 1 1 1 1 1 1 1]  
 [4 4 1 4 4 4 4 1 1 1 1 1 1 1 1 1]  
 [4 4 4 4 6 4 4 8 8 1 1 1 1 1 1 1]  
 [3 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]  
 [3 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]  
 [1 9 9 9 9 9 9 1 1 1 1 1 1 1 1 1]  
 [3 9 4 9 9 9 9 1 1 1 1 1 1 1 1 1]  
 [3 9 9 6 9 9 9 1 1 1 1 1 1 1 1 1]]  

и индексный массив:

[4 7 7 7 9 7 7 7 7 7]

Как получить следующий массив из вышеуказанного индексного массива:

[[4 2 4 4 ]  
 [4 4 4 4 4 4 4 ]  
 [4 4 4 5 4 4 4]  
 [4 4 1 4 4 4 4]  
 [4 4 4 4 6 4 4 8 8]  
 [3 9 9 9 9 9 9 ]  
 [3 9 9 9 9 9 9 ]  
 [1 9 9 9 9 9 9 ]  
 [3 9 4 9 9 9 9 ]  
 [3 9 9 6 9 9 9 ]]  

1 Ответ

0 голосов
/ 04 января 2019

Вот способ получить это как разреженный тензор:

import tensorflow as tf

# Example data
data = [[4, 2, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [4, 4, 4, 4, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [4, 4, 4, 5, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [4, 4, 1, 4, 4, 4, 4, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [4, 4, 4, 4, 6, 4, 4, 8, 8, 1, 1, 1, 1, 1, 1, 1],
        [3, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [3, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [1, 9, 9, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [3, 9, 4, 9, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1],
        [3, 9, 9, 6, 9, 9, 9, 1, 1, 1, 1, 1, 1, 1, 1, 1]]
sizes = [4, 7, 7, 7, 9, 7, 7, 7, 7, 7]

with tf.Graph().as_default():
    # Input data
    data_ph = tf.placeholder(tf.int32, [None, None])
    sizes_ph = tf.placeholder(tf.int32, [None])
    shape = tf.shape(data_ph)
    # Make coordinates grid
    ii, jj = tf.meshgrid(tf.range(shape[0]), tf.range(shape[1]), indexing='ij')
    # Make mask for values
    mask = jj < tf.expand_dims(sizes_ph, 1)
    # Take values and coordinates
    sp_values = tf.boolean_mask(data_ph, mask)
    sp_ii = tf.boolean_mask(ii, mask)
    sp_jj = tf.boolean_mask(jj, mask)
    # Make sparse index
    sp_idx = tf.cast(tf.stack([sp_ii, sp_jj], axis=1), tf.int64)
    # Make sparse tensor
    sp_tensor = tf.sparse.SparseTensor(sp_idx, sp_values, tf.cast(shape, tf.int64))
    # Convert back to dense for testing
    sp_to_dense = tf.sparse.to_dense(sp_tensor)
    # Test
    with tf.Session() as sess:
        sp_to_dense_value = sess.run(sp_to_dense, feed_dict={data_ph: data, sizes_ph: sizes})
        print(sp_to_dense_value)

Выход:

[[4 2 4 4 0 0 0 0 0 0 0 0 0 0 0 0]
 [4 4 4 4 4 4 4 0 0 0 0 0 0 0 0 0]
 [4 4 4 5 4 4 4 0 0 0 0 0 0 0 0 0]
 [4 4 1 4 4 4 4 0 0 0 0 0 0 0 0 0]
 [4 4 4 4 6 4 4 8 8 0 0 0 0 0 0 0]
 [3 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
 [3 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
 [1 9 9 9 9 9 9 0 0 0 0 0 0 0 0 0]
 [3 9 4 9 9 9 9 0 0 0 0 0 0 0 0 0]
 [3 9 9 6 9 9 9 0 0 0 0 0 0 0 0 0]]

Это не совсем идеально, поскольку требует работы с полной сеткой координат. В NumPy вы, вероятно, сможете сначала сгенерировать индексы, а затем выбрать только те значения, которые вам нужны, из плотного тензора, но я не уверен, что это возможно с TensorFlow.

...