Если вы хотите, чтобы процессы порождали и умирали, а доступ к памяти для них осуществлялся удаленно, вам нужно что-то, что хранит ваши данные в течение промежуточного периода.Одним из решений будет создание процесса, который будет выполнять ваши распределения, а затем вы создадите столбцы cudf из ipc.Я не уверен, как это сделать в Python.В c ++ это довольно просто.
Что-то вроде
//In the code handling your allocations
gdf_column col;
cudaMemHandle_t handle_data, handle_valid;
cudaIpcGetMemHandle(&handle,col.data);
cudaIpcGetMemHandle(&valid,col.valid);
//In the code consuming it
gdf_column col;
//deserialize these by reading from a file or however you want to make this
//binary data avaialable
cudaMemHandle_t handle_data, handle_valid;
cudaIpcOpenMemHandle ( (void**) &col.data, cudaIpcMemHandle_t handle, cudaIpcMemLazyEnablePeerAccess );
cudaIpcOpenMemHandle ( (void**) &col.valid, cudaIpcMemHandle_t handle, cudaIpcMemLazyEnablePeerAccess );
Существуют также сторонние решения от разработчиков RAPID, такие как BlazingSQL, которые предоставляют эту функциональность в python, а также предоставляютинтерфейс SQL для cudfs.
Здесь вы бы сделали что-то вроде
#run this code in your service to basically select your entire table and get it
#as a cudf
from blazingsql import BlazingContext
import pickle
bc = BlazingContext()
bc.create_table('performance', some_valid_gdf) #you can also put a file or list of files here
result= bc.sql('SELECT * FROM main.performance', ['performance'])
with open('context.pkl', 'wb') as output:
pickle.dump(bc, output, pickle.HIGHEST_PROTOCOL)
with open('result.pkl', 'wb') as output:
pickle.dump(result, output, pickle.HIGHEST_PROTOCOL)
#the following code can be run on another process as long as result
# contains the same information from above, its existence is managed by blazingSQL
from blazingsql import BlazingContext
import pickle
with open('context.pkl', 'rb') as input:
bc = pickle.load(input)
with open('result.pkl', 'rb') as input:
result = pickle.load(input)
#Get result object
result = result.get()
#Create GDF from result object
result_gdf = result.columns
Отказ от ответственности, я работаю на Blazing.