Утечка памяти при попытке освободить массив CString - PullRequest
0 голосов
/ 23 сентября 2019

Следующее (MCVE, если оно скомпилировано как cdylib, называемое libffitest, требует libc в качестве зависимости), демонстрирует проблему:

use libc::{c_char, c_void, size_t};
use std::ffi::CString;
use std::mem;
use std::slice;

#[repr(C)]
#[derive(Clone)]
pub struct Array {
    pub data: *const c_void,
    pub len: size_t,
}

#[no_mangle]
pub unsafe extern "C" fn bar() -> Array {
    let v = vec![
        CString::new("Hi There").unwrap().into_raw(),
        CString::new("Hi There").unwrap().into_raw(),
    ];
    v.into()
}

#[no_mangle]
pub extern "C" fn drop_word_array(arr: Array) {
    if arr.data.is_null() {
        return;
    }
    // Convert incoming data to Vec so we own it
    let mut f: Vec<c_char> = arr.into();
    // Deallocate the underlying c_char data by reconstituting it as a CString
    let _: Vec<CString> = unsafe { f.iter_mut().map(|slice| CString::from_raw(slice)).collect() };
}

// Transmute to array for FFI
impl From<Vec<*mut c_char>> for Array {
    fn from(sl: Vec<*mut c_char>) -> Self {
        let array = Array {
            data: sl.as_ptr() as *const c_void,
            len: sl.len() as size_t,
        };
        mem::forget(sl);
        array
    }
}

// Reconstitute from FFI
impl From<Array> for Vec<c_char> {
    fn from(arr: Array) -> Self {
        unsafe { slice::from_raw_parts_mut(arr.data as *mut c_char, arr.len).to_vec() }
    }
}

Я думал, что путем восстановления входящего Arrayв качестве фрагмента, взяв на себя владение им как Vec, а затем восстановив элементы как CString, я освобождаю любую выделенную память, но я явно что-то делаю не так.Выполнение этого скрипта Python говорит мне, что он пытается освободить указатель, который не был выделен: python(85068,0x10ea015c0) malloc: *** error for object 0x7ffdaa512ca1: pointer being freed was not allocated

import sys
import ctypes
from ctypes import c_void_p, Structure, c_size_t, cast, POINTER, c_char_p

class _FFIArray(Structure):
    """
    Convert sequence of structs to C-compatible void array

    """
    _fields_ = [("data", c_void_p),
                ("len", c_size_t)]


def _arr_to_wordlist(res, _func, _args):
    ls = cast(res.data, POINTER(c_char_p * res.len))[0][:]
    print(ls)
    _drop_wordarray(res)


prefix = {"win32": ""}.get(sys.platform, "lib")
extension = {"darwin": ".dylib", "win32": ".dll"}.get(sys.platform, ".so")
lib = ctypes.cdll.LoadLibrary(prefix + "ffitest" + extension)

lib.bar.argtypes = ()
lib.bar.restype = _FFIArray
lib.bar.errcheck = _arr_to_wordlist
_drop_wordarray = lib.drop_word_array

if __name__ == "__main__":
    lib.bar()

1 Ответ

2 голосов
/ 23 сентября 2019

Что ж, это было забавно.

Ваша самая большая проблема заключается в следующем преобразовании:

impl From<Array> for Vec<c_char> {
    fn from(arr: Array) -> Self {
        unsafe { slice::from_raw_parts_mut(arr.data as *mut c_char, arr.len).to_vec() }
    }
}

Вы начинаете с того, что получается изграница FFI как массив строк (то есть *mut *mut c_char).По какой-то причине вы решаете, что вдруг это Vec<c_char>, а не Vec<*const c_char>, как вы ожидаете для преобразования CString.Это UB # 1 - и причина вашего использования после освобождения.

Излишне запутанные преобразования сделали вещи еще более грязными из-за постоянного жонглирования между типами.Если ваша граница FFI равна Vec<CString>, почему вы разделяете возврат на два отдельных вызова?Это буквально требует катастрофы, как это случилось.

Рассмотрим следующее:

impl From<Array> for Vec<CString> {
    fn from(arr: Array) -> Self {
        unsafe {
          slice::from_raw_parts(
            arr.data as *mut *mut c_char,
            arr.len
          )
            .into_iter().map(|r| CString::from_raw(*r))
            .collect()
        }
    }
}

Это дает вам одношаговое преобразование границы FFI (без необходимости во втором unsafe блоке).в вашем методе), чистые типы и нет утечек.

...