Мне нужно обучить некоторые модели перчаток сравнивать их с word2ve c и выводом fasttext. Это реализовано в C, и я не могу прочитать C код. Github - здесь .
Учебный корпус должен быть отформатирован в один текстовый файл. Для меня это было бы >> 100G - слишком большой для памяти. Прежде чем тратить время на создание такой вещи, я был бы признателен, если бы кто-нибудь мог сказать мне, пытается ли перчатка go прочитать эту вещь в память, или она выводит ее с диска.
Если первое, то текущая реализация перчатки не будет совместима с моими данными (я думаю). Если последнее, я бы на это.