Я обучил классификатор SVC на python, используя Sklearn и другие библиотеки.Я сделал это через сборку конвейера (sklearn). Я могу вывести обученную модель в файл pickle и создал другой скрипт на python, который загрузит файл pickle и получит данные из командной строки для прогнозирования.Я могу вызвать этот сценарий Python из Java, и он работает нормально.Единственная проблема заключается в том, что это занимает много времени, так как у меня есть библиотеки nltk, numpy, panda, вызываемые в скрипте python, необходимые для предварительной обработки входного аргумента.Я вызываю этот скрипт на Python несколько раз, и это увеличивает время.Как я могу обойти эту проблему.
вот так выглядит мой пиплэйн
pipeline = Pipeline([
# Use FeatureUnion to combine the features from dataset
('union', FeatureUnion(
transformer_list=[
# Pipeline for getting POS
('ngrams', Pipeline([
('selector', ItemSelector(key='Sentence')),
('vect', CountVectorizer(analyzer='word')),
('tfidf', TfidfTransformer()),
])),
],
# weight components in FeatureUnion
transformer_weights={
'ngrams': 0.7,
},
)),
# Use a SVC classifier on the combined features
('clf', LinearSVC()),
])