Тарбол, на который вы ссылаетесь, содержит исходный код.Для запуска кода вам необходимо скомпилировать его в исполняемый файл.Затем вы можете запустить исполняемый файл, если компиляция завершится успешно.
Вот файлы, с которых вы должны начать, прямо из файла tar:
$ ls
ksg main.c sample_ksgs.txt stree.h
ksg.exe sample_docs.txt stree.c stree.txt
Компиляция
Сначала мы скомпилируем программу.-o ksg
называет исполняемый файл ksg
.Когда gcc ничего не отображает, это означает, что он успешно выполнен без каких-либо ошибок или предупреждений.
$ gcc -o ksg main.c stree.c
Run
Теперь мы можем запустить только что созданный исполняемый файл ksg
.Синтаксис командной строки: ./ksg <arguments>
.Например, мы можем обратиться за помощью к ./ksg -?
:
$ ./ksg -?
Dell Zhang, Wee Sun Lee.
Extracting Key-Substring-Group Features for Text Classification.
In Proceedings of the 12th ACM SIGKDD International Conference on
Knowledge Discovery and Data Mining (KDD),
Philadelphia, PA, Aug 2006.
Usage: ksg [options] docs_file ksgs_file
Options:
-? -> help
-s [0,1] -> assume white-spaces are word delimiters
(default 1)
-l [2..] -> the minimum frequency
(default 2)
-h [l..] -> the maximum frequency
(default 8,000)
-b [2..] -> the minimum number of branches
(default 2)
-p (0..1] -> the maximum parent-child conditional probability
(default 1.0)
-q (0..1] -> the maximum suffix-link conditional probability
(default 1.0)
Arguments:
docs_file -> the input file with each line as a raw document
ksgs_file -> the output file with each line as a bag of ksg features