Что это за тип Три? - PullRequest
       21

Что это за тип Три?

0 голосов
/ 29 января 2011

Я хочу добавить слова в Java-программу с открытым исходным кодом для кхмерского языка с открытым исходным кодом (язык без пробелов между словами). Разработчики долго не работали над этим, и я не смог связаться с ними для получения подробной информации (http://sourceforge.net/projects/khmer/files/Khmer%20Word%20Breaking/Khmer%20Word%20Breaking%20program%20V1.0/). Возможно, список был создан из кхмерского словаря, и я хотел бы заново создать файл, чтобы включить больше слов.

Может кто-нибудь определить, в каком формате находится словарь слов (я полагаю, это какой-то тип три)? Вот первые несколько строк:

0ឳមអគណជយឍឫហកដពទឱលថឦឡញឩខនឧផប។ឋវឭឈឃឥឌឰឪសងចភធឯតឆរ
1ទ
0ក
1
1ីែមគួណជយ៍ៀហកទុលេញ៉ឺនំឹៃូឈឃោាឿសងចិ្ធើតៅរ
1គនសងរ
0ទ
0ា
0យ
0ព
0ន
1
1រ
0ា
0ស
0ី
1

А кто-нибудь знает, как мне сделать новый (у меня большой список слов, но я не уверен, как его перевести в этот формат).

Спасибо!

1 Ответ

1 голос
/ 29 января 2011

После быстрого просмотра кода у меня появляется теория.

Создайте SearchTree, который расширяет TreeItem. Для каждого слова в вашем словаре звоните addWord из TreeItem. Когда итерация завершена, вызовите export on SearchTree. Использовать новый файл в качестве файла ввода слов.

Кроме того, может быть недокументированный параметр для khwrdbrk.jar, --create, который будет читать слова для нового дерева из стандартного ввода.

Опять же, просто теория, но дайте мне знать, что произойдет, если вы проверите это.

...