Question

Я хочу добавить слова в Java-программу с открытым исходным кодом для кхмерского языка с открытым исходным кодом (язык без пробелов между словами). Разработчики долго не работали над этим, и я не смог связаться с ними для получения подробной информации (http://sourceforge.net/projects/khmer/files/Khmer%20Word%20Breaking/Khmer%20Word%20Breaking%20program%20V1.0/). Возможно, список был создан из кхмерского словаря, и я хотел бы заново создать файл, чтобы включить больше слов.

Может кто-нибудь определить, в каком формате находится словарь слов (я полагаю, это какой-то тип три)? Вот первые несколько строк:

0ឳមអគណជយឍឫហកដពទឱលថឦឡញឩខនឧផប។ឋវឭឈឃឥឌឰឪសងចភធឯតឆរ
1ទ
0ក
1
1ីែមគួណជយ៍ៀហកទុលេញ៉ឺនំឹៃូឈឃោាឿសងចិ្ធើតៅរ
1គនសងរ
0ទ
0ា
0យ
0ព
0ន
1
1រ
0ា
0ស
0ី
1

А кто-нибудь знает, как мне сделать новый (у меня большой список слов, но я не уверен, как его перевести в этот формат).

Спасибо!

ideally_world · Answer 1 · 29 января 2011

После быстрого просмотра кода у меня появляется теория.

Создайте SearchTree, который расширяет TreeItem. Для каждого слова в вашем словаре звоните addWord из TreeItem. Когда итерация завершена, вызовите export on SearchTree. Использовать новый файл в качестве файла ввода слов.

Кроме того, может быть недокументированный параметр для khwrdbrk.jar, --create, который будет читать слова для нового дерева из стандартного ввода.

Опять же, просто теория, но дайте мне знать, что произойдет, если вы проверите это.

Что это за тип Три?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что это за тип Три?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы