FSCrawler не может найти существующие вакансии - PullRequest
0 голосов
/ 11 февраля 2020

Я довольно новичок в стеке Elasti c и хочу индексировать документы с помощью FSCrawler. У меня возникает странная проблема:

Я создаю новую работу и получаю подтверждение, что она была успешно создана. Я вижу только что созданную папку с именем задания.

Проблема в том, что каким-то образом FSCrawler не может найти новые сгенерированные задания.

Я генерирую задание, используя следующую команду в PS :

PS C:\ELK\fscrawler> bin/fscrawler testJobLaaKii
10:22:28,708 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.4mb/247.5mb=3.43%], RAM [2.4gb/7.8gb=31.33%], Swap [4.6gb/12.5gb=37.33%].
10:22:28,724 WARN  [f.p.e.c.f.c.FsCrawlerCli] job [testJobLaaKii] does not exist
10:22:28,726 INFO  [f.p.e.c.f.c.FsCrawlerCli] Do you want to create it (Y/N)?
y
10:22:31,190 INFO  [f.p.e.c.f.c.FsCrawlerCli] Settings have been created in [C:\Users\<username>\.fscrawler\testJobLaaKii\_settings.yaml]. Please review and edit before relaunch

Но всякий раз, когда я хочу его запустить, создается впечатление, что FSCrawler не может его найти.

PS C:\ELK\fscrawler> bin/fscrawler
10:24:49,361 INFO  [f.p.e.c.f.c.BootstrapChecks] Memory [Free/Total=Percent]: HEAP [8.6mb/247.5mb=3.48%], RAM [2.4gb/7.8gb=31.38%], Swap [4.6gb/12.5gb=37.06%].
10:24:49,373 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job specified. Here is the list of existing jobs:
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] No job exists in [C:\Users\<username>\.fscrawler].
10:24:49,378 INFO  [f.p.e.c.f.c.FsCrawlerCli] To create your first job, run 'fscrawler job_name' with 'job_name' you want

Даже если задание явно создано:

file system with new generated job

1 Ответ

0 голосов
/ 11 февраля 2020

Ооо, после нахождения этого видео: Индексирование многих файлов PDF для полнотекстового поиска с использованием Elasticsearch

Я решил это с помощью команды, которую он показал в видео:

bin\fscrawler --config_dir ./DS data_science --loop 1

вместо моей более короткой версии. Я не могу сказать, в чем проблема при использовании более короткой версии, и я до сих пор не вижу своих рабочих мест в списке при выполнении bin\fscrawl, но каким-то образом это работает ...

...