Il sito dedicato all'informatica ideato da Iasparra Francesco

Recoll, ricerca fulltext


Piu' dettagliato:

smartctl -a /dev/hda            

Recoll e' un software open source dedicato alla ricerca a tutto testo nei sistemi Linux, e permette di effettuare ricerche mirate su qualsiasi file presente nel nostro disco operando sul contenuto di qualsiasi file: testo, word, pdf, excel, etc...

Per procedere all'installazione di recoll e' necessario installare anche altri pacchetti di utilita' per la manipolazione dei file pdf e word: antiword e catdoc.

Indicizzazione

L'indicizzazione è il processo che analizza i documenti e mette i dati nel database. Il processo di indicizzazione di Recoll è normalmente incrementale, vale a dire che i documenti vengono analizzati e indicizzati solo se hanno subito modifiche. Alla prima esecuzione, naturalmente, tutti i documenti vengono analizzati e indicizzati.

L'indicizzazione con Recoll può essere fatta con due metodi diversi:

(1) Indicizzazione periodica: l'indicizzazione avviene in tempi prestabiliti, eseguendo il comando recollindex. L'uso tipico è quello di fare una indicizzazione durante la notte programmando l'evento con cron.

(2) Indicizzazione in tempo reale: l'indicizzazione avviene non appena un file viene creato o cambiato. In questo caso recollindex gira come un demone e usa il monitoraggio del file-system fornito da Fam, Gamin o inotify per scoprire gli eventuali cambiamenti. Monitorare un grosso albero di cartelle può consumare molte risorse.

Creare/Aggiornare l'indice:

recollindex

Resettare l'indice:

recollindex -z

-z: opzione che cancella il database prima di fare l'indicewhich will reset the database before indexing.

Aggiornare l'indice in tempo reale:

recollindex -m

-m: con questa opzione, recollindex viene lanciato dal terminele e diventa un demone, monitorando in continuazione i cambiamenti e tenendo così aggiornato l'indice.

Lanciare recoll

recoll -c /mnt/work

-c: specifica la directory di configurazione da usare


  • Java

  • Php

  • Mysql

  • Apache ant

  • Eclipse

  • Spring

  • Hibernate

  • Netbeans

  • Debian

  • Linux

  • Maven