Recoll, ricerca fulltext

Ricerca a tutto testo in linux
Data: 02/09/2012 Autore: Iasparra Francesco 

Piu' dettagliato:

smartctl -a /dev/hda            

Recoll e' un software open source dedicato alla ricerca a tutto testo nei sistemi Linux, e permette di effettuare ricerche mirate su qualsiasi file presente nel nostro disco operando sul contenuto di qualsiasi file: testo, word, pdf, excel, etc...

Per procedere all'installazione di recoll e' necessario installare anche altri pacchetti di utilita' per la manipolazione dei file pdf e word: antiword e catdoc.

Indicizzazione

L'indicizzazione è il processo che analizza i documenti e mette i dati nel database. Il processo di indicizzazione di Recoll è normalmente incrementale, vale a dire che i documenti vengono analizzati e indicizzati solo se hanno subito modifiche. Alla prima esecuzione, naturalmente, tutti i documenti vengono analizzati e indicizzati.

L'indicizzazione con Recoll può essere fatta con due metodi diversi:

(1) Indicizzazione periodica: l'indicizzazione avviene in tempi prestabiliti, eseguendo il comando recollindex. L'uso tipico è quello di fare una indicizzazione durante la notte programmando l'evento con cron.

(2) Indicizzazione in tempo reale: l'indicizzazione avviene non appena un file viene creato o cambiato. In questo caso recollindex gira come un demone e usa il monitoraggio del file-system fornito da Fam, Gamin o inotify per scoprire gli eventuali cambiamenti. Monitorare un grosso albero di cartelle può consumare molte risorse.

Creare/Aggiornare l'indice:

recollindex

Resettare l'indice:

recollindex -z

-z: opzione che cancella il database prima di fare l'indicewhich will reset the database before indexing.

Aggiornare l'indice in tempo reale:

recollindex -m

-m: con questa opzione, recollindex viene lanciato dal terminele e diventa un demone, monitorando in continuazione i cambiamenti e tenendo così aggiornato l'indice.

Lanciare recoll

recoll -c /mnt/work

-c: specifica la directory di configurazione da usare



  • Java
  • Php
  • Mysql
  • Apache ant
  • Eclipse
  • Spring
  • Hibernate
  • Netbeans
  • Debian
  • Linux
  • Maven

by Iasparra Francesco - © Copyright 2021

E' vietata la riproduzione anche parziale dei materiali presenti in questo sito.

I marchi e le immagini esposti sono Copyright dei rispettivi proprietari.