i motori di ricerca
A cura di Gabriele Favrin
Articolo pubblicato su Amiga Life 117 (gennaio 2001)
Nota bene: l'articolo proposto in questa pagina è
proprietà dell'autore e non può essere distribuito o
riutilizzato in alcun modo o forma senza il suo consenso scritto.
Le informazioni qui riportate risalgono alla data di pubblicazione
dell'articolo e non è detto che siano ancora valide o
che rispecchino lo stato attuale dei programmi, le posizioni delle persone
interpellate o quelle degli autori stessi.
Introduzione
La rete è grande, in rete c'è tutto... ma come si fa quando serve un'informazione e non si sa dove trovarla?
La differenza fra Internet ed i servizi telematici che l'hanno
L'estrema facilità con cui è possibile aprire
siti web è ciò che rende Internet tanto dinamica
ed interessante: oltre ai siti più famosi e pubblicizzati
esistono milioni di pagine meno note ma dai contenuti altrettanto
interessanti o utili (ad esempio i siti dei vari comuni d'Italia). Il
problema si pone quando vogliamo cercare delle informazioni. Mancando
un'ente centrale di coordinamento del web, non esiste un indice
ufficiale dei contenuti, che del resto sarebbe di difficile gestione
vista la velocità con cui nascono e muoiono i siti.
Per cercare in rete si utilizzano quindi i cosiddetti "motori di
ricerca", che sono servizi totalmente gratuiti (ma alcuni prevedono
opzioni avanzate a pagamento) e consentono di trovare le informazioni
richieste nel sottoinsieme delle pagine web a loro noto.
Directory e ragni
Esistono due tipologie principali di motori: directory e ragni ("web
Alla lentezza dell'aggiornamento sopperiscono i ragni, sistemi
totalmente automatizzati di indicizzazione del web. Si tratta di
potenti mainframe che esplorano 24 ore al giorno, 365 giorni l'anno la
rete e fagocitano tutti i siti che trovano, memorizzandone i principali
contenuti testuali. In questi servizi la ricerca avviene sulla base di
parole chiave: si inserisce nell'apposito modulo sul sito del motore il
testo desiderato e si guardano i risultati della ricerca. Quanto
più il termine è generico tanto più
saranno numerosi, e probabilmente lontani dall'argomento cercato, i
risultati. Al contrario, inserendo termini multipli o intere frasi,
sarà più facile trovare ciò che si
cerca, anche se spesso si tratta di una questione più di
fortuna che di correttezza della ricerca.
Negli anni i ragni si sono evoluti: dalla ricerca semplice si
è passati alle opzioni avanzate, ad esempio la ricerca su
pagine che contengono alcuni termini ma non ne contengono altri; il
supporto per le espressioni regolari, sin’anche, in tempi
più recenti, all'identificazione di parole "simili" a quella
cercata o alla proposta di pagine dai contenuti analoghi. In pratica il
motore modifica la chiave di ricerca dell'utente per renderla
più affine ai contenuti che evidentemente questi desidera
trovare.
Ma come fanno i ragni ad indicizzare un sito? Esistono due approcci: la
memorizzazione integrale del testo presente in ogni pagina web e
l'analisi dei TAG "meta". Nel secondo caso il programma cerca specifici
TAG HTML nel documento da memorizzare. Tali TAG indicano la natura
della pagina, i contenuti ed eventualmente la lingua. Segue un esempio
per i lettori che desiderassero inserirle nelle proprie pagine.
<meta name="description"
lang="it"
content="Frequenze delle emittenti radio italiane">
<meta name="keywords"
lang="it"
content="emittenti radio, frequenze, frequenze emittenti
radio italiane">
In breve, nell'attributo "content" nel primo TAG va inserita una breve
descrizione della pagina, mentre nel secondo si mettono, separate le
une dalle altre da una virgola ed uno spazio, le parole chiave che
corrispondono ai contenuti della pagina. Per maggiori informazioni
rimandiamo alla sezione "B.4" delle specifiche HTML 4.0 (presenti anche
sul CD allegato) espressamrente dedicata all'interazione con i motori
di ricerca.
Risulta evidente che l'efficacia dei TAG "meta", soluzione che in un
mondo perfetto avvicinerebbe ragni e directory (i primi caratterizzati
dalla velocità di "apprendimento" e le seconde
dall'accuratezza delle informazioni), dipende dalla correttezza del
webmaster. E infatti... molti siti, soprattutto di tipo pornografico,
presentano TAG "meta" con descrizioni fuorvianti utilizzate allo scopo
di comparire anche all'interno di ricerche di tutt'altra natura.
Dal canto loro i motori più seri offrono
funzionalità preventive (ad esempio il "Family filter" di
AltaVista), atte ad evitare, per quanto possibile, la visualizzazione
di siti dai contenuti inadatti al pubblico minore. Purtroppo in nessun
caso vi è la garanzia che il sito trovato corrisponda a
quanto da noi cercato, né, è bene dirlo, che
l'indirizzo memorizzato nel motore di ricerca appartenga ancora a quel
sito. Tutti i servizi comunque consentono di segnalare abusi o problemi
di questa natura.
Conclusioni
Abbiamo visto quali tipi di motori di ricerca esistono e come operano. La domanda che i lettori si porranno ora è "qual è il migliore?". Difficile rispondere, si tratta di un approccio soggettivo, basato sulle proprie abitudini in rete. Chi ama navigare senza meta potrebbe preferire la "lenta" ricerca fra le categorie di una directory. Ad altri, più sbrigativi, risulterà più congeniale inserire una chiave di ricerca in un ragno per scovare un sito stranissimo, magari mai visitato da nessuno prima di loro. L'unico vero consiglio che ci sentiamo di dare è di non fossilizzarsi su un singolo servizio, per quanto buono possa essere. Le tecnologie di indicizzazione del web sono in continua evoluzione e capita che motori emergenti possano riservare delle sorprese: è il caso di Google, che spesso oggigiorno supera di molto AltaVista per numero dei risultati offerti.
Indirizzi utili
Motori internazionali consigliati
- AltaVista
Italiani
- Arianna
- Virgilio
Amiga
Questi indirizzi sono stati verificati a maggio 2019.