Due secoli di notizie su Google

Il popolare motore di ricerca inaugura l'archivio storico delle notizie per una ricerca all'indietro nel tempo

STATI UNITI – Per un motore di ricerca importante come Google, la maggiore quantità di informazioni ricercabili equivale al maggiore successo dell'azienda. Non stupisce, quindi, che l'ultima novità a Mountain View sia un archivio storico delle notizie degli ultimi duecento anni; una volta che tutte le informazioni presenti sono già state indicizzate, è facile rivolgersi al passato, fonte inesauribile di conoscenza.
TIMELINE DELL'INFORMAZIONE –Google News Archive Search permette la ricerca di un evento o di un personaggio storico, consentendo l'analisi del modo in cui si è sviluppato l'interesse della stampa nel tempo. Gli articoli più simili vengono inoltre raggruppati in tappe e ordinateIcronologicamente, per facilitare la consultazione. L'alternativa alla visuale cronologica (timeline) , è quella di sfogliare gli archivi a seconda della rilevanza degli articoli, selezionando solo una determinata fonte o periodo. I quotidiani e le riviste che hanno deciso di aprire i propri archivi a Google, mettono a disposizione gli articoli gratuitamente oppure, in alcuni casi, a pagamento secondo una politica pay-per-view.
DUECENTO ANNI DI NOTIZIE – Tra le fonti presenti spiccano testate come il Time, Wall Street Journal, New York Times, Guardian, Washington Post e aggregatori di notizie come Factiva, LexisNexis, Thomson Gale e HighBeam Reserch. Per quanto riguarda i contenuti a pagamento, ogni fonte gestisce direttamente la transazione; Google ricopre il ruolo di mediatore che offre all'utente la possibilità di raggiungere le informazioni più utili. La società ha precisato che i link a pagamento – segnalati già nella pagina dei risultati – non vengono privilegiati rispetto a quelli gratuiti, poiché il sistema della rilevanza tiene conto solo delle informazioni inserite nel testo. La ricerca nell'archivio è integrata anche nel motore generale e in quello di news d'attualità, in modo da segnalare eventuali risultati presenti nella stampa per gli argomenti legati al passato
GOOGLE E L'OPEN SOURCE – Nel frattempo, Google ha messo a disposizione, come software open source, Tesseract un vecchio motore di riconoscimento caratteri sviluppato da Hewlett-Packard ora trasformato in Ocr (Optical Character Recognition), che permette di trasformare un'immagine acquisita da uno scanner in un testo. Il software, attualmente in grado di supportare solo la lingua inglese, funziona solamente su testi in bianco e nero e non mantiene l'impaginazione ma è la tecnologia alla base del servizio Google Book Search , in continua espansione. Rilasciando il codice del programma, Google offre ai programmatori la possibilità di migliorarne l'efficienza in modo da favorire lo sviluppo della tecnologia. L'intervento di Google mette a disposizione di tutti un archivio imponente fatto di cronaca e di opere letterarie, offrendo gli strumenti per orientarsi tra le informazioni della rete.

Marina Rossi
Fonte: Corriere.it il 07-09-2006 - Categoria: Attualità

Lascia il tuo commento
Cerca su PachinoGlobale.net