Quali siti e blog sono indicizzati da Google News? L'effetto Osama Bin Laden, ha tolto il segreto

Google non ha mai pubblicato un elenco completo delle sue fonti di notizie

Tutto quello che sappiamo è che l'edizione in lingua inglese di Google News, indicizza notizie provenienti da oltre 4.500 fonti – compresi siti di news e blog.
L'unico modo per determinare se un sito è indicizzato da Google News è attraverso la query di ricerca. Ecco un esempio, voglio sapere se pincopallino.com è indicizzato da Google News. Scrivo la query allinurl: pincopallino.com.
Se non appare nessun risultato, il sito preso in esame non è indicizzato.

Effetto Osama Bin Laden, ora i nomi delle fonti di Google News non sono più un segreto

Krishna Bharat, fondatore e Direttore di Google News, recentemente, subito dopo la conclusione dell'operazione Abbottabad, ha pubblicato un enorme elenco di più di 150.000 collegamenti ad articoli che citano Osama Bin Laden.
In quel periodo (01-05 maggio 2011), poiché quasi tutti gli editori avevano coperto la storia di Bin Laden, è molto probabile che l'elenco di Krishna Bharat, più o meno, indica gli URL di tutte le fonti d'informazione sottoposte a scansione da Google News.
E' possibile visionare una copia dell'elenco (scorrere per trovare i siti italiani), su  Google Docs. Se siete curiosi, l'elenco delle fonti è stato preparato con il seguente comando di Linux
cat osama_google_news.txt | grep ENGLISH | awk '{print $ 11}' | cut-d "/"-f 3 | sort | uniq-c | sort

Google News e la copertura di Bin Laden –  Inviato da Krishna Bharat, Fondatore e Direttore di Google News

«Google News è nato a seguito dei tragici avvenimenti dell'11 settembre 2001. Un atto di terrorismo senza precedenti sul suolo americano, di un gruppo straniero militante guidato da Osama Bin Laden, ha cambiato il corso della storia. Persone in tutto il mondo cercava di capire quanto era appena accaduto, con aspetti sulle implicazioni per la sicurezza pubblica, la politica estera, i mercati finanziari e la propria vita.
A Google ci siamo resi conto che la nostra capacità di visualizzare i collegamenti alle notizie più fresche e più rilevanti, è stato limitato da un problema fondamentale: le notizie fresche erano prive di collegamenti ipertestuali. La valutazione di Google dipendeva dai link da altri autori sul web. Le notizie del momento, per definizione, erano troppo fresche per essere inserire nell'elenco di tali link.
Ho capito che se Google era in grado di calcolare quante fonti di notizie coprivano l'argomento in un determinato momento, poteva stimare l'importanza di quella specifica storia. E' questo il motivo che ci ha spinto ad inventare "Storyrank".
L'intuizione di "Storyrank", ha permesso di compilare una classifica delle news in tempo reale, basata sulla valutazione della sapienza giornalistica di molti editori sul web.
"Storyrank", oltre a migliorare la ricerca, visualizza notizie classificate automaticamente da un algoritmo.
Ora, dopo dieci anni, è tornata come una tempesta la notizia di Osama Bin Laden. La storia della sua uccisione, la rilevante copertura da tutto il mondo, questa volta è a portata di click su Google News, in un cluster compilato automaticamente con oltre 80.000 sorgenti.
Sicuramente abbiamo percorso molta strada negli ultimi dieci anni. Google News, ora ha più di 70 edizioni in 30 lingue, ogni mese invia oltre 1 miliardo di click per gli editori di notizie in tutto il mondo. Inoltre, su Google, una ricerca su sei, include un set di risultati di notizie, calcolate con l'aiuto di Storyrank, ciò contribuisce a portare al top della classifica la copertura della notizia più importante corrispondente ad una determinata query di ricerca.
Nel nostro team negli ultimi 10 anni c'è stato molto apprendimento, iterazione e innovazione, ciò ha permesso di acquisire un fedele pubblico d’appassionati di notizie, che apprezzano la diversità e la possibilità di accedere a molteplici punti di vista su una storia. Per i nostri utenti ci piacerebbe dire "Grazie!"
Abbiamo voluto condividere con voi alcune delle coperture della notizia della morte di Bin Laden. E' qui in un campione di 100 link ad articoli di fonti rappresentative di tutto il mondo».

googleinternetnews google