Así se ordenan los diarios más molestos. Los que sacan 0 la chitean con javascript, ninguno se salva del swf. Lo de Clarín es insufrible saca un 27.
#! /usr/bin/env python
# coding: utf-8
diarios = ( 'http://www.lanacion.com.ar', 'http://www.clarin.com', 'http://www.infobae.com', 'http://www.pagina12.com.ar/diario/principal/index-2008-05-02.html', 'http://www.criticadigital.com.ar/', 'http://www.ambitoweb.com/diario/portada/index.htm', 'http://www.cronica.com.ar/', 'http://www.cronista.com/contenidos/ultimasnoticias.html', 'http://www.laprensa.com.ar/', 'http://www.perfil.com/', 'http://www.lavozdelinterior.com.ar/08/05/02/index.asp' ) import urllib odio = [] for u in diarios: url = urllib.URLopener() responde = url.open(u).read() count = 0 patt = 'swf' index = responde.find(patt) while index != -1: count += 1 responde = responde[index + 1:] index = responde.find(patt) odio.append((u,count)) odio.sort(lambda x,y: y[1] - x[1]) for hdp,cuantos in odio: print "## " + str(cuantos) + " ##" + hdp
faltó un espacio:
rareas@rareas-desktop:~/pybolu/$ ./muchoFlash.py ## 27 ##http://www.clarin.com ## 25 ##http://www.laprensa.com.ar/ ## 24 ##http://www.criticadigital.com.ar/ ## 13 ##http://www.cronista.com/contenidos/ultimasnoticias.html ## 11 ##http://www.lanacion.com.ar ## 11 ##http://www.lavozdelinterior.com.ar/08/05/02/index.asp ## 4 ##http://www.ambitoweb.com/diario/portada/index.htm ## 0 ##http://www.infobae.com ## 0 ##http://www.pagina12.com.ar/diario/principal/index-2008-05-02.html ## 0 ##http://www.cronica.com.ar/ ## 0 ##http://www.perfil.com/
El coloreado es cortesía de M-x htmlize-buffer, y el M-x python-mode con el M-x python-send-region ta más bueno que M-x comer-asado-en-cueros.