Tengo una cadena que se parece a eso:
6Â 918Â 417Â 712
La forma clara de recortar esta cadena (como entiendo Python) es simplemente decir que la cadena está en una variable llamada s
, obtenemos:
s.replace('Â ', '')
Eso debería hacer el truco. Pero, por supuesto, se queja de que el carácter no ASCII del '\xc2'
archivo blabla.py no está codificado.
Nunca pude entender cómo cambiar entre diferentes codificaciones.
Aquí está el código, realmente es el mismo que el anterior, pero ahora está en contexto. El archivo se guarda como UTF-8 en el bloc de notas y tiene el siguiente encabezado:
#!/usr/bin/python2.4
# -*- coding: utf-8 -*-
El código:
f = urllib.urlopen(url)
soup = BeautifulSoup(f)
s = soup.find('div', {'id':'main_count'})
#making a print 's' here goes well. it shows 6Â 918Â 417Â 712
s.replace('Â ','')
save_main_count(s)
No llega más allá de s.replace
...
u