¿Hay alguna manera de filtrar las tablas de Wikipedia?


12

Estoy buscando una forma de filtrar las tablas que se encuentran a menudo en los artículos de Wikipedia, para poder comparar solo las filas (y columnas) que me interesan.

¿Hay alguna

  1. una función incorporada en el motor de Wikipedia que no conozco
  2. o un complemento de navegador que admita esto

Las características que puedo pensar son:

  • Filtrar por valor de columna
  • Ocultar columnas
  • Clasificación multinivel

Ahhh ... el campo minado fuera de tema. Ver punto 3 en la primera tabla. Estoy pidiendo algo específico para Wikipedia. De hecho, una secuencia de comandos de Greasemonkey funcionaría, pero no he podido encontrar una
pez globo

Respuestas:


8

Si coloca esta fórmula en una celda dentro de Google Sheet, eliminará los datos tabulares de este enlace del artículo de Wikipedia: http://en.wikipedia.org/wiki/Demographics_of_India

=IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India", "table", 4)

Una vez que tenga los datos dentro de Google Sheet, puede filtrar por valor de columna (seleccione el encabezado de la columna, elija Filtrar del menú Datos ) y oculte la columna (seleccione la columna, elija Ocultar columna del menú contextual)

Captura de pantalla de Hojas de cálculo de Google


1

¿Mesas? ¿Te refieres a los cuadros de información? Probablemente debería usar Wikidata http://wikidata.org/w/api.php y extraer la información de allí (será más limpia), luego presentarla como prefiera.

De lo contrario, puede rociar en display: nonetodas partes IDs y clases apropiadas para las tablas en cuestión, pero será una búsqueda interminable de información no estructurada.


1

El script de la tabla de Wikipedia Greasemonkey hace lo que quieres:

Resumen del script: filtra las tablas de Wikipedia eliminando todas las filas que tienen un valor no deseado o eliminando ciertas filas y columnas.

Es posible que deba agregar la httpsversión de la URL de wikiedia a la lista de filtros de páginas incluidas en el script para que funcione.

Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.