¿Hay alguna forma de buscar en Google usando expresiones regulares (regex)?


60

Sería muy útil si Google proporcionara una búsqueda de expresiones regulares .

¿Hay alguna forma de hacer esto?

(OBS: no estoy hablando acerca de las expresiones regulares falsos como site:, filetype:, AND, ORo "Text". Me gustaría buscar con una expresión regular como .+[]^).

Por ejemplo, ¿hay una aplicación, un sitio o una herramienta de Google para buscar cosas como *.stackexchange?

Respuestas:


24

Esta función no está disponible en la Búsqueda clásica de Google y no está en la hoja de ruta de Google. Puede obtener más información sobre este tema viendo el video de Google ¿Implementará Google la capacidad de buscar con expresiones regulares?

Sin embargo, hay una excepción. Google Code Search admite expresiones regulares. Por supuesto, el objetivo de búsqueda para este motor de búsqueda de temas se reduce solo al código fuente.

Vale la pena mencionar que algunas palabras clave de búsqueda de Google pueden reemplazar parcialmente las expresiones regulares. Por ejemplo, si desea buscar cualquier variación de dos palabras de "término de búsqueda", puede usar el operador comodín.

search *

encontrará resultados para la búsqueda y cualquier otra (una) palabra. A menudo lo uso para verificar reglas básicas de gramática inglesa o sinónimos (por ejemplo, "tan fácil como *" ).


2
Google Code Search ya no existe , pero puede haber alternativas (no es que sea relevante para esta pregunta)
musefan

Esta respuesta ahora está algo desactualizada: vea esta respuesta, por ejemplo, de las búsquedas de expresiones regulares de Google.
Anderson Green

11

La Búsqueda de Google puede devolver las coincidencias de algunas expresiones regulares simples. Por ejemplo, la consulta de búsqueda

"(gray|red) (wolf|fox)"

parece ser equivalente a

("gray wolf" OR "red fox" OR "red wolf" OR "gray fox")

Puede ver el resultado de esta consulta de búsqueda aquí .


Estoy buscando un medicamento o nombre químico. Puedo leer "heme? Llnate", donde los signos de interrogación son ilegibles. Google no puede ayudar.
SDsolar

7

SymbolHound tiene una búsqueda de repositorio de código fuente abierto , similar a la opción de búsqueda de código de Google ahora descontinuada, además de una búsqueda web que incluye símbolos que indexa sitios relacionados con la programación como Stackoverflow.


1
Si está afiliado a SymbolHound, ¿puede indicarlo en su perfil? ¡Gracias!
codingbadger

5

Puede escribir una pieza de software para:

  1. Tome las palabras clave de la expresión regular;
  2. Busca en Google las palabras clave y obtén una lista de resultados;
  3. Rastrear cada URI resultante y filtrarlo con una expresión regular completa.

Estudiemos un caso: desde site:gog.comencontrar todos los juegos que tienen voz en off en español.

La expresión regular es:

Audio[^:]*:[^.,]*Spanish

Deberá coincidir, por ejemplo:

Audio lanuage: English, German, Spanish, French.

Y no coincide:

Audio language: only-English. Text language: Spanish.

Paso 1. Deje que su software busque esto en Google:

site:gog.com audio Spanish inurl:game

inurl:game aquí significa solo buscar en las páginas de descripción del juego

Paso 2. Obtenga los 300 enlaces resultantes y acceda a cada uno de ellos.

Paso 3. Filtra el resultado con la expresión regular dada:

Audio[^:]*:[^.,]*Spanish

Esto debería ser fácil de construir. De hecho, no entiendo por qué no pude encontrar algo que ya está construido de esa manera.

Dado que los motores de búsqueda no pueden permitirse el recurso de escanear sus datos con expresión regular, este trabajo sucio cae de su parte, y su computadora debería hacerlo con lo que los motores de búsqueda ya proporcionan.


+1. Muchas gracias. Esta es una idea muy interesante, de hecho. El principal problema es que probablemente necesitemos clústeres de alto rendimiento para hacer algo realmente interesante.
GarouDan

Je, estoy escribiendo esta extensión ahora mismo.
Navin

4

No, desafortunadamente no :(. En teoría, podrías hacer tu propio motor de búsqueda y hacerlo, pero eso sería bastante difícil.


1

Solo como referencia, la ayuda de Google sobre los operadores de búsqueda está aquí .

Curiosamente, "-" sigue siendo un operador para la exclusión de palabras, pero eliminaron "+" como operador, utilizado en el pasado para requerir un término de búsqueda dado. Aparentemente, "el operador + se retiró cuando se lanzó Google+, porque se necesitaba + como un personaje de búsqueda en lugar de un operador". ( Https://support.google.com/websearch/answer/2466433 )




-3

Si conoce VBA, puede escribir un código para obtener datos de la web a Excel. Ejecuto el programa día y noche y puedo obtener millones de resultados. Después de eso, puede filtrar de esos resultados.


2
oh, dios ... perdona nuestros pecados
beppe9000
Al usar nuestro sitio, usted reconoce que ha leído y comprende nuestra Política de Cookies y Política de Privacidad.
Licensed under cc by-sa 3.0 with attribution required.