Puede escribir una pieza de software para:
- Tome las palabras clave de la expresión regular;
- Busca en Google las palabras clave y obtén una lista de resultados;
- Rastrear cada URI resultante y filtrarlo con una expresión regular completa.
Estudiemos un caso: desde site:gog.com
encontrar todos los juegos que tienen voz en off en español.
La expresión regular es:
Audio[^:]*:[^.,]*Spanish
Deberá coincidir, por ejemplo:
Audio lanuage: English, German, Spanish, French.
Y no coincide:
Audio language: only-English. Text language: Spanish.
Paso 1. Deje que su software busque esto en Google:
site:gog.com audio Spanish inurl:game
inurl:game
aquí significa solo buscar en las páginas de descripción del juego
Paso 2. Obtenga los 300 enlaces resultantes y acceda a cada uno de ellos.
Paso 3. Filtra el resultado con la expresión regular dada:
Audio[^:]*:[^.,]*Spanish
Esto debería ser fácil de construir. De hecho, no entiendo por qué no pude encontrar algo que ya está construido de esa manera.
Dado que los motores de búsqueda no pueden permitirse el recurso de escanear sus datos con expresión regular, este trabajo sucio cae de su parte, y su computadora debería hacerlo con lo que los motores de búsqueda ya proporcionan.