Tengo una cadena HTML y quiero saber si una palabra que proporciono es relevante en esa cadena.
La relevancia podría medirse según la frecuencia en el texto.
Un ejemplo para ilustrar mi problema:
this is an awesome bike store
bikes can be purchased online.
the bikes we own rock.
check out our bike store now
Ahora quiero probar algunas otras palabras:
bike repairs
dog poo
bike repairs
debe marcarse como relevante, mientras dog poo
que no debe marcarse como relevante.
Preguntas:
- ¿Como se puede hacer esto?
- Cómo filtrar palabras ambiguas como
in
oor
Gracias por tus ideas!
Supongo que es algo que Google hace para descubrir qué palabras clave son relevantes para un sitio web. Básicamente estoy tratando de reproducir sus clasificaciones en la página.