Esta es una fácil. La densidad de palabras clave es un mito. Al menos lo es ahora.
Es importante tener en cuenta cómo se usan los términos y no cuántas veces se usan los términos. A los SEO les gusta confundir intencionalmente el problema para mantenerlo dependiente de ellos y pagar por herramientas y consejos. PT Barnum solía decir que cada minuto nace un tonto . En SEO, el espectáculo secundario parece ser todo el consejo en línea. Más triste aún, los SEO se mueven más lentamente que PageRank, que es mucho más lento que el pasto que crece en el Sahara. No salen de los viejos conceptos fácilmente, incluso cuando estaban completamente equivocados, para empezar.
Este es un mini tutorial sobre cómo se ponderan los términos en un sitio. No es una explicación completa de ninguna manera, sino una ilustración. Es un viaje que vale la pena realizar para comprender mejor cómo funciona el SEO.
Antes de sopesar los términos y temas del sitio utilizando la semántica, la ponderación de las palabras clave se utilizó utilizando algunos indicadores, incluido el uso y la colocación de términos en etiquetas como title
etiquetas, etiquetas de encabezado,description
metaetiquetas, así como la proximidad entre sí y las etiquetas importantes, y otras indicaciones de importancia, etc. Una parte de la importancia indicativa fue el uso de términos, sinónimos, términos complementarios y cuán prominentes parecían ser estos términos. Esto sigue un poco la noción de densidad de palabras clave, y tenga en cuenta que las proporciones de términos se aplicaron para determinar un tema de página, sin embargo, no fueron las proporciones altas o bajas de términos, sino una relación que eliminaría efectivamente términos comunes, términos repetitivos, antinaturales uso de términos y términos que simplemente no tienen valor por falta de uso, etc. Estas relaciones de términos se evaluaron automáticamente página por página y los resultados coincidieron con los cálculos que determinan si los resultados estaban dentro de un ámbito operativo. Cuando todo estuvo dicho y hecho, los términos determinaron el tema y el alcance del tema utilizando la semántica descrita más adelante. Pero la densidad no mostró ninguna restricción en el rango de búsqueda per se ', sino más bien el tema y la intención de búsqueda correspondiente. El efecto secundario es la coincidencia en términos de cierta densidad por casualidad, ya que los mismos términos se ajustan a un perfil determinado a través de enlaces semánticos y se usaron para determinar la intención de búsqueda. Esto siguió el modelo del analizador que en parte todavía existe, pero no es el modelo completo. Ya no.
La semántica es el modelo principal hoy en día, aunque debido a que la web sigue un modelo de texto tradicional, el modelo del analizador no puede descartarse por completo. La razón de esto es simple. Todavía se aplica y tiene sentido y es muy útil.
La semántica se puede describir como "emparejamiento relacional", aunque para algunos modelos semánticos más complejos, realmente se está hablando de "cadenas relacionales". Esto se conoce como enlaces semánticos y la relación entre enlaces semánticos se conoce como la web semántica que no tiene nada que ver con la red mundial, excepto que uno es útil para el otro. Para mi ilustración, lo mantendré en pares simples, aunque la semántica se vuelve bastante complicada bastante rápido. Entonces, para mi ilustración, simplificaré demasiado las cosas.
El emparejamiento relacional es la simple noción de trillizos; el sujeto, el predicado y el objeto. El predicado puede ser cualquier cosa siempre que sea representativo entre el sujeto y el objeto.
Me desviaré a un primer modelo de PageRank. Por favor quédate conmigo. Aplica.
Cuando se concibió Google, la noción de rango de página era una representación bastante simple de las redes de confianza que utilizan la semántica. Se crea un enlace de una página a otra. En este caso:
Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com
Subject: exampleb.com
Predicate: trusts
Object: examplec.com
Read as: exampleb.com trusts examplec.com therfore examplea.com trusts examplec.com
Si bien sabemos que la cláusula "por lo tanto" anterior no es necesariamente cierta, este fue el modelo inicial y aún es cierto, aunque no del todo cierto. Sabemos que examplea.com puede no tener conocimiento de examplec.com y por lo tanto no puede confiar completamente en examplec.com. Aún así, existe una relación que debe tenerse en cuenta.
El uso temprano del término PageRank se calculó página por página, enlace por enlace, pero se aplicó a todo el sitio. Por ejemplob.com, ¿cuántos enlaces de confianza existen? PageRank fue un cálculo bastante simple de los enlaces a las páginas de un sitio. Pero había problemas obvios con esto. Se pueden hacer enlaces para inflar artificialmente la importancia de un sitio. El cálculo contenía una tasa de descomposición bastante estándar que podría corregir esto, sin embargo, la tasa de descomposición por sí sola planteaba nuevos problemas, ya que ninguna tasa de descomposición puede explicar completamente el valor real, ya que su inclinación natural es tener una curva en su cálculo.
Utilizando aún más el modelo de confianza, los dominios se ponderaron en función de factores que indicaban confianza. Por ejemplo, la métrica de mayor confianza es la edad del sitio. Los sitios más antiguos generalmente son confiables Los sitios con registro consistente, dirección IP consistente, registrador de calidad, red de calidad (host), no tienen un historial de spam, pornografía, phishing, etc., todo indica confianza. Cuento más de 50 factores de confianza de dominio, así que los omitiré y seguiré siendo simple.
Subject: examplea.com
Predicate: domain trust score
Object: 67
Subject: exampleb.com
Predicate: domain trust score
Object: 54
Subject: examplea.com
Predicate: trusts
Object: exampleb.com
Read as: examplea.com trusts exampleb.com
Usando otro cálculo, se puede lograr cierto nivel de confianza y no solo un sitio binario confía en otro . Donde el primer ejemplo pasó confianza, el segundo ejemplo pasa un valor de confianza proporcional en cómo se calcula.
Ahora, comprenda que el PageRank se calcula página por página y TrustRank es una porción mayoritaria de SiteRank de la cual los enlaces, la calidad del enlace y el valor del enlace juegan un papel, aunque mucho menos importante de lo que era originalmente y mucho menos que el puntaje de confianza del sitio . Mantén esto en mente.
¿Cómo se aplica esto a las palabras clave en una página?
Todos los términos de contenido están ponderados, sin embargo, solo algunos términos de etiquetas están ponderados. Un ejemplo principal es la keywords
metaetiqueta. Todos sabemos que no hay peso para los términos dentro de esta etiqueta. De hecho, se ignora por completo. Una idea errónea es que la description
metaetiqueta no cuenta para SEO. Esto no es verdad. Para los términos dentro de esta etiqueta, hay peso, sin embargo, es relativamente bajo. La metaetiqueta de descripción tiene valor. Entenderás por qué en un momento.
El antiguo modelo de analizador todavía tiene valor. En esto, la página se lee de arriba a abajo y las etiquetas y los bloques de contenido se leen y se ponderan utilizando valores que miden la importancia siguiendo un modelo de arriba a abajo. Algunas métricas son estáticas. Por ejemplo, la title
etiqueta tendrá una puntuación de importancia más alta que la h1
etiqueta, que será más alta que cualquier h2
etiqueta, etc. La description
metaetiqueta tendrá una métrica de importancia que es bastante alta. ¿Por qué? Porque sigue siendo un indicador importante de lo que trata la página. Sin embargo, los términos que se encuentran en la etiqueta tienen poco peso. Esto se hace para que las coincidencias de intención de búsqueda coincidan con la description
metaetiqueta casi tan fácilmente como una title
etiqueta y unh1
etiqueta, pero no se puede manipular demasiado para jugar con el sistema. Tenga en cuenta que hay condiciones que pueden aplicarse. Por ejemplo, una búsqueda no coincidirá con la description
metaetiqueta sin coincidir en otro lugar principalmente con la title
etiqueta o h1
etiqueta o dentro del contenido.
Continuando con el modelo del analizador, imagine un punto al comienzo del contenido real. La proximidad es una medida que se usa de varias maneras. Una es donde un término, etiqueta, bloque de contenido, etc. está en relación con ese punto al comienzo del contenido. Ahora piense en las etiquetas de encabezado como indicaciones de subtemas e imagine un punto al comienzo del contenido inmediatamente después de que la siguiente etiqueta de encabezado termine una etiqueta de encabezado. De nuevo se mide la proximidad. La proximidad se mide entre términos en un párrafo, conjuntos de párrafos,header
etiquetas, etc. Estas medidas se calculan como el peso de los términos en cómo se usan y su aparente importancia. Más allá de esto, los términos, frases, citas y, de hecho, cualquier porción similar de contenido se pueden medir entre páginas y sitios utilizando un modelo de proximidad ligeramente diferente pero aún similar.
Las páginas se relacionan utilizando enlaces de una página a otra y la proximidad desde la página de inicio o cualquier otra página donde se pueda determinar una nube de relación. Por ejemplo, una página de tema en SEO puede tener enlaces a varias páginas de subtemas de SEO. Esto indicaría que la página de temas para SEO es importante ya que enlaza con varias páginas de temas similares y se puede determinar una nube de relaciones. Entonces, para cualquier página de subtemas de SEO, la proximidad sería un recuento de los enlaces entre la página de temas de SEO y la página de subtemas de SEO, así como el número de enlaces desde la página de inicio. En esto, se puede calcular la importancia de una página. ¿Qué tan importante es la página de temas de SEO? Es un enlace de los enlaces de navegación en la página de inicio y, de hecho, cada página, muy importante. Sin embargo, las páginas de subtemas de SEO no tienen enlaces desde la navegación y, por lo tanto, adquieren importancia a partir de la métrica para la página de temas de SEO. Esto sigue el modelo de Red de confianza de enlace semántico de PageRank.
Volviendo al modelo original de PageRank, puede valorar las páginas en la forma en que se vincula a ellas, así como los enlaces transmiten valor a través de la red mundial. Esto se llama escultura, aunque se puede determinar e ignorar la escultura manipuladora excesiva, así que sea natural. Mientras hace esto, también indica la importancia de los términos que se encuentran en estas páginas. Por lo tanto, cualquier término en cualquier página no solo se pondera en dónde y cómo se usan en esa página, sino también en la importancia aparente de la página en cómo y dónde existe en su sitio. ¿Está empezando a tener sentido?
Bueno. Bien y bien, pero ¿cómo se relacionan los términos y cómo ayuda la semántica con esto? Nuevamente, manteniéndolo muy simple.
Tengo un sitio sobre autos. Estás en el Reino Unido y tienes un sitio sobre automóviles. Es bastante obvio que los automóviles y los automóviles son la misma palabra. Los motores de búsqueda utilizan un diccionario para comprender mejor las relaciones entre palabras y temas. Google se diferencia al crear un diccionario de autoaprendizaje desde el principio. No voy a entrar en eso, pero igual entenderás. Usando semántica:
Subject: cars
Predicate: equals
Object: automobiles
En esto, Google puede darse cuenta de que mi sitio y su sitio son casi lo mismo. Dando un paso más allá.
Subject: car
Predicate: is painted
Object: dark red
Subject: automobile
Predicate: is painted
Object: maroon
Subject: deep red
Predicate: equals
Object: maroon
Suponiendo por un momento que solo existen estos dos sitios, cualquier búsqueda de automóvil de color rojo intenso podría dar como resultado un automóvil marrón y un automóvil de color rojo intenso a pesar de que el automóvil de color rojo intenso no existe en la web.
En los primeros días del SEO, se recomendaba utilizar sinónimos y versiones plurales de términos. Esto fue cuando la semántica no se usó o no era tan fuerte. Hoy, puede ver que esto no es necesario ya que las relaciones entre palabras y uso se mantienen en una base de datos semántica.
Usando el mismo modelo pero avanzando un poco, si escribo una pieza brillante que se cita en varias otras páginas web, la semántica puede notar esto como una cita y atribuir esto a mi trabajo original dándole mucha más importancia incluso sin enlaces a mi página en absoluto. En esto, una página sin enlaces entrantes (atrás) puede superar a una página con un gran número de enlaces entrantes (atrás) simplemente por una cita. Las citas son una parte importante de la aplicación de la web semántica a la red mundial. De hecho, mientras los SEO perseguían al alusivo AuthorRank, no existía tal cosa. Todo fue coincidencia semántica y de pares de datos en lo que no voy a entrar pero para decir que, por ejemplo, escrito por podría indicar que el nombre del autor sigue inmediatamente y, por lo tanto, se puede aplicar un crédito de citación al autor si la pieza fue citada.
¿Por qué pasé por todo esto?
Para que pueda ver fácilmente, el mecanismo detrás de la valoración de cualquier término en un sitio es mucho más complicado y ya no depende de la densidad, que nunca fue el caso de todos modos. De hecho, la densidad ya no es un efecto secundario en absoluto. La razón de esto es simple. Se jugaba fácilmente y ninguna tasa de descomposición podría compensar el juego como en el esquema original del PageRank.
En cuanto a cualquier sitio relleno de palabras clave, es solo cuestión de tiempo antes de que la semántica los regale. Panda comenzó como una tarea periódica diseñada específicamente para medir esta y otras cosas similares y ajustar las métricas para disminuir los efectos de un sitio ofensivo en los SERP. Si bien el SiteRank generalmente se mantiene igual, cualquier sitio que se encuentre con spam recibirá un golpe en el puntaje de TrustRank al haber tenido una violación, lo que degradará ligeramente el SiteRank. Creo que hay un componente de gravedad en este mecanismo que permite corregir delitos menores sin causar daños. Este golpe se mantiene incluso cuando se resuelve el problema. Esto se debe a que la violación se retiene en el historial de los sitios. Entonces, lo que sucede es que la ubicación de SERP caerá hasta que se resuelva el problema en el que la ubicación de SERP comenzará a elevarse nuevamente, pero nunca al nivel que el sitio infractor una vez tuvo debido a la notación de la violación. Cuanto más vieja se hace una violación, más se perdona permitiendo que una ofensa anterior pierda su efecto negativo con el tiempo. Como nota, si bien se dice que Panda y otros se ejecutan con más frecuencia y que hoy soy un proceso continuo, todavía se necesita tiempo para construir el mapa de enlace semántico para saber si un sitio es un delincuente. Esto significa que un sitio se saldrá con la suya por un período, pero al final fracasará una vez que los enlaces semánticos y las métricas estén completamente establecidas. Además, estoy seguro de que hay un efecto inicial para el relleno, pero disminuye enormemente con el modelo semántico y el efecto es bastante superficial como producto secundario. Esto se debe a que cuando se descubre una página, hay poco para continuar hasta que se completen los mapas de enlaces semánticos. Google, en su sabiduría, permite un poco de gracia, lo que permite que la página se clasifique alto para los términos dentro de las señales importantes inicialmente antes de establecerse en su ubicación adecuada en los SERP. Suponiendo que las señales coinciden con la semántica, volver a calcular la ubicación de SERP dará como resultado un cambio relativo en la forma en que se encuentra la página. De lo contrario, si las señales y la semántica no están de acuerdo, la ubicación dentro del SERP se basará en la semántica y la forma en que se encuentre la página cambiará. Es por eso que es importante enviar las señales correctas en primer lugar mediante el uso de palabras clave y etiquetas con precisión y honestidad. permite un poco de gracia, lo que permite que la página se clasifique alto para los términos dentro de las señales importantes inicialmente antes de establecerse en su ubicación adecuada en los SERP. Suponiendo que las señales coinciden con la semántica, volver a calcular la ubicación de SERP dará como resultado un cambio relativo en la forma en que se encuentra la página. De lo contrario, si las señales y la semántica no están de acuerdo, la ubicación dentro del SERP se basará en la semántica y la forma en que se encuentre la página cambiará. Es por eso que es importante enviar las señales correctas en primer lugar mediante el uso de palabras clave y etiquetas con precisión y honestidad. permite un poco de gracia, lo que permite que la página se clasifique alto para los términos dentro de las señales importantes inicialmente antes de establecerse en su ubicación adecuada en los SERP. Suponiendo que las señales coinciden con la semántica, volver a calcular la ubicación de SERP dará como resultado un cambio relativo en la forma en que se encuentra la página. De lo contrario, si las señales y la semántica no están de acuerdo, la ubicación dentro del SERP se basará en la semántica y la forma en que se encuentre la página cambiará. Es por eso que es importante enviar las señales correctas en primer lugar mediante el uso de palabras clave y etiquetas con precisión y honestidad. luego, volver a calcular la ubicación de SERP dará como resultado un cambio relativo en la forma en que se encuentra la página. De lo contrario, si las señales y la semántica no están de acuerdo, la ubicación dentro del SERP se basará en la semántica y la forma en que se encuentre la página cambiará. Es por eso que es importante enviar las señales correctas en primer lugar mediante el uso de palabras clave y etiquetas con precisión y honestidad. luego, volver a calcular la ubicación de SERP dará como resultado un cambio relativo en la forma en que se encuentra la página. De lo contrario, si las señales y la semántica no están de acuerdo, la ubicación dentro del SERP se basará en la semántica y la forma en que se encuentre la página cambiará. Es por eso que es importante enviar las señales correctas en primer lugar mediante el uso de palabras clave y etiquetas con precisión y honestidad.
[Actualizar]
Corté y pegué esta respuesta en TextRazor https://www.textrazor.com/demo y aquí hay un ejemplo. Verá la posición relativa a ese punto imaginario al comienzo del contenido y otros análisis lingüísticos en la tabla, así como las puntuaciones de los temas a la derecha. Puede hacer lo mismo cortando el texto de esta respuesta (arriba de esta actualización) y pegándolo en la página de demostración y jugando un poco. Lo animo Le dará una buena idea de cómo se procesa el contenido.