Razones por la que una web puede ser considerada Spam

Google, Microsoft, Posicionamiento, Seo, Técnicas SEO, Yahoo 0 Comentarios »

En el mundo SEO a menudo los buscadores penalizan las webs que utilizan técnicas como las que explicaba en el articulo anterior. Quiero volver a hablar sobre el tema del Spam ya que es algo que a mi personalmente me preocupa, y no soy el único, imagínese que es un SEO profesional, esta posicionando la página web de una empresa que le ha contratado y resulta baneada.. voy a intentar explicar algunas razones por las que una web puede ser considerada Spam por los buscadores.

1. El dominio

Los dominios de las webs con spam suelen ser largos y con guiones. Estos dominios contienen palabras con alto valor comercial (palabras por las que sueles recibir spam y no voy a mencionar ahora).

Los dominios utilizados para Spam son registrados por gente que tiene un gran numero de dominios, aunque tengan un gran numero de dominios la calidad de estos es baja. Estos dominios se registran para periodos cortos y no tienen antigüedad. Los dominios de baja calidad suelen utilizar extensiones baratas como .info, .cc, .us

Además muchas de las webs con spam utilizan subdominios con palabras relacionadas.

2. El contenido

Las webs “spammers” suelen mostrar excesiva publicidad. Estas webs estarán llenas de palabras con alto valor comercial. La densidad de palabras y la frecuencia de palabras en las webs de baja calidad es muy alta.

La gran mayoría utilizan contenido duplicado o contenido robado de otras páginas. Las páginas de baja calidad normalmente no tienen contenido único.

Las páginas de baja calidad no tienen una política de privacidad, un aviso de copyright o una página de contacto con una dirección completa.

3. Enlaces

Las páginas web que son utilizadas como spam tienen una gran cantidad de enlaces a otras páginas con spam o de baja calidad. Estas páginas de baja calidad nunca tienen enlaces de sitios seguros y de calidad.

4. Factores técnicos

Algunas de las webs “spammers” utilizan redirecciones (JavaScript, MetaRefresh, etc.) de páginas con contenido. Otras utilizan frames para alojar otras páginas o técnicas ilegales como texto oculto.

Si quieres que tu web sea considerada como una web limpia procura revisar estas razones.

¿Qué considera Google como SPAM?

Actualidad, Google, Seo 0 Comentarios »

Recientemente ha sido filtrado un documento de Google, en concreto de EWOQ (una aplicación en la que evaluadores revisan los resultados de búsqueda y puntúan las webs), en el podemos ver muchas cosas interesantes que os explicaré detalladamente mas adelante, pero hoy quiero enseñaros que es considerado SPAM para Google, extraído del documento citado antes.

Google Spam

Como podemos ver Google considera SPAM las webs que sean únicamente páginas de PPC (Pago por click), los dominios aparcados, las páginas duplicadas de algún sistema de afiliados, las páginas que tengan texto oculto o enlaces ocultos, páginas que sean redirecciones Javascript, páginas que únicamente tengan palabras sin sentido alguno para ser indexadas, páginas que sean solo un frame de otra página y redirecciones con un uso indebido.

Densidad de palabras, ¿un mito?

Posicionamiento, Seo, Técnicas SEO 0 Comentarios »

He encontrado un artículo muy interesante relacionado con la densidad de palabras, puedes leerlo aquí (esta en inglés).

En el se pregunta a un montón de SEO’s si consideran que los buscadores tienen en cuenta la densidad de palabras a la hora de indexar una página, y encontramos respuestas como estas:

“Como todo en internet, ha evolucionado. Pienso que el antiguo calculo de la densidad de palabras ahora se debería llamar cálculo de proximidad.

  • Si la palabra no esta en la página, no sera bien posicionada para esa palabra.
  • Si la palabra no esta en el título de la página, se complicará posicionarse bien para esa palabra.
  • Si la palabra no esta en la URL, la tarea comienza a ser difícil.
  • ¿Qué hay acerca de insertar una cabecera grande en la página con la palabra?
  • ¿Y acerca de escribir en la parte superior de la página o estratégicamente posicionada en ella?
  • ¿”Densidad offline”? Los anclajes son otro tipo de densidad.”

Los buscadores modernos nunca han usado la densidad de palabras

La densidad de palabras es un concepto sobrevalorado

“Parece común y lógico que en un documento que habla sobre Google se utilice la palabra Google al igual que en un documento sobre Yahoo se utilice el término Yahoo mas a menudo. También parece lógico que hay un punto en el que algo pasa de ser relevante a ser repetitivo y considerado como spam.

En otras palabras, debe conseguirse un ratio óptimo de palabras.

La idea: si estas en un cierto rango de palabras, tu página es relevante y por lo tanto tu web será bien posicionada para ese termino, bajo ese rango es irrelevante, sobre ese rango es Spam.”

Creo que ha quedado mas o menos claro que la densidad de palabras es un mito, realmente es importante tener una densidad óptima de palabras en una página, pero sobrepasar el limite puede causar un desastre, por lo tanto con una mayor densidad de palabras no te aseguras una buena posición.

Nuevo método de Google para detectar contenido duplicado.

Google, Posicionamiento, Seo, Técnicas SEO 0 Comentarios »

A Google no le gusta el contenido duplicado, eso lo sabemos todos. La razón de esto es que por ejemplo los 10 primeros resultados con palabras relevantes deben ofrecer al usuario diferentes páginas web.

Una nueva patente de Google acerca del contenido duplicado describe el nuevo método que Google intenta utilizar para ofrecer a los usuarios en las páginas de resultados las páginas mas relevantes y actualizadas.

El contenido puede ser duplicado por varias razones

Hay muchas razones por las que el contenido de un página es duplicado o algunos documentos son similares:

  1. El contenido de la página esta disponible en formatos diferentes: página web, versión para imprimir, PDF, página para móviles, etc.
  2. El contenido de una página es sindicado, por ejemplo las noticias o comentarios.
  3. Los “Content management system” (CMS) muestran el mismo contenido en distintos lugares, por ejemplo una página puede ser listada en la categoría “tamaño” y en la categoría “color”.
  4. El dueño de la web ofrece mirrors para asegurarse que su página web no queda inaccesible cuando mucha gente intenta entrar al mismo tiempo.
  5. Cualquiera roba contenido de una página web para reproducirlo en otras páginas.

Para evitar mostrar el mismo contenido mas de una vez en los resultados de la búsqueda, los buscadores intentan detectar las páginas duplicadas.

¿Qué hay en la patente?

La patente describe como Google intenta detectar el contenido duplicado e incluso el contenido similar en diferentes páginas web. Parece que Google intenta combinar distintos métodos existentes para detectar el nuevo contenido duplicado para identificar mas sitios duplicados en Internet.

Esta nueva patente muestra como se esta tomando Google en serio el tema de detectar el contenido duplicado y los problemas que este provoca en los resultados. La patente es solo el ultimo paso de Google por el intento de detectar el contenido duplicado. Por ejemplo, podemos encontrar otras patentes aquí (PDF) y aquí que son anteriores.

¿Qué hace Google cuando detecta contenido duplicado?

Es difícil decir que hará Google cuando encuentre páginas duplicadas. Muchas veces el contenido duplicado se utiliza para un uso legitimo.

Si Google solo elimina las páginas duplicadas de los resultados de búsqueda para unas ciertas palabras puede estar bien. Si Google penaliza las páginas duplicadas eliminándolas completamente del buscador, Google corre el riesgo de no ser relevante para especificas búsquedas además de la posibilidad de penalizar páginas por error.

Es probable que Google escoja la página con la mejor reputación y los mejores enlaces de entrada, si encuentra más de una página con el mismo contenido.

¿Qué significa esto para tu web?

Si quieres obtener unas buenas posiciones, sera mas fácil si utilizas contenido único. Intenta utilizar el máximo contenido original para tus páginas.

Si tu página tiene el mismo contenido que otra página, asegura que la tuya tenga mas enlaces de entrada que la página de la competencia.

Como afecta la indexación basada en frases de Yahoo! al ranking de las webs

Actualidad, Posicionamiento, Seo, Técnicas SEO, Yahoo 0 Comentarios »

Los spiders de los buscadores son cada vez mas inteligentes. Hace años se les podía engañar con las palabras en los metatags, pero los buscadores hoy en día reconocen el contenido de una página web.

Yahoo recientemente publicó una patente que nos da a conocer un poco como encuentra y evalúa las frases y palabras de las páginas web.

La patente explica como Yahoo analiza las páginas web para encontrar palabras y frases relacionadas. Yahoo analiza detalladamente el contenido de las páginas y las combina en posibles frases o palabras con un diccionario de contenido.

Cuando insertes contenido en una página web, siempre debes pensar en palabras relevantes para optimizarla y en las posibles combinaciones con esa palabra. Esto hará que los buscadores entiendan mas fácil el contenido de las palabras que utilizas en tus páginas.

De acuerdo con la patente, parece que usando palabras relacionadas con la palabra que realmente queremos posicionar ayudaremos al buscador a que encuentre la relación con la palabra relevante.

Probablemente esto ayudará a la optimización las distintas páginas de tu web si insertas términos diferentes pero relacionados con la palabra relevante. De alguna manera, enseñas a los buscadores como de relevante es tu página web con un asunto en concreto.

Webs con Pagerank 10

Actualidad, Google 0 Comentarios »

En la última actualización del Pagerank de Google que tuvo lugar el dia 26 de Febrero de 2008 hemos podido ver como no han cambiado las webs que tenian Pagerank 10. Aquí teneis el listado de las que he encontrado, creo que no hay mas.

Título de la web

Backlinks

URL

Google

2730000

http://www.google.com

Gobierno EEUU

1370000

http://www.firstgov.gov

I.T.Massachusetts

577000

http://web.mit.edu

NASA

341000

http://www.nasa.gov

Real.com

302000

http://www.real.com

Gobierno Energia EEUU

282000

http://www.energy.gov

La Casa Blanca

84100

http://www.whitehouse.gov

Macromedia

67200

http://www.macromedia.com

Adobe Systems

67200

http://www.adobe.com

National Science Foundation

35700

http://www.nsf.gov

W3.org

32700

http://www.w3.org

Además Microsoft y Yahoo continuan con Pagerank 9.

WP Theme by N.Design Studio
RSS Noticias RSS Comentarios SitemapLog in
Cerrar
E-mail It
AJAXed with AWP