Archive for October, 2007

suplemental index ratio

Thursday, October 25th, 2007

Hace algunos meses, Google decidió “eliminar” la posibilidad de saber que páginas estaban en el indice suplementario.  Esto, según Matt Cutts, estaba generando demasiado ruido y tenia a los webmasters demasiado pendientes :-)

Aunque es cierto que ya no podemos obtener el listado por parte de Google de las páginas en dicho índice, si que podemos calcular el ratio de documentos dentro de él.

La idea es la siguinte:

Total Documentos indexados = http://www.google.com/search?q=site%3Adominio_a_analizar.com&filter=0

Muestra los documentos indexados por Google (indice principal + suplementario)

Total Documentos en el índice principal =  http://www.google.com/search?q=site%3Adomain+-inallurl%3Adominio _a_analizar.com&filter=0

Muestra lo documentos en el índice principal

Para calcular el ratio (porcentaje) o simplemente saber la cantidad de documentos suplementarios… solo tenemos que realizar una resta:

Documentos en el índice suplementario = Total Documentos indexados - Total Documentos en el índice principal

No tengo todavía ninguna solución para saber el detalle de las páginas (lógicamente, es lo que Google desactivó) pero si os puedo sugerir una aplicación que os puede ayudar…

Share and Enjoy: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google
  • Live
  • MisterWong
  • MisterWong.DE
  • Technorati

Google SiteLinks

Sunday, October 21st, 2007

Los SiteLinks son enlaces que Google selecciona de manera algorítmica y que aparecen como entradas adicionales en algunos resultados de búsqueda (SERPs).

sitelinks1

En contra de lo que mucha gente piensa, no es ninguna selección manual por parte de Google, y pretende colocar enlaces importantes (importantes según Google) relacionados.

En general, estos enlaces aparecen en búsquedas de branding o de marcas en particular, aunque no son solo estas las que presentan este comportamiento (no está muy claro el critério de selección, aunque el de branding generalmente siempre contiene resultados de este tipo).

Por ejemplo: cuando alguien busca el concepto “emagister”, aparecen debajo del primer resultado:

image

Muchos son los que todavía estan preguntandose como controlar este comportamiento, dejadme decir, sin demasiado éxito.

Pues bién: Google anunció el pasado 18 de Octubre la posibilidad de “controlar” que enlaces aparecen en estas busquedas. Controlar no se si es exactamente la mejor palabra (puesto que solo permiten “bloquear” los que a juicio de cada uno no sean adecuados).

No es posible añadir SiteLinks. Solo es posible bloquear los que no tengan sentido.

Al acceder a las “webmaster tools” hay una sección nueva llamada “Vinculos de Sitios” (dentro de Vínculos). En ella es posible controlar los SiteLinks:

image

No todos los webmasters podrán utilizar esta nueva utilidad: Solo podrán usarla los que tengan asociados SiteLinks por parte de Google.

Una buena iniciativa que permite mejorar la calidad de estos enlaces !!

Share and Enjoy: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google
  • Live
  • MisterWong
  • MisterWong.DE
  • Technorati

MSN / LiveSearch augmenta la capacidad de su indice

Sunday, October 14th, 2007

Todos los que llevamos tiempo en esto de los buscadores, conocíamos el hecho de que MSN no era capaz de crawlear sites con volúmenes grandes de información.

De hecho, tenían un gran problema con el tamaño de sus índices. Lo que yo nunca he podido entender es como no lo han solventado hasta dia de hoy.

Estamos hablando de poner simlemente mas servidores, o de rehacer su crawler (de hecho, solo ellos saben cuál era el problema de raiz).

Da lo mismo que solución han adoptado pero ¿ No os suena kafkiano que todo un Microsoft haya estado mas de 2 años con este problema y no lo haya resuelto hasta hoy ?

A mi la verdad es que si :-)

Dicho esto, vale la pena aplicar el tópico de toda la vida: Mas vale tarde que nunca !! Y mas en este caso.

El hecho es que hoy, he recibido un email de Ismael El-Qudsi Saugar (responsable de temas de indexación en Microsoft-MSN-LiveSearch España) indicando que ya habían solventado este problema.

Ismael ha estado lidiando con multitud de SEO’s / Proyectos durante este tiempo, y la verdad es que parece que nada podía hacer: Los temas de MSN se tratan desde Estados Unidos y son ellos los que deciden que tipo de ampliaciones/mejoras se realizan en la plataforma mundial.

Visto esto, es bastante sensato pensar que, de algún modo, no dan ningún tipo de importáncia al mercado Español… puesto que este problema parece estar resuelto en estados unidos hace ya mas de 1 año.

Ismael ha confirmado que esto no es asi. Lo ha adjuntado como comentario al post, pero me parece justo adjuntarlo aqui para clarificarlo.

  1. Ismael El-Qudsi Says:
    Pues me alegro doblemente de que la gente note mejoras en la relevancia.
    Yo creo que aun nos falta un ultimo esfuerzo pero todo apunta a que con humildad vamos por el buen camino.Lo que si esta mas potenciado en EEUU son los distintos verticales: tenemos un vertical de Salud, Entretenimiento, etc.. y por ejemplo estan lanzados los Mapas o el buscador de Video, pero el aumento de indice, perdona que insista, es algo global.

    saludos

Os adjunto algunos datos:

(Fuente, como no, www.emagister.com)

Páginas indexadas ANTES: Alrededor de 6.000

Páginas indexadas DESPUÉS: Alrededor de 120.000

Una imágen, en este caso mas, vale mas que 1000 palabras:

image

A parte de este gran salto en cuanto a “capacidad” (logicamente, si pretenden competir con Google van bastante tarde), lo que si tengo que decir es que la calidad de los resultados es muy, muy buena.

Vamos a seguir el tema de cerca, pero parece que tenemos un tercer “player” en España y que ahora si… dedicarán los recursos necesarios para “intentar” competir con el todopoderoso “Google” y el tercero en discordia (Yahoo).

Solo recordaros que, MSN ya era el segundo buscador en España (en cuanto a volúmen de busquedas se refiere)…

audiencia_busquedas

y con esta ampliación creo que se van a distanciar aún mas.

En fin, mediremos la volución… y os mantendré informados si denotamos cambios significativos…

Hasta el momento: Empezad a revisar vuestro posicionamiento en MSN/LiveSearch !!

Share and Enjoy: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google
  • Live
  • MisterWong
  • MisterWong.DE
  • Technorati

meta tag robots

Saturday, October 13th, 2007

Una de las maneras mas efectivas de controlar los robots, es mediante el archivo de robots o el uso del “meta tag robots”.

El “Robots meta tag” es un mecanismo sencillo que permite controlar a los robots cuando visitan a una página (ya sea para que no indexen el contenido de la misma, o para que no tengan en cuenta los links que encuentre).

Al igual que otros metas, se debe colocar dentro de la sección “HEAD” del documento.

La sintaxis formal para el”Robots meta tag” es la siguiente:

content = all | none | directives
all = "ALL"
none = "NONE"
directives = directive ["," directives]
directive = index | follow
index = "INDEX" | "NOINDEX"
follow = "FOLLOW" | "NOFOLLOW"
Obviamente, se debe evitar especificar directivas contrárias tales como:
<meta name="robots" content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">
Algunos ejemplos:
<meta name="robots" content="index,follow">
--> Indexa el contenido, y sigue todos links dentro del mismo
<meta name="robots" content="noindex,follow">
--> NO indexa el contenido, pero sigue los enlaces
<meta name="robots" content="index,nofollow">
--> Indexa el contenido, pero no sigue los enlaces
<meta name="robots" content="noindex,nofollow">
--> No indexa el contenido y tampoco indexa los enlaces.
Algunas equivaléncias:
  1. ALL == index,follow
  2. NONE == noindex,nofollow

En fin, espero que os sea útil :-)




Share and Enjoy: These icons link to social bookmarking sites where readers can share and discover new web pages.
  • Digg
  • Sphinn
  • del.icio.us
  • Facebook
  • Mixx
  • Google
  • Live
  • MisterWong
  • MisterWong.DE
  • Technorati