Archive for the ‘Posicionamiento’ Category

Google, Subdominios y subdirectorios

Monday, December 10th, 2007

Recientemente se han publicado varias noticias relativas al cambio de algoritmo que Google ha aplicado (tema subdominios y subdirectorios).

El hecho es que hasta el momento, se han utilizado los subdominios para posicionar distintos resultados en los resultados de búsqueda (SERPs). Esto es, en lugar de tener presencia solo con un resultado para un concepto… posicionar 4 ó 5 resultados para un mismo concepto, incrementando la visibilidad drasticamente y copando las primeras posiciones.

Claramente, esta táctica ha funcionado hasta el momento… y ha sido utilizada por multitud de SEO’s algo “inconscientes”. –> el riesgo de ser baneado o penalizado era bastante “alto”.

Google en el pasado incluso ha baneado a varios sites (varios subdominios) por el hecho de utilizar este tipo de tácticas… pero no ha sido suficiente.

La decisión de Google es, a partir de ahora (hace algunos dias que se ha aplicado) es la de tratar a los subdominios como un subdirectorio cualquiera… y obviamente, limitar a 2 el numero de ocurrencias dentro de un resultado de búsqueda.

Aunque Matt aclara que si los subdominios son muy relevantes… se pueden generar excepciones.

Matt Cutts ha hablado al respecto… y os adjunto el link a su articulo (así como su articulo en si).

Vamos.. si habeis usado esta técnica… y observais una bajada de tráfico… pues ya sabeis lo que es :-)

http://www.mattcutts.com/blog/subdomains-and-subdirectories/

Towards the tail end of PubCon, I noticed a spate of articles talking about subdomains and subdirectories in Google, and I wanted to talk more about this subject in case I was unclear.

Historically, it’s been kind of a wash about when to use subdomains vs. subdirectories. Just as a reminder, in a URL such as subdomain.example.com/subdirectory/ , the subdomain is “subdomain” and the subdirectory is “subdirectory” (also sometimes called a folder). If you’re still unclear, you may want to read my tutorial on the parts of a URL.

If you throw your content into a subdirectory, usually the code is all in the same file storage space. That can make it much easier to find/edit/change code. It can also be easier to move code from one place to another. A subdomain, however, is often a domain name system (DNS) alias. Subdomains can be a little more difficult for a novice webmaster to set up, especially if words like “CNAME” don’t mean anything to you. Subdomains can be managed separately, which can be a joy (you can use DNS to decouple a subdomain if you want to migrate that part of your site) or a pain (it may be more of a hassle to juggle DNS setting instead of just using file commands to make or move directories). When I started my blog, I decided to use a subdirectory (mattcutts.com/blog/) just to keep things simple, for example.

For several years Google has used something called “host crowding,” which means that Google will show up to two results from each hostname/subdomain of a domain name. That approach works very well to show 1-2 results from a subdomain, but we did hear complaints that for some types of searches (e.g. esoteric or long-tail searches), Google could return a search page with lots of results all from one domain. In the last few weeks we changed our algorithms to make that less likely to happen in the future.

This change doesn’t apply across the board; if a particular domain is really relevant, we may still return several results from that domain. For example, with a search query like [ibm] the user probably likes/wants to see several results from ibm.com. Note that this is a pretty subtle change, and it doesn’t affect a majority of our queries. In fact, this change has been live for a couple weeks or so now and no one noticed. :) The only reason I talked about the subject at PubCon at all was because someone asked for my advice on subdomains vs. subdirectories.

My personal preference on subdomains vs. subdirectories is that I usually prefer the convenience of subdirectories for most of my content. A subdomain can be useful to separate out content that is completely different. Google uses subdomains for distinct products such news.google.com or maps.google.com, for example. If you’re a newer webmaster or SEO, I’d recommend using subdirectories until you start to feel pretty confident with the architecture of your site. At that point, you’ll be better equipped to make the right decision for your own site.

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

WebMaster tools Message Center

Saturday, December 8th, 2007

Hace ya algún tiempo que esta funcionalidad está activa en las webmaster tools… pero me ha parecido relevante hacer un artículo referente a esta funcionalidad… puesto que creo es importante que todo el mundo revise periódicamente.

Es posible que ya seais conscientes de esta funcionalidad… pero por si acaso…

El 18 de Julio del 2007 el equipo de Google lanzó dentro de la "webmaster console" el Message Center.

message center

El centro de mensajes se puede localizar en la parte superior derecha de la consola central para webmaster (webmaster console) y tiene el objetivo de mejorar la comunicación entre Google y los webmasters.

Inicialmente los mensajes son relativos a problemas con la calidad del sitio en cuestión, pero cada vez se está utilizando para comunicar mensajes de todo tipo.

Por ejemplo, recibiremos notificaciones de cambio de velocidad de Google Bot, problemas de acceso al site, …

Solicitud de modificación de la frecuencia de rastreo de http://foros.emagister.com/

7 de noviembre de 2007

El propietario del siguiente sitio web nos ha pedido que modifiquemos la frecuencia con la que Googlebot rastrea el sitio: http://foros.emagister.com/

- Frecuencia de rastreo anterior: Normal

- Frecuencia de rastreo nueva: Faster

Esta nueva frecuencia de rastreo permanecerá vigente durante 90 días.

Si bien una frecuencia de rastreo superior nos permitirá rastrear su sitio de forma más rápida, aumentará la carga de su servidor. En ese caso, puede volver a cambiar la frecuencia de rastreo:

1. En el “Escritorio”, seleccione el sitio que desee.

2. Vaya al “Escritorio” y, en “Herramientas”, haga clic en “Frecuencia de rastreo”.

Como podemos observar, El mensaje anterior notifica del cambio de frecuencia de crawleo, ofreciendo la información relevante para este evento.

Un ejemplo de violación de las "webmasters guidelines" podría ser algo como:

MessageSample

Resumiendo: Vale la pena echar un ojo periódicamente al centro de mensajes, para estar al día sobre los problemas que podemos tener… y anticiparnos a posibles situaciones "no deseadas".

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

Tipos de paginado

Sunday, December 2nd, 2007

Hace ya bastante tiempo que no escribo nada… La verdad es que voy bastante liado :-(

En esta ocasión, me ha parecido interesante escribir algo sobre los tipos de paginado mas utilizados a día de hoy.

Los mas utilizados son:

Paginado tipo "Siguiente // Anterior"

paginate_next

Paginado tipo Google (elemento pivotante y diez elementos al lado del pivote)

paginate_google

Entre ellos, como os podréis imaginar, nada que ver !!

El primero de ellos, potencia las primeras páginas. De hecho, intenta dar mas relevancia a  las 5/6 primeras, mientras que de alguna manera penaliza las restantes.

Esto significa que un elemento ubicado en la página 10 obtiene poca relevancia y por lo tanto, menos probabilidad de aparecer en los resultados de Google u otros buscadores.

Sin embargo, los elementos localizados en las primeras 5… obtienen una relevancia alta y generalmente son elementos que rankearán bien según los términos que se hayan pretendido optimizar.

El segundo tipo de paginado… obtiene una profundidad mucho mas elevada (fijaros que en el ejemplo estamos haciendo referencia a 20 páginas !!). Esto favorece una correcta distribución de PR, y además, permite indexar un numero de páginas mucho mas elevado que con el primer método.

Si tenemos en cuenta, además, que Google YA no crawlea a partir de cierto nivel… este segundo parece todavía el mas adecuado.

Nota: Si tenéis el primer tipo… intentad encontrar la página 25 en el índice de google :-) y mandarme una foto con la cara que se os quedará :-)

En este primer ejemplo que os he adjuntado: Páginas por encima de la 11 no son indexadas por Google :-)

De todos modos… hay que seleccionar el método y pensar muy bien el porque se selecciona uno u otro.

En emagister España usamos el primero, mientras que en eMagister internacional usamos el segundo. Os aseguro que está justificado :-)

Alguna experiencia al respecto ??

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

suplemental index ratio

Thursday, October 25th, 2007

Hace algunos meses, Google decidió “eliminar” la posibilidad de saber que páginas estaban en el indice suplementario.  Esto, según Matt Cutts, estaba generando demasiado ruido y tenia a los webmasters demasiado pendientes :-)

Aunque es cierto que ya no podemos obtener el listado por parte de Google de las páginas en dicho índice, si que podemos calcular el ratio de documentos dentro de él.

La idea es la siguinte:

Total Documentos indexados = http://www.google.com/search?q=site%3Adominio_a_analizar.com&filter=0

Muestra los documentos indexados por Google (indice principal + suplementario)

Total Documentos en el índice principal =  http://www.google.com/search?q=site%3Adomain+-inallurl%3Adominio _a_analizar.com&filter=0

Muestra lo documentos en el índice principal

Para calcular el ratio (porcentaje) o simplemente saber la cantidad de documentos suplementarios… solo tenemos que realizar una resta:

Documentos en el índice suplementario = Total Documentos indexados - Total Documentos en el índice principal

No tengo todavía ninguna solución para saber el detalle de las páginas (lógicamente, es lo que Google desactivó) pero si os puedo sugerir una aplicación que os puede ayudar…

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

Google SiteLinks

Sunday, October 21st, 2007

Los SiteLinks son enlaces que Google selecciona de manera algorítmica y que aparecen como entradas adicionales en algunos resultados de búsqueda (SERPs).

sitelinks1

En contra de lo que mucha gente piensa, no es ninguna selección manual por parte de Google, y pretende colocar enlaces importantes (importantes según Google) relacionados.

En general, estos enlaces aparecen en búsquedas de branding o de marcas en particular, aunque no son solo estas las que presentan este comportamiento (no está muy claro el critério de selección, aunque el de branding generalmente siempre contiene resultados de este tipo).

Por ejemplo: cuando alguien busca el concepto “emagister”, aparecen debajo del primer resultado:

image

Muchos son los que todavía estan preguntandose como controlar este comportamiento, dejadme decir, sin demasiado éxito.

Pues bién: Google anunció el pasado 18 de Octubre la posibilidad de “controlar” que enlaces aparecen en estas busquedas. Controlar no se si es exactamente la mejor palabra (puesto que solo permiten “bloquear” los que a juicio de cada uno no sean adecuados).

No es posible añadir SiteLinks. Solo es posible bloquear los que no tengan sentido.

Al acceder a las “webmaster tools” hay una sección nueva llamada “Vinculos de Sitios” (dentro de Vínculos). En ella es posible controlar los SiteLinks:

image

No todos los webmasters podrán utilizar esta nueva utilidad: Solo podrán usarla los que tengan asociados SiteLinks por parte de Google.

Una buena iniciativa que permite mejorar la calidad de estos enlaces !!

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

MSN / LiveSearch augmenta la capacidad de su indice

Sunday, October 14th, 2007

Todos los que llevamos tiempo en esto de los buscadores, conocíamos el hecho de que MSN no era capaz de crawlear sites con volúmenes grandes de información.

De hecho, tenían un gran problema con el tamaño de sus índices. Lo que yo nunca he podido entender es como no lo han solventado hasta dia de hoy.

Estamos hablando de poner simlemente mas servidores, o de rehacer su crawler (de hecho, solo ellos saben cuál era el problema de raiz).

Da lo mismo que solución han adoptado pero ¿ No os suena kafkiano que todo un Microsoft haya estado mas de 2 años con este problema y no lo haya resuelto hasta hoy ?

A mi la verdad es que si :-)

Dicho esto, vale la pena aplicar el tópico de toda la vida: Mas vale tarde que nunca !! Y mas en este caso.

El hecho es que hoy, he recibido un email de Ismael El-Qudsi Saugar (responsable de temas de indexación en Microsoft-MSN-LiveSearch España) indicando que ya habían solventado este problema.

Ismael ha estado lidiando con multitud de SEO’s / Proyectos durante este tiempo, y la verdad es que parece que nada podía hacer: Los temas de MSN se tratan desde Estados Unidos y son ellos los que deciden que tipo de ampliaciones/mejoras se realizan en la plataforma mundial.

Visto esto, es bastante sensato pensar que, de algún modo, no dan ningún tipo de importáncia al mercado Español… puesto que este problema parece estar resuelto en estados unidos hace ya mas de 1 año.

Ismael ha confirmado que esto no es asi. Lo ha adjuntado como comentario al post, pero me parece justo adjuntarlo aqui para clarificarlo.

  1. Ismael El-Qudsi Says:
    Pues me alegro doblemente de que la gente note mejoras en la relevancia.
    Yo creo que aun nos falta un ultimo esfuerzo pero todo apunta a que con humildad vamos por el buen camino.Lo que si esta mas potenciado en EEUU son los distintos verticales: tenemos un vertical de Salud, Entretenimiento, etc.. y por ejemplo estan lanzados los Mapas o el buscador de Video, pero el aumento de indice, perdona que insista, es algo global.

    saludos

Os adjunto algunos datos:

(Fuente, como no, www.emagister.com)

Páginas indexadas ANTES: Alrededor de 6.000

Páginas indexadas DESPUÉS: Alrededor de 120.000

Una imágen, en este caso mas, vale mas que 1000 palabras:

image

A parte de este gran salto en cuanto a “capacidad” (logicamente, si pretenden competir con Google van bastante tarde), lo que si tengo que decir es que la calidad de los resultados es muy, muy buena.

Vamos a seguir el tema de cerca, pero parece que tenemos un tercer “player” en España y que ahora si… dedicarán los recursos necesarios para “intentar” competir con el todopoderoso “Google” y el tercero en discordia (Yahoo).

Solo recordaros que, MSN ya era el segundo buscador en España (en cuanto a volúmen de busquedas se refiere)…

audiencia_busquedas

y con esta ampliación creo que se van a distanciar aún mas.

En fin, mediremos la volución… y os mantendré informados si denotamos cambios significativos…

Hasta el momento: Empezad a revisar vuestro posicionamiento en MSN/LiveSearch !!

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

meta tag robots

Saturday, October 13th, 2007

Una de las maneras mas efectivas de controlar los robots, es mediante el archivo de robots o el uso del “meta tag robots”.

El “Robots meta tag” es un mecanismo sencillo que permite controlar a los robots cuando visitan a una página (ya sea para que no indexen el contenido de la misma, o para que no tengan en cuenta los links que encuentre).

Al igual que otros metas, se debe colocar dentro de la sección “HEAD” del documento.

La sintaxis formal para el”Robots meta tag” es la siguiente:

content = all | none | directives
all = "ALL"
none = "NONE"
directives = directive ["," directives]
directive = index | follow
index = "INDEX" | "NOINDEX"
follow = "FOLLOW" | "NOFOLLOW"
Obviamente, se debe evitar especificar directivas contrárias tales como:
<meta name="robots" content="INDEX,NOINDEX,NOFOLLOW,FOLLOW,FOLLOW">
Algunos ejemplos:
<meta name="robots" content="index,follow">
--> Indexa el contenido, y sigue todos links dentro del mismo
<meta name="robots" content="noindex,follow">
--> NO indexa el contenido, pero sigue los enlaces
<meta name="robots" content="index,nofollow">
--> Indexa el contenido, pero no sigue los enlaces
<meta name="robots" content="noindex,nofollow">
--> No indexa el contenido y tampoco indexa los enlaces.
Algunas equivaléncias:
  1. ALL == index,follow
  2. NONE == noindex,nofollow

En fin, espero que os sea útil :-)




Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

Penalizaciones en Google

Saturday, September 29th, 2007

Aunque no hay ningúna confirmación oficial por parte de Google, se sospecha globalmente que Google utiliza filtros (o penalizaciones).

No entiendo como hay esta falta de transparéncia por su parte, pero tendremos que aceptarla :-(

Estos ultimos años, se ha ido experimentando y parece que ya están las cosas algo mas claras. (Insisto que no hay confirmación por parte de Google!!!)

En otro articulo, ya explicaba como podemos deducir si hemos sido penalizados por Google de alguna manera…

En caso afirmativo, ahora debemos determinar que tipo de filtro se nos ha aplicado.

Aqui teneis los mas relevantes:

(No traduzco nada, ya que merece la pena interpretarlo “tal cual)
Fuente: Joe White

Google Sandbox: The Sandbox Filter is usually applied to brand new websites but has been seen to be applied to domains that have been around for a while. Since most websites do not make it past a year Google implemented a filter that will prevent a new site from getting decent rankings for competitive keyword terms. Usually brand new sites can still rank for non competitive keyword terms though.

How to work around the Sandbox: Google uses a system called trust rank. The idea behind trust rank is if authority sites link to your new site then you must be an authority site as well and since Google trust’s these older more respected sites it will trust your’s as well. Hence getting you out of the sandbox right away. That is not an easy thing to do so if you are not able to get these links then try expanding your content to rank for many more less competitive keywords and keyword phrases (long tail keywords).

Google -30: This Google filter is applied to site’s who use spammy seo tactics. When Google find you using doorway pages, java redirects etc then they will drop your rankings by 30 spots.

How to get around this: If you find yourself a victim of the Google -30 filter then usually just removing the spam elements on your site will get you back in. You can always fill out a request for re-inclusion is worse comes to worse. Here are some resources for the Google -30. Arelis, Threadwatch, SERoundtable.

Google Bombing: Google Bombing is a filter applied to sites who gain a large number of inbound links with the same anchor text. This raises a red flag to Google as it is extremely unnatural for an inbound linking structure to all have the exact same anchor text.

How to work around this: If your site actually has this filter applied then most likely you have been banned from the search engines and a re-inclusion request is probably your best bet. If the filter is not applied but through your monitoring you see this potential then you might want to go back and request people change your anchor text, buy some links with varying anchor text etc. Here are some resources for Google Bombing. Search Engine Watch, NYTimes, Google Blogspot.

Google Bowling: This is not really a filter as much as it is a series of black hat techniques that will get you banned. Usually people use this term in reference to competition or a page/site they want OUT of the serps. Google bowling is usually only effective to site’s that are much new with lower trust rank. Trying to do this to a large site with high trust rank is going to be virtually impossible.

How to get around this: Google says that there is nothing a competitor can do to drop YOUR rankings. Many seo’s do not believe this and if you seoblackhat sells services for something like this. Re-inclusion request is basically your only option. Here are some resources for Google Bowling. Web Pro News, ThreadWatch and SEroundtable.

Google Duplicate Content Filter: A duplicate content filter is applied to sites who take content that has already been created, cached and indexed on other sites. News sites are usually exempt from the duplicate content filter via a hand job. Usually the pages that have this applied are not ranked very well in the serps. Page Rank can be devalued and if a page does not have inbound links you could see your results being put into omitted search results and supplemental results.

How to get through this: If you find yourself in this filter then your first step can be trying to remedy the duplicate content. Contact the person stealing your content and ask them to remove it. You can contact the persons web host to see if they will take down there site and the last resort is “trying” to contact Google and alert them of what is going on. Keep on top of your content by using copyscape to check for duplicate content.

Google Supplemental Results: Google supplemental results take pages on your site that have been indexed and put them into a sub database in Google. Supplemental results do not rank well but rather Google uses its supplemental DB to populate its results when they don’t have enough results to show in a given query. This means pages on your site in Google’s supplemental DB will not help you in the serps.

How to get through this: Its pretty simple actually. Just get some inbound links to your pages. Check this post out to find out more about the Google Poo (supplemental results).

Google Domain name Age Filter: The Google domain name age filter is closely related to trust rank and the sandbox but it is possible to be out of the sandbox and have trust rank and still be in this filter. The idea behind this filter is that older sites and domain names are more likely to rank well for keyword terms then newer sites. If you are in this filter you will most likely not rank well for terms that are competitive until your site grows older.

How to work around this: Quality links from authority sites with high trust rank will help you do much better in the serps.

Google’s Omitted Results Filter: Pages within your website that are in omitted search results will not show up in a Google search unless a user specifically says to show all omitted results. Usually users do not even get to the last page to do this which makes any page of yours that is omitted completely out of a Google search result. The reason this happens is lack on inbound links, duplicate content, duplicate meta title, duplicate meta description and poor internal linking.

How to get out of this: In order to get pages are omitted out of this filter simply alter the meta tags and fix duplicate content and get some quality inbound links.

Google’s Trust Rank Filter: Like the PageRank algorithm the trust rank algorithm has many factors that determine a sites trust rank. Some of the known factors are the age of a site, the amount of quality authority links pointing to it, how many outbound links it has, the quality of its inbound linking structure, internal linking structure and overall SEO best practices on meta and url structure. All sites go through this filter and if your Trust Rank is low so will your rankings in the serps.

How to get work with this: An old site and a new site can both have high trust rank or low trust rank. It is basically determined by the amount of quality authority links pointing to it, how many outbound links it has, the quality of its inbound linking structure, internal linking structure and overall SEO best practices on meta and url structure. Optimize these and you will have quality Trust rank.

links.htm page filter: This filter penalizes a sites ranking determined by the use of a links.html page. Using reciprocal linking is a old technique that is not promoted by Google anymore. This filter effects your ranking in the serps.

How to work with this filter: Instead of using “links” as your page title and name try using something like “mynewbuddies” or “coolsites” as this will help get around this filter. Reciprocal links are old seo techniques and Google devalues reciprocal linking structures.Here is someone discussing this at SEOChat.

Reciprocal Link Filter: Google is very open about reciprocal linking and clearly states that their algorithm can detect reciprocal link campaigns. Usually sites that only participate in reciprocal linking will have a hard time ranking in the search engines but depending on what you are using your site for a reciprocal links campaign might be exactly what you need. For example if you are building an adsense site then you do not want to spend to much time building a site up and a reciprocal linking campaign will help your sites inbound links grow over time.

How to work with this filter: When it comes to building an inbound linking structure try to utilize some or all of the 15 types of links and how to get them post I did a ways back. Here are some resources about this filter. Matt Cutts here and here, Search engine guide and Webmasterworld.

Link Farming Filter: Link farms are sites/pages that have a mass amount of unrelated links grouped together arbitrarily. Link farms can also be related links but most commonly they are unrelated. IP farms and bad link neighborhoods are all part of link farming. Being a part of a link farm can get your rankings dropped in Google and possibly get you banned.

How to get around this: Currently the only way to get around this is to NOT participate in link farming. Here are some resources on link farming:

CO-citation Linking Filter: This popular filter by Google watches your inbound link structure. If your link is on a site who’s outbound links are related to casino’s and porn sites and your automotive site is an outbound link on this site then google will think your site is related to porn and casinos. Poorly constructed co-citation will damage your ranking and make it hard for you to rank well for the terms you are targeting.

How to work with this: When considering a link partner, paid link or monitoring your inbound links be sure to follow this linking quaility guidline page that was derived from Patrick Gavin over at text link ads.

To many links at once Filter: This filter is applied when to many inbound links are acquired by a site to fast. The result can lead to a ban across all search engines. How these links are obtained, how many and over what period of time are factors for this filter.

How to get around this: Simply do not participate in black hat linking schemes and link spaming and you should never have a problem with this. Here is some information concerning this filter over at Aaron Walls at SEObook.com,

To many Pages at once filter: Google is keen on natural site development. Anything that look “unnatural” is going to be flaged by the search engines. Having to many pages to fast will raise this flag/filter. Some people believe that 5000 is the max for pages in a month but this number in my opinion can fluctuate depending on other factors and filters your site might be going through at any given time. The effect of this filter can result in pages being omitted, pages in supplemental results and in the extreme case a Google ban.

How to get through this filter: If you have a system that pulls content in or are using a dynamic content generator be sure to limit it per week and I would stay under 5000 pages per month just to be on the safe side. Depending on how large or well known your site is then the limit will be adjusted.

Broken Link Filter: Broken internal links can cause pages from not being crawled, cached and indexed. If pages like your home page do not have a link back to it on all pages this can count against you in the serps and your overall quality score for things like PR. This is not just bad seo and bad site design but this is bad for your users and can cause poor traffic and poor serp ranking.

How to get through this: Make sure you have a quality footer, a sitemap that covers all of your pages in one central hub and make sure you test your site for broken links. (be sure to use full url’s in your linking via source code).

Page Load Time Filter: The page load filter is very simple. If your website takes to long to load then a spider will time out and move past your site or page. This will result in NEVER being cached and indexed. Ultimately this means your site or page will not be present in Googles SERPS.

How to work with this: Make sure your pages are optimized for load time. Make sure if you are using flash or many images you use java pre-load coding. Make sure you limit the file size of your page’s as much as possible to make sure the spiders can read the entire document and be sure to use web 2.0 and css best practices.

Over Optimization Filter: Over optimization can cause a Google ban or hardship in rankings. Over optimization could be considered keyword stuffing, to much keyword density and keyword proximity optimization, meta tag stuffing etc. Stay away from over optimization.

How to get around this: Don’t over optimize!!!!

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

Como ser número 1 en google y otros buscadores

Saturday, September 29th, 2007

Antes de empezar quiero advertiros de que este articulo va a ser un poco largo. Reservad un buen rato para leerlo en detalle, puesto que creo que lo vais a necesitar (el tiempo me refiero :-)).

Después de tener en cuenta estas recomendaciones, no espereis ser #1 al cabo de 1 semana. Ni tan solo al cabo de meses :-) Posicionarse en Google y otros buscadores es mas dificil que aplicar unas simples recomndaciones, pero os aseguro que será un muy buen punto de partida.

Introducción

¿ Por que es necesario pensar en Google y otros motores de búsqueda cuando construimos un site ? Es una muy buena pregunta, que tiene también una muy facil respuesta.

audiencia_busquedas

En España, los buscadores mueven aproximadamente unos 15 millones de búsquedas al dia. De todos estos millones de busqudas, 14,7 millones son servidos por Google (ahora entendeis el porque del titulo de este articulo). Si bién es cierto que en otros paises (no demasiados) los “otros” tienen algo mas de presencia… en España esto es un monopolio. Google domina el mercado de buscadores.

Y es que 14,7 millones de busquedas… derivan mucho, mucho tráfico !!! Para que os hagais una idea de lo que os digo: Os adjunto un gráfico de un portal 100% basado en captar tráfico vía Google.

trafico_analytics

Impresionante verdad ?? La parte interesante es que estos son visitas únicas de Google, por lo que hablamos de aproximadamente de 450.000 Páginas vistas dia (unos 13 millones de páginas vista por mes) (por cierto: y antes de que pregunteis por ello –> Este site NO es emagister :-) he seleccionado otra fuente para confeccionar este gráfico)

Aunque parezca increible, hay miles de empresas en el mundo que tienen una dependéncia absoluta de Google. De hecho, a dia de hoy si google “cerrara”… posiblemente deberíamos reinventar internet :-)

Espero haber despertado vuestra curiosidad, y que sigais adelante con este articulo. Desde luego… merece la pena ¿ no creeis ?

Análisis de la competéncia

Pero claro: El problema aparece cuando 2 o mas competidores quieren aparecer en los resultados de búsqueda para los mismos términos :-)

Es muy importante ver como de dificil puede ser posicionarse en un nincho en cuestión ya que esto nos definirá el esfuerzo que tendremos que realizar para estar bién posicionados.

Es bueno saber a que nos enfrentamos. Además nos permitirá determinar que nivel de “agresividad” deberemos utilizar para estar donde deseamos.

Para ello existen varias técnicas y procedimientos (fuera del ámbito de este manual). De todos modos, os recomiendo que utiliceis herramientas tipo spyglass, ya que os ahorrará bastante tiempo a la hora de determinar quien y como de fuertes son los que serán vuestros vecinos en los resultados de búsqueda (SERPS)

Revisad también mi post sobre utilidades donde podreis encontrar algunos recursos de ayuda para este tipo de tareas.

Definición del “keyword Set”

Antes de nada, un poco de teoría (Top of the tail, midle of the tail, the long long tail)

tail

Hay conceptos de tráfico (conceptos de mucha demanda) y conceptos mucho mas específicos, pero que por el contrário no atraen tanto tráfico. Esto tan evidente, pero tan importante al mismo tiempo, es algo que se utiliza constantemente en el mundo del posicionamiento web.

Desde que Chris Anderson ha introducido el término “long tail” en un artículo en Wired Magazine, el concepto ha crecido rápidamente hasta una palabra muy conocida en el marketing online.

La teoría del long tail dice que hay que mirar más allá que los éxitos de venta, ya que los productos menos populares representan también gran parte de la cifra de ventas. Piense por ejemplo a la tienda de libros online de Amazon.

El principio Pareto pone que para muchos fenónomos 20% de las causas es responsable para 80% de las consecuencias. El long tail prueba que en el marketing online vale muchas veces el contrario

El concepto se basa en definir el espectro de todos los conceptos posibles dentro de distintos tipos:

Conceptos de tráfico alto (top of the tail): Asociado a la parte izquierda del gráfico. Pocos conceptos que proporcionan mucho tráfico.

Conceptos de tráfico medio (middle of the tail): Asociado a la parte media del gráfico. Muchos conceptos que proporcionan tráfico medio.

Conceptos de tráfico bajo (the long, long tail): Asociado a la parte derecha del gráfico. Infinidad de conceptos que proporcionan tráfico bajo.

Algunos ejemplos de cada segmento podrían ser:

Top of the Tail: Cursos, Formación, Java, Cisco, Oracle…

Middle of the Tail: Cursos de java, Formación en oracle, Certificaciones Cisco…

The long, long tail: Curso de java para trabajadores en barcelona, Formacion online para maestros del sector, Certificaciones oficiales Cisco en Jaén…

Como veis… Son construcciones completamente distintas, y el tráfico que aportan no tienen nada que ver.

Generalmente posicionarse en conceptos “top” es complicado (hay mucha competéncia) y suele llevar bastante tiempo. El posicionamiento en conceptos “middle” es algo mas facil (como norma general) y logicamente posicionarse por conceptos dentro del “long tail” suele ser no demasiado complicado.

Y esto me lleva al “AIDA principle”. Es importante que conozcais la idea de cara a deployar una buena estratégia SEO.

Fijaros en el siguiente gráfico:

aida_princ

El principio relaciona el tipo de concepto con el ratio de conversión asociado. Parece algo muy “trivial”, pero mucha gente no lo tiene en cuenta :-)

Simplemente:

  1. Conceptos con mucho tráfico, generalmente tienen un rati ode conversión bajo
  2. Conceptos con tráfico, tienen un bajo ratio de conversión.
  3. Conceptos con poco tráfico suelen tener unos ratios de conversión altisimos

Para explicar un poco mas graficamente lo expuesto anteriormente:

  1. Si posicionamos una landing page optimizada para trabajar “pelotas de golf de venta en barcelona”, y alguien selecciona en los SERPS está página… muy posiblemente es lo que busca –> Posibilidad de transacción alta
  2. Si posicionamos una landing page optimizada para trabajar “Golf”… y alguien aterriza
    1. Estara buscando pelotas de golf ?
    2. Estara buscado campos de golf
    3. Estara buscando profesores de golf ?

Es evidente que en el segundo escenario, el ratio de conversión será menor.

Es fundamental construirse un keyword set optimizado para trabajar el mercado en el que queramos entrar. Tenemos que ser conscientes de:

  1. Espectro de conceptos y asociarlos a la parte del tail pertinente
  2. Que tipo de transaccionabilidad generará cada uno
  3. Tenerlo siempre en mente (incluso antes de programar nada !!)

Algunas herramientas útiles para trabajar todo tipo de conceptos:

  1. Adwords Keyword Tool (Es necesaria una cuenta de Adwords)
  2. Overture Keyword Selector Tool (Free)
  3. WordTracker (De Pago)
  4. Adwords Keyword Generator 1.0 (Shareware)
  5. Tu propia imaginación :-)

Implementar una buena estratégia SEO “on site”

Hay muchos factores que determinan una buena estratégia SEO. Algunos de ellos son muy importantes, otros solo marcan “alguna” diferéncia.

Os adjunto algunos factores que, en mi opinión, son inprescindibles para ser crawleado, indexado y posicionado de la manera más óptima.

(Recordad que esto no lo es todo !! pero ayuda)

Accesibilidad

Un site accesible es aquel que asegura servir su contenido el máximo tiempo posible y de la manera mas rápida posible.

Lo ideal sería tener sites con una disponibilidad del 100% y con tiempos de respuesta inferiores a 1000ms.

La funcionalidad de las páginas, estructura del código HTML, la disponibilidad de los servidores, el rendimiento en general y la codificación del site afectan directamente a la accesibilidad.

Los problemas mas comúnes en cuanto a accesibilidad se refiere son los seguientes:

  1. Links Rotos: Si un link está roto, el crawler nunca será capaz de llegar al contenido referenciado (obviamente). Además se rumorea que los buscadores penalizan en el posicionamiento los sites con un ratio de links rotos demasiado elevado
  2. HTML / CSS Válido: Para garantizar un crawling adecuado, se recomienda que las páginas cumplan el standard W3C. Esto facilita el crawling de los buscadores. Hay que intentar quitar del código todo tipo de estilos, scripts, etc… para dejarlo tan limpio como sea posible (uso de archivos css separados, archivos javascript independientes…)
  3. Formularios: Los formularios añaden mucho volúmen al codigo, y generalmente, no es util para los buscadores. A ser posible, utilizar se deberían utilizar links en lugar de combos o estructuras de este estilo (mucho mas search engine friendly)
  4. Peso de las páginas: Con alguna excepción, páginas con un tamaño superior a 150KB no son totalmente indexadas. Además no olvidemos que páginas poco pesadas decrementan el tiempo de descarga !! Y esto le gusta mucho a Google.
  5. Caidas del servicio & Tiempo de respuesta (velocidad): Caidas en el servicio y tiempos de respuesta elevados pueden tener un impacto muy negativo en el posicionamiento (sobre todo si los problemas suceden a menudo).

URLs, Title Tags & Meta Data

Me atrevería a decir que, a parte del algoritmo, estos son los 3 conceptos mas importantes en cuanrto a posicionamiento se refiere (sin tener en cuenta el linking que es “lo mas” :-))

Estos 3 conceptos definen, identifican y diferéncian una página de otra dentro de un site. Son las entidades “atómicas” que Google utiliza para diferenciar las distintas páginas.

URL

Las urls deberían ser cortas y descriptivas. Si el site tiene categorización, esta debería ser incluida en la url (mediante carpetas y subcarpetas)

La idea es que, solo con la url, alguien pueda saber que va a encontrar en la página destino.

Además el crawler de Google parece no llevar demasiado bién los parámetros, por lo que se recomienda evitarlos a toda costa !! (es publicamente conocido que mas de 3 parámetros ponen en serios problemas los Bots del “todopoderoso” Google)

Que tenemos que evitar ? URLS largas, con parámetros y totalmente incomprensibles para los humanos:
http://www.amazon.com/gp/product/B0007TJ5OG/102-8372974-
4064145?v=glance&n=502394&m=ATVPDKIKX0DER&n=3031001&s=photo&v=glance

Una buena url ?
http://www.dpreview.com/reviews/canonsd400/

A parte de incluir las keywords dentro de la url, una url limpia y sencilla ayuda a augmentar el CTR dentro de los SERP (Search Engine Results Page). Un resultado con un CTR alto se posicionará mejor, mientras que si el CTR es bajo, se posicionará peor (Ya se lo que estais pensando, pero chicos: Google lo mide todo !!)

Title

El title de la página es lo que en realidad diferencia varios documentos entre si. A parte de que Google le da un peso nada despreciable, es lo que normalmente aparece como “titulo” en los resultados de búsqueda de Google (y demás buscadores).

Dado que el CTR afecta al posicionamiento, lo que pongamos en el title no solo afecta por el posicionamiento en si… sino también porque podemos obtener mayores CTR escogiendo los términos correctos.

Es recomendable colocar los conceptos que queramos trabajar al principio del title, sin olvidar que tiene que ser “descriptivo” y fácil interpretable para el usuario

Examples and Recommendations for Title Tags

Page on Red Pandas from the Wellington Zoo:
- Current Title: Red Panda
- Recommended: Red Panda - Habitat, Features, Behavior | Wellington Zoo

Page on Alexander Calder from the Calder Foundation:
- Current Title: Alexander Calder
- Recommended: Alexander Calder - Biography of the Artist from the Calder Foundation

Page on Plasma TVs from Tiger Direct:
- Current Title: Plasma Televisions, Plasma TV, Plasma Screen TVs, SONY Plasma TV, LCD TV at TigerDirect.com
- Recommended: Plasma Screen & LCD Televisions at TigerDirect.com

Meta Data

Historicamente los “meta tags” eran TODOS imprescindibles para obtener un buen posicionamiento. A dia de hoy, algunos son usados por Google, otros no. Yahoo tiene en cuenta un grupo… Google no…

Dado que estamos hablando de Google, os detallo los mas relevantes:

Meta keywords tag: Parece globalmente aceptado que Google no usa este meta tag. Ahora bién… como es gratis ponerlo… yo lo pondría (Yahoo! si que lo utiliza!!)

Meta Description: A parte de aumentar la densidad de palabra… El meta description es lo que Google utiliza si no es capaz de construir un “snippet” (resumen).

Fijaros en el resumen de la siguiente imágen:

image

En el primer resultado (casualmente de emagister :-)) observareis que Google no ha podido construir un resumen por si mismo. En ese momento, Google presenta el meta description como snippet del contenido.

Por este motivo, es muy importante definirlo adecuadamente. Se recomienda que contenga varias ocurrencias de los conceptos a trabajar y que tenga una longitud de entre 150 y 300 carácteres.

Aunque el meta description no tiene un impacto directo en cuanto a posicionamiento se refiere, si que lo tiene en cuanto a CTR: Lo que el usuario vea en los listados que Google presenta importa !!!

Meta Robots: Permite controlar al crawler de Google (y en general a todos los robots). Si queremos que Google nos indexe adecuadamente, deberíamos tener algo similar a:

<meta name="robots" content="all" />

Existen otras posibilidades tals como:

<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>

o:

<META NAME=”GOOGLEBOT” CONTENT=”NOINDEX, NOFOLLOW”>

Cada una tiene un significado que está fuera del ámbito de este documento. Lo que si es importante saber es que cometer un error en este meta puede ser fatal !!

Google tiene documentación exhaustiva al repecto, que debería ser examinada y estudiada antes de empezar a codificar nada :-)

Páginas “Search-Friendly”

El crawler de Google es muy bueno indexando texto. Por lo tanto, si queremos estar bien posicionados, tenemos que evitar a toda costa construir sites utilizando:

  1. Texto dentro de flash o applets de java
  2. Sites basados en imágenes
  3. Combos y formularios con información clave

Si el crawler no es capaz de indexar el texto dentro de estos objetos… El posicionamiento de estas páginas no será el esperado.

Escribir código “amigable” para los buscadores es crucial para rankear adecuadamente. No es tarea facil, y requiere de experiencia.

En general, no deberíamos olvidar:

  1. Resaltar el concepto/frase principal dentro del documento: La densidad de palabra tiene que ser óptima y tienen que existir distintas repeticiones de estos conceptos dentro de esta página.
  2. Conseguir que el texto este dentro del contexto de la página y tener contenido de calidad
  3. Intentar agrupar bloques de texto juntos. Separar el texto no es muy buena idea y los crawlers valoran bloques de texto en contexto, de calidad, y a poder ser extensos.

Tened en cuenta que abusar de repetición de conceptos, añadir texto innecesario y en general, abusar de sobre optimización SEO perjudica mas que ayuda.

Estructura de la información

Solo os diré que es muy importante. Para obtener un buen posicionamiento es muy importante que tengais en cuenta:

  1. Utilización de sitemaps estructurados: El sitemap NO tiene que tener mas de 3 niveles, y es recomendable que permita linkar a todo el contenido interno del site. El SiteMap tiene que aparecer en todas (o las mas importantes) páginas del site.
  2. Definición de una buena categorización

Contenido Duplicado

Aunque la tentación es evidente (una vez se controla como posicionar sites dentro de los resultados de búsqueda)… a Medio plazo: No compensa !! Es algo que se tiene evitar a toda costa.

image

La imágen anterior muestra un filtro aplicado por Google a un site (que no biene al caso) por contenido duplicado. Esto es lo que puede pasar, y os aseguro que no es agradable :-)

¿ Pero que pasa cuando el objetivo no es clonar sites o páginas y Google sigue detectando el contenido como duplicado ?

La respuesta es clara: El contenido no tiene suficiente calidad, o la estratégia no es adecuada :-)

Cada caso es un mundo, pero os recomiendo que consulteis con un experto, puesto que las repercusiones pueden ser debastadoras.

Una de las armas mas poderosas para controlar el contenido duplicado (a parte de no generarlo, evidentemente) es el uso de “permanent redirects” o redirecciones 301.

Os recomiendo que utiliceis una herramienta realmente muy buena: Google Supplemental results detector Tool. Muy útil para detectar contenido duplicado y documentos susceptibles a estar en el índice suplementario (otro dia ya escribiré sobre esto :-))

301_graph

En otro post escribiré con mas detalle sobre este tema… Tiene como para hacer un post muy “completito” (aunque no será tan largo como este !!)

Link Building

Antes de empezar con esta sección…

link_ninja

La imágen se titula: ¿ How to become a Link Ninja ? :-)

Y es que es cierto: Construir una estructura de linking interna y externa no es tarea fácil. Estructura interna de links, link baiting, link building, temas virales, social networking… todo ayuda. De hecho, uno podría estar sus 8h laborales con temas de linking y seguramente le faltarían horas !!

Inicialmente quería añadir esta sección al post, pero dado que sería extenso, y ya habeis estado un buen rato leyendo, lo dejaremos para otro día.

Esperad la parte II :-)

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live

SEO Tools

Friday, September 28th, 2007

En mi día a día utilizo muchas herramientas para analizar todo lo referente a posicionamiento, linking, keyword density

Os hago un resumen de las que creo son “obligadas”:

SEOQuake for Firefox: Un plug-in genial para FireFox que permite medir entre muchas otras cosas:

  1. PR de una página en concreto
  2. Páginas indexadas en los motores de búsqueda mas importantes
  3. Links contra esta página
  4. Entradas en blogs, Dmoz
  5. Keyword density
  6. Documentos en cache…

SEO for Firefox: Un plug-in genial para FireFox que permite medir casi todo lo relacionado con el mundo SEO

XENU Link Sleuth: Una herramienta popular para muchos SEO’s. Puede analizar de manera muy rápida todos los links de un site (própios o de competidores)

Compete: Una herramienta brutal para realizar comparaciones entre sites. Puede realizar comparativas de hasta 5 portales, dando una información de referencia de un valor incalculable.

Alexa: Es el “padre” de Compete. Ambos dan valores de referencia, pero permiten estimar de manera comparativa tráficos, paginas vistas, usuarios únicos, etc…

Check Server Headers Tool: Permite visualizar cabeceras devueltas por el servidor, entre ellas si se está realizando redirecciones permanentes (301), temporales (302), errores de servidor (500) … La verdad es que existen otras herramientas que permiten obtener esta información (http watch, Tamper data, wget) pero esta es ofrecida gratuitamente en formato web.

DomainTools.com: Una de mis favoritas para análisis de competidores. Necesaria para estudiar propiedad de los dominios, análisis de reversos, información de whois, monitor de dominios etc…

Robots.txt Syntax Checker: No hay nada peor que cometer un error en el archivo robots.txt :-) La verdad es que alguien se puede sentir identificado al leer esto. Herramienta de obligado uso cada vez que so modifique el archivo robots.txt. Una de las utilidades anteriores (SEOQuake) ya tiene validadores de robots.txt, y de hecho hay muchos y variados. Este es solo 1 mas.

DomainsBots: Una herramienta genial!!! coloca un concepto y te presentará una lista de dominios disponibles, mostrando si están libres, en venta, … Muy útil.

En cuanto detecte alguna utilidad de interés… la añadiré a esta lista.
Espero que os sea de utilidad.

Share and Enjoy:
  • Technorati
  • LinkedIn
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • Live