viernes, 29 de mayo de 2015

GOOGLE 2: Cómo localiza Google las páginas nuevas

Nos habíamos quedado con Google conociendo a cada usuario y recogiendo datos de cada usuario para darle mejores resultados, mejores publicidades, mejores cosas...

Pero hay otra parte importante que tenemos que conocer, y es, cómo funciona Google, es decir, que hace Google para tener todas las Webs a su disposición. Hay que tener en cuenta que internet funcionaba con las dns antiguas, es decir, cada web tenía una ip antigua, una dirección única:

xxx.xxx.xxx.xxx con cada grupo xxx es de 001 hasta 255, es decir, el máximo de ip era de 255*255*255*255, y sin embargo esto se quedó pequeño, por eso ahora hay todavía más direcciones posibles.

Pero es que además tened en cuenta que cada ip puede alojar varias web, como por ejemplo, las páginas como jimdo.com que te permiten crear una página dentro de su dominio...


Ahora imaginad a Google queriendo tener todos los datos del mundo, queriendo tener todas las web para poder ofrecer a sus usuarios toda la información del mundo...

Podían hacer uso de la fuerza bruta y empezar desde la a, luego aa, luego ab, luego ac... hasta la zzz...zz. Es decir, tener un motor que fuera recorriendo una a una todas las webs del mundo e irlas indexando, irlas ordenando. Peo esto requeriría una cantidad ingente de maquinas trabajando a tiempo completo, y luego una cantidad enorme de gente analizando esas páginas para discriminar si merece la pena o no la página o si la página tiene algo para que sirve o con que usarla.

Google ideó un atajo, usando la teoría de grafos se dedicó a una cosa que se llama crear caminos eulerianos, es decir, a hacer recorridos de nodo a nodo, ir desde una web hasta otra que sale de esta, y así nacieron lo que ellos llaman Spiders.



Esto parece un lío pero es muy sencillo: seguro que alguna vez habéis jugado a seguir los puntos, ese juego para niños que cuando terminas tienes un dibujo en el papel. Pues ahora imagina que tienes los puntos pero no tienes los números de orden. Lo más normal es que unieras todos los puntos y luego intentaras adivinar que es lo que hay dibujado borrando las uniones sobrantes.



Pués Google lo que hace es seguir un orden, en este caso el que te lleva de una página a la siguiente, hasta llegar a un punto en el que o hay un bucle o llega a un nodo muerto, una web que no enlaza con nadie o que enlaza solo con sitios conocidos.

Con esto tenemos un grafo conexo, es decir, tenemos una tela de araña de webs que se unen con webs, y a cada web encima le vamos a dar un peso, es decir, una importancia determinada, que va a venir de varias cosas: algunas subjetivas, cómo la fuerza de la empresa, y otras que van a venir solamente del número de enlaces que apuntan a esa web. Pero tampoco todos los enlaces valen lo mismo, ya que si por ejemplo Google apunta a tu página el peso es muy fuerte y tendrás un buen peso en el orden de la búsqueda, mientras que si la página de Joscarmartom apunta a tú pagina el peso, la importancia no será tan grande.

De esta forma, cuantos más enlaces buenos tenga tu vídeo, tu blog o tu página más arriba estarás en los rankins de búsqueda y más visitas tendrás.

Todo esto es importante a la hora de buscar contactos en internet y a no malgastar el dinero, mi consejo es si quieres publicidad para tu página lo mejor que puedes hacer es pagar a Google directamente ya que ellos con Ad Words.

Es sencillo de usar y no cuesta demasiado... y siempre tienen promociones:

Google AdWords

Haciendo una búsqueda:

Ahora ya tenemos las páginas indexadas, ordenadas y ahora hay que buscar en ellas, por ejemplo busco Joscarmartom:


Esto sube a los servidores de Google y empieza la magia, ya que esto si es más complicado, en primer lugar se busca la palabra o palabras, en la base de datos... Tened en cuenta que cada página web ha sido guardada en la base de datos a partir de varias cosas:
El título de la página, en encabezado principal, las etiquetas de búsqueda que el usuario ha introducido, información de adicional que google ha ido añadiendo...

Tu búsqueda se cruza con esos datos y se seleccionan los resultados que coinciden, los resultados que se asemejan y los que contienen alguna de las partes de tu búsqueda... Además te da un resultado aproximado del número de resultados posibles que se pueden localizar....

Pero esto además instantáneo, en el mismo momento en que lo pides lo tienes... 

Por eso es tan importante que selecciones un nombre bueno, un encabezado mejor y sobre todo unas etiquetas lo más ajustadas posibles...

Continuará...

No hay comentarios:

Publicar un comentario