domingo, 27 de marzo de 2016

Búsqueda simple


Internet es una fuente de datos inagotable y en continuo crecimiento; el problema es que no está muy bien organizada. Es necesario aprender unas pautas para buscar los datos estadísticos que necesitas en tus clases y optimizar tu búsqueda. No olvides que cualquiera puede publicar en Internet prácticamente lo que quiera, por lo que se genera mucha información que no es válida. Distinguir entre la información fiable y la no fiable también es muy importante. Por todo ello, es imprescindible establecer las estrategias de búsqueda más adecuadas a tus objetivos.

BÚSQUEDAS EN GOOGLE:




Googlebot y PageRank

La tecnología de búsqueda de Google está basada en una completa e innovadora combinación de hardware y software. La compañía tiene distribuidos por todo el mundo 20.000 servidores conectados en red que almacenan la información y se la ofrecen al usuario.
Estos sistemas funcionan con sistemas operativos Linux, procesadores Intel y discos duro IBM en su mayoría. El concepto de red de ordenadores para el trabajo de búsquedas fue innovación de Google, que reutilizó una serie de viejos ordenadores personales para utilizarlos como servidores en su nacimiento. Este sistema es mejor que utilizar un centro de datos ya que previene fallos del sistema y ofrece mayor velocidad en el envío de resultados.
Para escanear la red, Google utiliza varios robots araña llamados Googlebot, que funcionan de forma similar al de otros buscadores en la forma de descubrir los diferentes sitios que nacen, cambian o mueren en la Red.
Googlebot escanea diferentes formatos de archivo, entre los que se incluyen HTML, PDF, XLS o DOC, entre otros. También dispone de un robot llamado FreshBot para escanear noticias en medios de comunicación.
La gran diferencia entre el funcionamiento de Google y el de otros buscadores es su software PageRank, que ordena y jerarquiza los resultados de la búsqueda. PageRank fue patentado en 1998, y organiza los resultados en base a una idea democrática de Internet, en el que considera cada vínculo de una página a otra como un voto de esa página hacia la vinculada. Para conocer el PageRank de un sitio Web debes tener instalada la Google Toolbar.
Google realiza las búsquedas de forma automática con el operador boleano “AND”, lo que significa que muestra resultados que incluyan todas las palabras buscadas, y no sólo algunas de ellas. No solo podemos usar el operador “AND”, sino que podemos usar la mayoría de los operadores boleanos, porque estos son admitidos por google. Sin embargo es importante saber que Google ignora algunos términos que considera irrelevantes debido a que son muy comunes, como son algunos determinantes, preposiciones o expresiones como “http://” o “.com”. Google, además, no diferencia entre mayúsculas y minúsculas, ni símbolos de acentuación.
Además Google tiene algunas funciones especiales, como buscar dentro de un dominio determinado, buscar webs que enlacen con cierta página o buscar noticias, imágenes y grupos. Como acabamos de ver, desde la pantalla principal de google también podemos restringir la búsqueda por idioma y localización geográfica, marcando las opciones disponibles. Por todo esto, es importante conocer la configuración básica del buscador a la hora de realizar las búsquedas, y las opciones de personalización y funciones avanzadas que nos ofrece.
Google tiene comandos especiales, palabras a las que le siguen 2 puntos (:) cuyo significado se corresponde al comando. A continuación se muestra un listado de estos comandos especiales que podremos utilizar en nuestras búsquedas en google:
·   allinanchor: Seguido de varias palabras, te da resultados de páginas en la que están todas las palabras en el enlace.
·   allintext: Seguido de varias palabras, te da resultados de páginas en la que están todas las palabras en la página.
·   allintitle: Seguido de varias palabras, te da resultados de páginas en la que están todas las palabras en el título.
·   allinurl: Seguido de varias palabras, te da resultados de la búsqueda de todas esas palabras en la URL.
·   bphonebook Si le pasas un lugar o dirección, te da el número de teléfono.
·   cache: Seguido de una URL, te mostrará la página en caché.
·   define: Seguido de una palabra, la busca en varios diccionarios o­nline y te da la definición.
·   filetype: Seguido de una extensión determinada, podemos restringir el tipo de documentos que queremos encontrar.
·   inanchor: Sólo la primera palabra de las que le siguen, ha de estar en el enlace.
·   info: Seguido de una URL, mostrará una página con enlaces relacionados, páginas que contiene esa URL...
·   intext: Sólo la primera palabra de las que le siguen, te da resultados de páginas en la que esté la palabra en la página.
·   intitle: Sólo la primera palabra de las que le siguen, ha de estar en el título.
·   inurl: Sólo la primera de las palabras que le siguen, ha de estar en la URL.
·   link: Seguido de una URL, te encuentra todas aquellas páginas que enlazan con la URL dada.
·   phonebook: Te dará resultados de teléfonos con las palabras que le siguen.
·   related: Seguido de una URL, tiene el mismo efecto que cuando se pulsa sobre el enlace de "Enlaces Relacionados".
·   rphonebook: Te dará resultados de teléfonos residenciales con las palabras que le siguen.
·   site: Seguido de un dominio, te da los resultados de la búsqueda sólo en ese dominio.
·   stocks: Seguido de un código de Bolsa, te dará los datos concretos.



·   Se pueden utilizar “comillas” para marcar secuencias exactas que queremos que aparezcan tal cual. Por ejemplo, una búsqueda de ‘monitor de plasma’ (las comillas simples representan la casilla de búsqueda) omitiría ‘de’ como palabra muy utilizada, buscaría páginas que contuviesen monitor y plasma en cualquier parte. En cambio, buscar “monitor de plasma” implicaría la aparición exacta de la cadena “monitor de plasma”, incluyendo el “de”, y en ese orden.
·   Si queremos encontrar páginas que hablen de un tema, o de otro, pero no necesariamente a la vez, utilizaremos OR: ‘monitor OR pantalla’.
·   Si lo que queremos es encontrar páginas que tengan un término pero no otro, utilizaremos el signo menos (-) para indicarlo: ‘monitor -pantalla’.
·   Si queremos que aparezca un término de los ignorados por defecto, aunque no nos importe el orden, se utiliza +: ‘ordenador +de sobremesa.
·   Si queremos encontrar el término google en la página del observatorio, escribiríamos:
site:http://observatorio.cnice.mec.es/index.php google
·   La mayoría de las técnicas anteriores se pueden combinar como por ejemplo:  “monitor” OR “pantalla” site:http://observatorio.cnice.mec.es/index.php



Sistemas de búsqueda:

    Google dispone de dos sistemas de búsqueda de información, mediante el empleo de palabras claves o buscando en un directorio por temas.
     A) Búsqueda mediante palabras. Escribimos las palabras relacionadas con las páginas que buscamos. Por tanto, escribimos las palabras importantes, en el cajetín de búsqueda que se encuentra en la portada o primera página de Google. Podemos distinguir 2 tipos de búsqueda mediante palabras:

Búsqueda básica: Para hacer una búsqueda simple en Google, simplemente debemos introducir algunas palabras descriptivas y presionar "Intro" (o hacer clic en el botón de búsqueda en Google) para ver la lista de resultados relevantes.
Google usa sofisticadas técnicas de búsqueda de texto para encontrar páginas que son importantes y relevantes para la búsqueda realizada. Por ejemplo, cuando Google analiza una página, comprueba el contenido de las páginas vinculadas con esa página, además de dar prioridad a las páginas en las que los términos buscados están cercanos entre sí.
Para encontrar algo concreto lo mejor es escribir varias palabras bien relacionadas con la información que deseamos
Búsquedas parciales:
Para proporcionar los resultados más exactos, Google no realiza búsquedas parciales ni realiza búsquedas con comodines, es decir, Google busca exactamente los términos que escribimos en la casilla de búsqueda. Buscar "color" o "color*" no devolverá búsquedas que contengan "colores" o "colorante".
     B) Directorio. En este sistema de búsqueda, la información se estructura por niveles. En cada nivel debemos seleccionar el camino para seguir la búsqueda, de manera que vamos seleccionando la rama que nos parece más relacionada con la información que buscamos, hasta llegar al grupo de páginas que nos interesa.
El directorio nos encamina directamente a un listado con las páginas más importantes de cada tema. Si nuestra búsqueda se refiere a un tipo de páginas no muy especializadas, el directorio suele ser una buena opción. 


5 comentarios: