Tecnología de búsquedaCómo funcionaEl algoritmo ExpertRank de Ask obtiene resultados de búsqueda relevantes identificando las páginas más autorizadas de la red. La tecnología de búsqueda Ask no solo tiene en cuenta quién es el más popular, sino también quién es el mejor. ExpertRank va más allá de la popularidad de un enlace (no ordena las páginas de acuerdo solamente con el número de enlaces que dirigen a las mismas) para obtener las páginas más autorizadas para responder a su búsqueda. Este sistema es conocido como popularidad temática específica. Identificar temas (también conocidos como "clusters"), los mayores expertos en los mismos, y la popularidad de millones de páginas entre estos expertos -en el mismo instante que realiza su búsqueda- exige una cantidad suplementaria de cálculos que otros buscadores no efectúan. El resultado es una relevancia de primer orden que a menudo ofrece un aire editorial ausente de otros buscadores. Preguntas acerca del Rastreador AskEl rastreador Ask es un robot indexador, también llamado crawler o araña. El rastreador recopila documentos de la web para construir un índice en continuo crecimiento. Ask se diferencia de cualquier otra tecnología de búsqueda en que analiza la web en su estado natural: las comunidades dedicadas a un tema específico. Este proceso comienza con la creación de in índice completo y fiable. El rastreo de la web es una herramienta fundamental que nos permite ofrecer los resultados más actuales. En esta página encontrará respuestas a las preguntas más frecuentes sobre el funcionamiento de nuestro rastreador. Preguntas frecuentes1. ¿Qué es un rastreador, araña o web crawler? 24. ¿Cómo puedo obtener más información? ¿Qué es un rastreador, araña o web crawler?Un rastreador (también llamado araña o robot) es un programa de software diseñado para seguir hyperlinks en un sitio web, recopilando e indexando páginas para documentar el sitio en un buscador. Los rastreadores son inocuos y no interfieren con el funcionamiento de los sitios web ni de sus servidores.¿Por qué utiliza Ask un rastreador?Ask utiliza rastreadores con el fin de recopilar la información necesaria para construir nuestro creciente índice de búsqueda. Los rastreadores aseguran que la información de nuestros resultados sea tan actual y relevante como resulte posible. Nuestros rastreadores, bien diseñados y profesionalmente operados, llevan a cabo una función de valor incalculable de acuerdo con las prácticas habituales de la industria de buscadores.¿Cómo funciona el rastreador?
¿Con cuánta frecuencia indexará el rastreador páginas de mi sitio web?El rastreador solo descargará las páginas de una en una desde su dirección IP. Tras recibir cada página se detendrá un tiempo (entre una centésima de segundo y varias horas) antes de descargar la siguiente. Cuanto más rápido responda el sitio web al rastreador, más breves serán los intervalos.¿Puedo impedir que el buscador Ask muestre una copia en caché de mi página?Sí. Ask respeta la meta tag "noarchive". Si incluye la siguiente orden en su página HTML, no ofreceremos una copia archivada del documento al usuario.< META NAME = "ROBOTS" CONTENT = "NOARCHIVE" > Si solo quiere aplicar esta restricción a Ask, cambie "robots" por "teoma". Sí, obedecemos el Robots Exclusion Standard (RES) de 1994, ligado al Robot Exclusion Protocol, un método que permite al administrador de un sitio web qué partes del mismo pueden ser visitadas por los robots o rastreadores Puede encontrar más información sobre el RES y el Robot Exclusion Protocol en http://www.robotstxt.org/wc/exclusion.html. ¿Puedo impedir que el rastreador indexe mi sitio web o parte del mismo?Sí. El rastreador Ask obedece comandos que restringen el acceso a ciertas URLs o partes de las mismas. Para indicar al rastreador Ask que solo visite rutas definidas como públicas incluya estas líneas:
¿Dónde debo colocar mi archivo robots.txt?El archivo debe estar en el nivel superior de su sitio web. Por ejemplo, si su URL es www.misitio.com , el archivo deberá estar en http://www.misitio.com/robots.txt. ¿Cómo puedo saber si el rastreador ha visitado mi sitio web o URL?Consulte los logs del servidor para saber si el rastreador ha visitado su sitio web o URL. Si así ha sido, esta es la línea usuario-agente que debería encontrar :
¿Cómo puedo impedir que el rastreado indexe mi página y los enlaces que conducen a ella desde otras páginas?Si incluye el siguiente comando en una sección de su página HTML, el rastreador Ask no indexará el documento y por tanto éste no aparecerá en nuestros resultados de búsqueda:
Diríjase a http://www.robotstxt.org/wc/exclusion.html#meta para ampliar esta información. ¿Por qué el rastreador descarga varias veces la misma página de mi sitio web?Habitualmente el rastreador Ask solo descarga una copia de cada archivo de un sitio web durante su visita. Hay dos excepciones:
Es característico de la red de internet que muchos enlaces se rompan o queden desfasados. Siempre que una página web contenga un enlace roto o desfasado a su sitio web o a una dirección inexistente, Ask lo visitará tratando de encontrar la página a la que hace referencia. Esto puede hacer que el rastreador solicite URLs que ya no existen o nunca lo hicieron, o que efectúe peticiones HTTP a direcciones IP que nunca tuvieron servidor o han dejado de tenerlo. El rastreador no genera direcciones arbitrariamente, sino sigue enlaces. Por esta razón puede que advierta actividad en equipos que no sean servidores. El rastreador Ask encuentra páginas siguiendo enlaces (etiquetas HREF en
HTML) desde otras páginas. Cuando el rastreador encuentra una página que contiene marcos (frameset), descarga los distintos componentes e incluye su contenido como parte de la página original.
El rastreador Ask no indexará estos marcos o componentes como URLs a menos que otras páginas enlacen con ellos vía HREF. Mantenemos un número limitado de URLs dinámicas en nuestro índice. Todas son examinadas para detectar posibles duplicados antes de descargarlas. Si el rastreador Ask no ha visitado su URL es porque no ha encontrado enlaces a la misma en las páginas o URLs visitadas. Sí. Tanto el cliente como el servidor HTTP permiten el funcionamiento de la compresión HTTP, que permite a los servidores enviar documentos comprimidos (en gzip u otros formatos). Esto supone un ahorro considerable de ancho de banda para servidor y cliente y, aunque aumenta el overhead de la CPU del servidor y el cliente al operar,
merece la pena. Con un sistema de compresión sencillo como gzip
puede reducirse el tamaño de los archivos hasta un 75%. Agradecemos su interés por incluir su sitio web en Ask.com y en el motor de búsqueda Ask.com. Su mejor opción es seguir el protocolo de formato abierto sitemaps, que Ask.com admite. Una vez que ha preparado el sitemap, añada la directiva de descubrimiento automático de sitemap a robots.txt o envíenos directamente el sitemap a través de la ping-URL. (Para obtener más información sobre este proceso, consulte ¿Admite Ask.com sitemaps?) Tenga en cuenta que el envío de sitemaps no garantiza la indexación de URLs. No se preocupe si no ve sus páginas indexadas en nuestros resultados. Ponemos mucho cuidado en preservar la calidad de nuestro índice y analizamos los resultados de cada rastreo antes de incluirlos en nuestra base de datos. Ask
no incluye necesariamente todos los sitios que ha rastreado en su índice. Sí. Respetamos la directiva robots.txt "Crawl-Delay", que le permite especificar el intervalo mínimo entre dos descargas sucesivas de nuestro rastreador. La línea usuario-agente no es garantía de autenticidad ya que para un usuario malicioso resulta fácil imitar las propiedades del rastreador Ask. Para poder autentificar correctamente el rastreador Ask debe realizarse una búsqueda de DNS de "ida y vuelta". En primer lugar, esto conlleva obtener la dirección IP del rastreador Ask y realizar una búsqueda de DNS inversa asegurando que la dirección IP pertenece al dominio ask.com. Luego se realizará una búsqueda de DNS directa con el nombre de host asegurando que la dirección IP resultante coincide con la original.
Sí, Ask.com admite el protocolo de formato abierto sitemaps. Una vez que ha preparado el sitemap, añada la directiva de descubrimiento automático de sitemap a robots.txt de la siguiente manera: Es muy fácil. Puede generar el código necesario haciendo clic aquí. Ask.com considera por defecto que los términos de búsqueda son enviados en formato UTF-8. En caso contrario, es necesario especificar la codificación de caracteres utilizada en su web en el campo oculto "qenc". Por favor, consulte la lista de codificaciones admitidas más abajo. Es importante informar del formato de codificación utilizado para que podamos interpretar correctamente las búsquedas, especialmente cuando estas incluyen carácteres acentuados o no latinos. Si no especifica la codificación, el usuario verá caracteres ausentes o incorrectos en su búsqueda (normalmente un signo de interrogación). Las siguientes codificaciones de caracteres son admitidas en el parámetro "qenc": Habitualmente la codificación de una página web aparece como información META en la fuente. Vea la fuente de la página en la que desee integrar el buscador Ask.com y busque el siguiente texto: <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">. "Charset" especifica la codificación de caracteres utilizada. En este ejemplo es ISO-8859-1 (o Latin-1), por lo que deberíamos introducir "iso-8859-1" como valor del campo oculto "qenc". Si la codificación de su página no aparece mencionada más arriba y quiere integrar la búsqueda Ask.com, puede ponerse en contacto con nuestro departamento de Atención al cliente. Por favor, incluya la siguiente información: Haremos todo lo posible por reconocer su codificación y le haremos saber cuando podremos empezar a atender búsquedas desde su sitio.
¿Cómo puedo obtener más información?Por favor, póngase en contacto con nuestro departamento de Atención al cliente.Por favor, tenga en cuenta que no podemos atender peticiones para indexar sitios web o URLs o reflejar actualizaciones. |