# # robots.txt. # # GENERAL. User-Agent: * Disallow: /Repositorio/ Disallow: /Services/ Disallow: /Intranet_Autor/ Disallow: /Intranet_Editor/ Disallow: /Intranet_Impresor/ Disallow: /Admin_Portal/ Disallow: /Admin_Sistema/ Disallow: /ClientBin/ Disallow: /css/ Disallow: /Blog/ Disallow: /ControlesUsuario/ Disallow: /E_Commerce/ Disallow: /js/ Disallow: /MasterPages/ Disallow: /Publicacion/ Disallow: /Utils/ Disallow: /Autores/Alta.aspx Disallow: /Libreria/ResultadosBusqueda.aspx Disallow: /Error.aspx Disallow: /Login.aspx Disallow: /paginaNoEncontrada.aspx Disallow: /PhotoUpload.aspx Disallow: /UploadFile.aspx Disallow: /PhotoUpload.aspx Disallow: /CaptchaImage.aspx Disallow: /tmpcache/ Disallow: /ebooks.ashx # # Sitemap permitido, búsquedas no. # Sitemap: http://www.obrapropia.com/sitemap.xml Disallow: /?s= Disallow: /search # # A partir de aquí es opcional pero recomendado. # # Lista de bots que suelen respetar el robots.txt pero rara # vez hacen un buen uso del sitio y abusan bastante… # Añadir al gusto del consumidor… User-agent: MSIECrawler Disallow: / User-agent: WebCopier Disallow: / User-agent: HTTrack Disallow: / User-agent: Microsoft.URL.Control Disallow: / User-agent: libwww Disallow: / # # Slurp (Yahoo!), Noxtrum y el bot de MSN a veces tienen # idas de pinza, toca decirles que reduzcan la marcha. # El valor es en segundos y podéis dejarlo bajo e ir # subiendo hasta el punto óptimo. # User-agent: noxtrumbot Disallow: / User-agent: msnbot Crawl-delay: 50 User-agent: Slurp Crawl-delay: 50 User-agent: twiceler Crawl-delay: 50 User-Agent: Mozilla/5.0 (compatible; Yandex...) Disallow: / User-Agent: sogou spider Disallow: /