
Enlaces rotos, a evitar en tu sitio web | Chris S. (CC by 2.0, Flickr)
Uno de los factores que pueden llegar a afectar negativamente al posicionamiento SEO de una página web son los enlaces rotos. Un enlace roto (broken link, en inglés) es un enlace no disponible, ya sea por despiste (colocar mal la URL), porque el enlace ha dejado de existir o por problemas en las DNS.
Un enlace roto genera un error HTTP 404, no encontrado. Aunque los errores 404 sean parte de internet, dado que es corriente que haya páginas que dejen de existir por mil y una razones que no vienen al caso, para los buscadores, mostrar contenidos que contienen enlaces rotos, tanto a nivel interno como externo, podría suponer una señal de que el contenido es de baja calidad, pues el visitante, si así lo desea, no podrá acceder a esos enlaces. Lo mismo ocurre con los robots de búsqueda: quieren acceder a ese enlace y no lo consiguen, calificando, por consiguiente, el contenido como de poca utilidad para el usuario.
Al igual que es aconsejable tener títulos y descripciones únicas a la hora de posicionar una página web, también es conveniente no contar con enlaces rotos. Desde un punto de vista cualitativo, tener enlaces rotos implica no cuidar tu página, o lo que es lo mismo, mostrar desinterés por la experiencia del usuario (no estarás dando una imagen de fiabilidad y garantía al visitante). Recuerda que entre las directrices que propone Google para construir sitios de calidad se encuentran recomendaciones como que el contenido esté bien editado y sea útil para el visitante. Por tanto, si tenemos muchos links que arrojan error 404, no estaríamos cumpliendo esas premisas de calidad de contenidos. Asimismo, ten en cuenta que un enlace interno roto genera problemas de indexabilidad, ya que las arañas de los buscadores no pueden acceder a esos contenidos y, por consiguiente, no los van a indexar, o por lo menos no tan rápido como deberían.
Pero que no cunda el pánico, por favor. Por lo general, tener algunas (pocas) URL que devuelvan un código de error 404 no quiere decir que tu sitio vaya a ser penalizado. Sin embargo, si esto ocurre con muchas páginas de tu sitio web, sí podría llegar a desencadenar un descenso del ranking en las SERP del buscador. Como en la vida real, los excesos se pagan…
Consejos:
Lee más información acerca del perjuicio que ocasionan los errores 404 en tu sitio web, según Google.
Herramientas para comprobar enlaces rotos
Una vez que sabes por qué motivo no conviene tener enlaces rotos en tu página, es preciso averiguar dónde se encuentran esos vínculos. A continuación, varias herramientas de comprobación y rastreo.
Xenu
Quizá sea una de las aplicaciones de escritorio más conocidas por los SEO, sobre todo por su utilidad y por ser cien por cien gratuita, sin límites. Al igual que una «araña», Xenu comprueba y rastrea todos los enlaces de una página web y muestra el tipo de respuesta recibida (200 OK, redirecciones 301 o 302, error 404…), el title y description, el tamaño de la página, la fecha, la cantidad de enlaces internos y externos…. Además, permite la comprobación en entornos locales o en desarrollo y la exportación de informes.
¿Xenu es la herramienta perfecta? Según se mire, sí, ya que solo está disponible para sistemas operativos Windows (desde Windows 95 a Windows 7, ambos incluidos).
Screaming Frog
En su versión gratuita, disponible para Windows, Mac y Ubuntu, Screaming Frog permite analizar hasta 500 URL, cifra más que suficiente para proyectos web pequeños o medianos. Muestra errores y redirecciones en enlaces internos y salientes, aunque también mucha más información: rastrea page titles, meta descriptions, meta keywords, cabeceras h1 y h2, imágenes y compañía en busca de duplicidades, ausencias o límites de caracteres, entre otros. Permite realizar exportaciones para luego trabajar cómodamente en Excel. Eso sí, si quieres guardar proyectos o, como decía, analizar sitios web con más de 500 URL en su haber, tendrás que pagar la licencia del programa (99 libras anuales).
Consejos:
Si quieres conocer todos los entresijos de Screaming Frog, consulta este magnífico tutorial realizado por Rocío Miró.
Integrity
Integrity examina, bajo una intefaz simple y minimalista, tu página web de arriba a abajo para localizar enlaces rotos y redirecciones. Para ello establece diferentes vistas y filtros, atendiendo a enlaces salientes, internos o páginas. Permite exportar el análisis en HTML o CSV. Está disponible para Mac OS X exclusivamente y es, en palabras de su autor, la mejor alternativa posible a Xenu, pues la desarrolló inspirándose en él.
Gsite Crawler
Aunque Gsite Crawler está destinado especialmente a la creación de sitemaps, también proporciona un registro de todas aquellas páginas que arrojan errores 404, redirecciones y páginas con contenido duplicado. Es totalmente gratuito, no tiene limitaciones de ningún tiempo y está disponible únicamente para Windows. Si hay que sacarle algún que otro «pero», ese es su apabullante interfaz y el número de opciones disponibles, además de su gran consumo de recursos y la lentitud con la que realiza los análisis. Vamos, que, aunque no está mal, quizá deberías decantarte por otra opción.
LinkChecker
LinkChecker es una herramienta open source que se encuentra disponible para los sistemas operativos Windows, Mac OS X y Debian. Bajo una interfaz clara, permite filtrar los datos obtenidos mediante URL y así localizar qué enlaces devuelven errores o redirigen a otro vínculo. Permite guardar los resultados obtenidos en formato texto, HTML, CSV o XML.
W3C Link Checker
Práctica, aunque muy básica, permite comprobar, online, sin instalaciones de ningún tipo, si existen enlaces rotos en una URL concreta. Sí, sí, has leído bien: solamente de una única URL, la que tú indiques, y no el dominio enterito. A cambio nos ofrece recomendaciones acordes a la accesibilidad del sitio web y especifica en qué línea del código fuente se encuentra el problema. No cuenta con opciones de exportación.
Broken Link Check
Si quieres comprobar enlaces rotos allá donde estés, estás de enhorabuena. Al igual que W3C Link Checker, Broken Link Check no dispone de aplicación de escritorio, es puramente online, lo cual se agradece a la hora de trabajar lejos de la oficina o espacio de trabajo habitual. Procesa toda tu web en busca de enlaces rotos a través de dos tipos de análisis: uno que reporta simplemente los enlaces rotos y otro que, aunque es más lento, es más específico, pues facilita información acerca de la URL y el tiempo de respuesta del servidor. ¿Contras? Según parece, si necesitas escanear más de 3.000 URL, comprobar subcarpetas o exportar los resultados en formato Excel, debes ponerte en contacto con sus creadores para que te ofrezcan una solución –previo pago– acorde a tus necesidades.
¿Usas WordPress?
Broken Link Checker
Broken Link Checker es un plugin para WordPress que analiza todas las URL que le indiquemos (en posts, páginas, comentarios, blogroll e, incluso, custom fields) en busca de redirecciones y errores 404. Y no solo se ciñe a verificar enlaces rotos en entradas ya publicadas, también se atreve con entradas en borrador, pendientes, privadas o programadas. ¡Casi nada!
Podemos especificar qué tipo de enlaces queremos que compruebe: links normales, en imágenes, en vídeos… El tiempo que tarda en analizar el sitio web entero depende, como es lógico, del número total de enlaces a rastrear. A medida que pasan los minutos, el número de enlaces rotos se irá mostrando. El análisis habrá acabado cuando ya no queden URL en la cola de trabajo.
Broken Link Checker permite establecer búsquedas por filtros personalizados, ya sea indicando el anchor text, una URL o un código de respuesta HTTP determinado, así como el estado del enlace (error 404, redirecciones, todos…). Permite configurar rastreos periódicos y, si quieres, te avisa por correo electrónico cuando detecta nuevos enlaces rotos a ti, administrador del blog, y a los autores de los artículos.
Pero lo mejor de todo es, sin duda, que permite eliminar, automáticamente, el vínculo de todos los enlaces rotos que localice, además de modificar y corregir, también automáticamente, si así lo estimas, aquellos links que redireccionan a nuevas URL.
Broken Link Checker es una maravilla, aunque, puestos a buscarle algún fallo, solo está disponible para WordPress.
Consejos:
Pese a que en todo momento te avisa –en sus opciones– de la carga actual del servidor, e incluso para de buscar enlaces rotos si se alcanza una carga elevada, es conveniente desactivar o desinstalar el plugin una vez hayamos comprobado y solucionado todos los links rotos, ya que consume muchos recursos del servidor y efectúa, si no le dices lo contrario, comprobaciones cada 72 horas.
Más plugins para WordPress
- Links/Problem Reporter: añade un botón en tu sitio web para que los usuarios puedan avisarte si hay enlaces que han dejado de funcionar.
- Automatic link checker: escanea todo tu blog en busca de links rotos y los elimina. Permite establecer comprobaciones periódicas automáticas.
Herramientas para webmasters de Google
Y dejamos la herramienta más interesante para el final. ¡Los últimos serán los primeros! Bromas aparte, Google Webmasters Tools debería ser el punto de partida para todo webmaster que se preocupe por la calidad, accesibilidad, usabilidad e indexabilidad de los contenidos de sus sitios web.
Yendo al panel del sitio, en el apartado «Rastreo», en «Errores de rastreo», nos toparemos con semejante panorama:
Los «Errores del servidor» dependen, como su propio nombre indica, del servidor en el que alojemos nuestro sitio web. Como todo en esta vida, lo barato sale siempre caro. Apuesta por un servidor de calidad, situado geográficamente en el mercado objetivo de tus intereses para así fortalecer las estrategias de SEO local.
Por su parte, los errores de «Acceso denegado» vienen dados cuando el robot de Google, Googlebot, no puede acceder a una URL determinada porque se requiere identificación o porque el archivo robots.txt lo impide, entre otros motivos.
Por último, los errores que se incluyen en el apartado «No se encuentra», los que hoy nos atañen, hacen referencia a los errores 404. Al hacer clic sobre cada error, averiguaremos detalles como cuál fue la fecha de su primera detección y la del último rastreo, además de desde dónde está enlazado (tanto a nivel interno como externo) para conocer el origen del vínculo y poner fin al error que causa.
A medida que vayamos solucionando los errores 404, ya sea uno a uno o varios a la vez, marcaremos la opción «Marcar como solucionado».
Consejos:
Lee más acerca de los errores de conectividad del servidor, de los errores de acceso denegado y de los errores 404 (página no encontrada).
Poniendo solución
Recapitulemos: hemos verificado cuántos hay y dónde se sitúan los enlaces rotos que habitan en nuestro sitio web, tanto a nivel externo como interno. El siguiente paso consiste en hacer las oportunas modificaciones que pongan fin a esos molestos errores 404.
Para entenderlo mucho mejor, vamos a clasificar los errores 404 en tres formas distintas atendiendo a su origen:
- Enlaces entrantes que generan error 404. Ejemplo: el sitio web fulanito.com ha enlazado erróneamente, al crear el vínculo, un artículo de tu sitio web, lo que origina un error 404; o ese enlace apunta a una página de tu web que ya ha dejado de estar operativa por el motivo que sea, y causa otro error 404. En ambos casos tenemos dos alternativas: tratar de contactar con el webmaster para solicitar que modifique ese enlace (tarea algo pesada e, incluso, imposible dependiendo de cuál sea el origen), o, mucho más sencillo, realizar nosotros mismos una redirección 301 que solvente el problema.
- Enlaces salientes que generan error 404. Ejemplo: enlazas erróneamente a otro dominio, lo que produce un error 404, culpa tuya; o el enlace que colocaste en su día ha dejado de existir, lo que crea otro 404 más. Lo ideal es corregir ese enlace, y es importante hacerlo para que el visitante, si así lo desea, consulte ese vínculo para ampliar información. Si el enlace ya no está operativo, simplemente bórralo.
- Enlaces internos que generan error 404. Ejemplo: en tu sitio web, enlazas una sección o artículo de tu propio sitio web cuyo enlace has colocado mal o ha dejado de existir. Aquí la culpa es tuya y solo tuya, y encima estás generando problemas de indexabilidad, ya que los robots de búsqueda no pueden rastrear tus enlaces internos, debido a que el enlace está roto o no está disponible. Corrígelo, colócalo bien, y en el caso de que esa página ya no exista, considera realizar una redirección 301.
Si usas WordPress…
Redirection es tu amigo. Se trata de un plugin que, como su propio nombre indica, permite realizar redirecciones (del tipo 301), una a una, o por grupos, de forma intuitiva y muy rápida, sin complicaciones.
Si has hecho una migración o has cambiado la estructura de los permalinks, puedes valerte del plugin Permalinks Moved Permanently.
Y para acabar, una vez hayas solucionado todos los enlaces rotos, vuelve a emplear algunas de las anteriores herramientas de escaneo de enlaces rotos y verifica que los enlaces conflictivos ya no devuelven error 404. Cuando hayas solventado todos los errores que muestra la sección «Errores de rastreo», de Herramientas para webmasters de Google, marcándalos posteriormente como solucionados, realiza un seguimiento periódico para comprobar que no vuelven a aparecer en el listado.
Página 404 útil
Soy consciente de que, dependiendo del volumen de URL de un sitio web, no siempre es factible revisar y corregir enlaces rotos, y que estos pueden generarse rápidamente, de un día para otro, y en gran cantidad, sin control. Por este motivo, siempre hay que contar con una buena página de error 404 que le facilite alternativas de navegación al usuario. Una buena forma de favorecer esa tarea al usuario consiste en crear páginas 404 útiles, por ejemplo, agregando una caja de búsqueda, un enlace a la portada o al mapa web del sitio, o añadiendo vínculos a otras secciones o artículos relacionados/populares.
Por mencionar un ejemplo de una página web conocida por la mayoría de los mortales, fíjate cómo lo hace Apple:
Muy útil, ¿verdad? Si el usuario accede a una URL no disponible, se le indica que el vínculo no se encuentra disponible, al tiempo que le anima a emplear el buscador y le muestra un conjunto de enlaces, ordenados por secciones, para que pueda seguir navegando por la página.
Consejo:
Revisa las recomendaciones que proporciona Google acerca de la creación y personalización de la página 404.
Conclusiones
Soy consciente de que muchos errores causados por un enlace roto no se encuentran a nuestra disposición para solucionarlos. Pero ello no es excusa para que no dediquemos una o varias jornadas, cada cierto tiempo, para tratar de solucionar el problema y velar por el buen posicionamiento y la experiencia del usuario en nuestra página.
La detección y comprobación de enlaces rotos puede ser una tarea larga y aburrida, pero como se suele decir en el mundillo SEO: «Todo suma. No es suficiente con hacer una cosa bien, sino muchas a la vez».