Tutorial Screaming Frog auditorías SEO

Screaming Frog SEO Spider es la herramienta de escritorio más potente para auditorías técnicas SEO. Mientras Google Search Console te dice lo que Google ve, y Semrush/Ahrefs analizan tu competencia, Screaming Frog rastrea tu web como lo haría un motor de búsqueda, revelando problemas técnicos que otras tools pasan por alto.

En esta guía completa aprenderás cómo usar Screaming Frog para auditorías SEO profesionales: desde instalación y configuración hasta análisis on-page avanzado, pasando por exportación de datos y custom extraction. Todo con ejemplos prácticos que puedes aplicar inmediatamente.

Si haces SEO profesionalmente (agencia, consultor, in-house), Screaming Frog es inversión obligatoria. Vamos a dominarlo juntos.

🔍 ¿Necesitas una auditoría técnica SEO completa?

Realizamos auditorías profundas con Screaming Frog y otras herramientas profesionales.

Solicita auditoría técnica

🕷️ Qué es Screaming Frog y Para Qué Sirve

Screaming Frog SEO Spider es un crawler de escritorio (Windows, Mac, Linux) que rastrea sitios web y extrae datos SEO críticos: títulos, metas, headers, enlaces, imágenes, canonicals, hreflang, schema markup, y +100 elementos técnicos.

Screaming Frog vs Otras Herramientas

🏆 Por Qué Screaming Frog es Único:

  • Rastreo ilimitado: Versión paga sin límite páginas (vs 500 gratis)
  • Offline analysis: Rastrea localhost, staging, sin acceso público
  • Custom extraction: Extrae CUALQUIER dato con CSS/XPath/regex
  • Integración API: Google Analytics, Search Console, PageSpeed Insights
  • Exportación masiva: Excel, CSV, JSON con datos completos
  • Velocidad: Rastrea 100-500 URLs/minuto (configurable)
  • Control total: User agent, profundidad rastreo, excludes, etc.

Screaming Frog mejor en: Auditorías técnicas profundas, análisis on-page masivo, detección problemas rastreo, migraciones web.

Semrush/Ahrefs Site Audit mejor en: Automatización (rastreo programado), dashboards visuales, reportes clientes.

Precio 2025: Versión gratuita (hasta 500 URLs), versión paga £259/año (~€300, ~$350) licencia anual. Vale CADA euro para SEO profesional.

💾 Instalación y Configuración Inicial

Paso 1: Descargar e Instalar

  1. Ve a screamingfrog.co.uk/seo-spider
  2. Descarga versión para tu sistema (Windows/Mac/Linux)
  3. Instala (proceso estándar)
  4. Abre aplicación

Versión gratuita: Límite 500 URLs por rastreo. Suficiente para webs pequeñas o aprender.

Versión paga: Rastreo ilimitado, integración APIs, scheduled crawls, comparación crawls. Esencial profesionales.

Paso 2: Configuración Básica (Crítica)

Configuration > Spider

  • Respect Robots.txt: Activa (rastrea solo lo que Google puede rastrear)
  • Respect Nofollow: Activa (simula comportamiento Google)
  • Respect Meta Robots: Activa
  • Canonicals: Activa "Always Follow Canonicals" (sigue URL canónica)

Configuration > Limits

  • Max URI Length: 2048 (URLs demasiado largas = problema)
  • Crawl Depth: Ilimitado (o límite si web enorme)

Configuration > Speed

  • Max Threads: 5-10 para webs externas (no sobrecargar servidor)
  • Max Threads: 20-50 para localhost/staging (servidor aguanta más)
  • Request Timeout: 10 segundos

Configuration > User-Agent

  • Default: Screaming Frog SEO Spider
  • Personalizado: Simula Googlebot (útil detectar cloaking)

🚀 Tu Primer Rastreo: Paso a Paso

Rastreo Básico

  1. Introduce URL en barra superior (ej: https://tudominio.com)
  2. Click "Start"
  3. Screaming Frog rastrea todo el sitio automáticamente
  4. Espera a que termine (barra progreso abajo)
  5. Analiza datos en pestañas superiores

Las 8 Pestañas Principales

1. Internal (Enlaces Internos)

URLs dentro de tu dominio. Aquí analizas:

  • Títulos duplicados
  • Meta descriptions faltantes/duplicadas
  • H1 múltiples o faltantes
  • Longitud excesiva titles/metas

2. External (Enlaces Externos)

Links que apuntan fuera de tu dominio. Útil para:

  • Detectar enlaces rotos externos
  • Verificar rel="nofollow" en links externos
  • Encontrar enlaces a recursos (PDF, archivos)

3. Protocol (HTTP/HTTPS)

Distribución HTTP vs HTTPS. Crítico:

  • ¿Todas URLs son HTTPS?
  • ¿Hay páginas HTTP mezcladas?
  • ¿Redirecciones HTTP→HTTPS correctas?

4. Response Codes (Códigos Respuesta)

Status HTTP de cada URL:

  • 200 (Success): Página carga correctamente ✅
  • 301 (Permanent Redirect): Redirección permanente ✅
  • 302 (Temporary Redirect): Redirección temporal ⚠️ (debería ser 301)
  • 404 (Not Found): Página no existe ❌
  • 500 (Server Error): Error servidor ❌

5. URI

Estructura de URLs:

  • URLs demasiado largas (>100 caracteres)
  • Parámetros innecesarios (?utm, ?sessionid)
  • Underscores vs guiones (guiones mejor SEO)

6. Page Titles

Análisis títulos:

  • Títulos faltantes (Missing)
  • Títulos duplicados (Duplicate)
  • Títulos >60 caracteres (demasiado largos)
  • Títulos <30 caracteres (demasiado cortos)

7. Meta Description

Análisis meta descriptions:

  • Metas faltantes
  • Metas duplicadas
  • Metas >160 caracteres
  • Metas <120 caracteres

8. H1

Análisis headers H1:

  • Páginas sin H1 (Missing)
  • Páginas con múltiples H1 (Multiple)
  • H1 duplicados

🔍 Análisis On-Page Avanzado

Detectar Contenido Duplicado

Page Titles > Filter: Duplicate

  • Lista páginas con mismo title
  • Problema: Google no sabe cuál priorizar
  • Solución: Titles únicos o canonical tags

Meta Description > Filter: Duplicate

  • Metas duplicadas = CTR bajo (no diferenciación)
  • Solución: Metas únicas por página

Analizar Imágenes

Images > Filter: Missing Alt Text

  • Imágenes sin atributo alt
  • Problema: Accesibilidad + SEO de imágenes
  • Solución: Alt descriptivos en todas las imágenes

Images > Filter: Over 100kb

  • Imágenes pesadas que ralentizan web
  • Solución: Optimizar (compresión, WebP)

Enlaces Rotos (404)

Response Codes > Filter: Client Error (4xx)

  • URLs que devuelven 404, 410, etc.
  • Click pestaña "Inlinks" abajo = qué páginas enlazan a 404
  • Solución: Arregla enlace interno o redirección 301

Canonicals

Directives > Canonicals

  • Missing: Páginas importantes sin canonical (recomendable self-referencing)
  • Multiple: Página con varios canonicals (error crítico)
  • Chains: Canonical apunta a URL que tiene otro canonical (ineficiente)

Hreflang (Webs Multi-idioma)

Directives > Hreflang

  • Missing Return Links: Página ES apunta a EN pero EN no apunta a ES
  • Inconsistent Language/Region: Códigos hreflang incorrectos
  • Invalid URL: Hreflang apunta a 404

Schema Markup

Structured Data > Schema.org > Filter por tipo

  • Qué páginas tienen schema
  • Tipos implementados (Article, Product, LocalBusiness, etc.)
  • Validación: Export → verifica en Google Rich Results Test

📤 Exportación y Reportes

Exportar Datos Específicos

  1. Selecciona pestaña (ej: Page Titles)
  2. Aplica filtro (ej: Duplicate)
  3. Export > selecciona formato (CSV, Excel)
  4. Analiza en Excel/Google Sheets

Exportaciones Clave para Auditorías

  • All Inlinks: Todos los enlaces internos (analiza estructura linking)
  • All Outlinks: Todos enlaces salientes
  • Crawl Overview: Resumen rastreo (200s, 301s, 404s, etc.)
  • Redirect Chains: Cadenas redirecciones (A→B→C = ineficiente)
  • URL Analysis: Parámetros URLs, longitudes

Comparar Crawls (Solo Versión Paga)

Caso uso: Detectar cambios post-migración

  1. Crawl 1: Antes de migración (guarda proyecto)
  2. Crawl 2: Después de migración
  3. Crawls > Compare Crawls > selecciona ambos
  4. Ve cambios: URLs nuevas, eliminadas, modificadas

⚙️ Custom Extraction: Extrae CUALQUIER Dato

La función más potente (y menos usada) de Screaming Frog.

Caso 1: Extraer Precios de Productos

  1. Configuration > Custom > Extraction
  2. Add > CSSPath o XPath
  3. Name: "Precio Producto"
  4. Selector CSS: .product-price (ajusta a tu HTML)
  5. Re-crawl (aplica solo a nuevos rastreos)
  6. Pestaña "Custom" > ve columna "Precio Producto"

Caso 2: Extraer Author de Blog Posts

  1. Extraction > Add > CSSPath
  2. Name: "Autor"
  3. Selector: .author-name
  4. Export → Excel con autor por artículo

Caso 3: Verificar Google Analytics en Todas las Páginas

  1. Extraction > Add > Extract Text > Contains
  2. Name: "GA Instalado"
  3. Text to Find: UA-XXXXXXX o G-XXXXXXX
  4. Rastreo → filtra páginas SIN GA

Regex Extraction Avanzado

Extraer solo números de texto:

  • Regex: \d+
  • Uso: Extraer años, cantidades, códigos

Extraer emails:

  • Regex: [a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}
  • Uso: Detectar emails expuestos (GDPR risk)

🔗 Integración con Google APIs

Solo versión paga. Aumenta datos rastreo con métricas Google.

Google Analytics Integration

  1. Configuration > API Access > Google Analytics
  2. Conecta cuenta GA
  3. Selecciona vista
  4. Rastreo incluye: Sessions, Users, Bounce Rate, Avg Session Duration

Uso: Identifica páginas con tráfico alto pero SEO pobre (optimiza primero).

Google Search Console Integration

  1. Configuration > API Access > Google Search Console
  2. Conecta cuenta GSC
  3. Rastreo incluye: Clicks, Impressions, CTR, Position

Uso: Cruza datos técnicos (Screaming Frog) con rendimiento real (GSC).

PageSpeed Insights Integration

  1. Configuration > API Access > PageSpeed Insights
  2. Añade API key de Google Cloud
  3. Rastreo incluye: Performance score, LCP, FID, CLS

Uso: Auditoría masiva Core Web Vitals (vs probar páginas manualmente).

💼 Casos de Uso Profesionales

Caso 1: Auditoría Pre-Migración

  1. Rastrea sitio actual completo
  2. Export: All URLs (lista completa)
  3. Export: All Inlinks (estructura enlaces)
  4. Guarda proyecto
  5. Post-migración: compara crawls, detecta URLs perdidas

Caso 2: Detectar Contenido Thin

  1. Rastrea web
  2. Internal > Bulk Export > Response Codes > Inlinks
  3. Filtra páginas con Word Count <300
  4. Identifica: páginas delgadas para mejorar o eliminar

Caso 3: Análisis Competencia (Versión Paga)

  1. Rastrea dominio competidor (respeta robots.txt)
  2. Analiza estructura: profundidad, arquitectura, enlaces internos
  3. Export títulos/metas: ve cómo optimizan
  4. Custom extraction: extrae datos específicos (precios, features, etc.)

Caso 4: Encontrar Oportunidades Enlazado Interno

  1. Rastrea web
  2. Bulk Export > All Inlinks
  3. Ordena por "Inlinks" ascendente
  4. Páginas con 0-2 inlinks = huérfanas o poco enlazadas
  5. Si importantes, añade enlaces internos desde contenido relevante

💡 Trucos Avanzados Screaming Frog

Truco #1: Rastrear Solo Sección Específica

Configuration > Include/Exclude

  • Include: https://tudominio.com/blog/
  • Rastrea SOLO blog (ignora resto web)
  • Útil: webs enormes, analizar sección específica

Truco #2: Crawl + Render JavaScript

Configuration > Rendering > JavaScript

  • Activa rendering (consume más recursos)
  • Esencial: webs React, Vue, Angular (contenido generado JS)
  • Ve contenido como Google (que renderiza JS)

Truco #3: Rastreo Lista URLs (Upload)

Mode > List

  • Sube archivo TXT con lista URLs
  • Screaming Frog rastrea SOLO esas URLs
  • Útil: analizar URLs específicas de GSC, Analytics, backlinks

Truco #4: Detectar Cloaking

  1. Crawl 1: User-Agent = Googlebot
  2. Crawl 2: User-Agent = Normal browser
  3. Compare Crawls
  4. Diferencias contenido = potencial cloaking (penalización Google)

Truco #5: Scheduled Crawls (Monitoreo Continuo)

Solo versión paga:

  • Schedule > Add new schedule
  • Frecuencia: Diaria, semanal, mensual
  • Email automático si detecta errores nuevos
  • Mantenimiento proactivo SEO

🎯 Conclusión: Screaming Frog es Swiss Army Knife SEO

Screaming Frog SEO Spider no es la herramienta más bonita visualmente. No tiene dashboards coloridos ni reportes automatizados fancy. Pero cuando necesitas análisis técnico profundo, control total del rastreo, y extracción de datos custom, nada le gana.

Una sola auditoría Screaming Frog puede descubrir problemas que GSC, Semrush, y Ahrefs juntos no detectan: canonical chains, hreflang inconsistencies, redirect loops, schema errors, orphan pages, over-optimized anchors. Problemas que matan rankings silenciosamente.

La inversión es ridícula para el valor: €300/año = €0.82/día. Un solo cliente recuperado con auditoría Screaming Frog paga la licencia 10x.

¿Necesitas Auditoría Técnica SEO Profesional?

Realizamos auditorías completas con Screaming Frog, GSC, Semrush y otras herramientas. Detectamos y solucionamos problemas técnicos que impiden rankear.

  • ✅ Rastreo completo con Screaming Frog (ilimitado)
  • ✅ Análisis on-page: titles, metas, H1, imágenes, canonicals
  • ✅ Detección enlaces rotos, redirect chains, errores 404/500
  • ✅ Auditoría hreflang (webs multi-idioma)
  • ✅ Verificación schema markup completa
  • ✅ Integración datos GSC + Analytics
  • ✅ Reporte priorizado con quick wins