¿Qué es robots.txt y para qué sirve?

Robots.txt es archivo texto plano en raíz dominio (example.com/robots.txt) que indica bots (Googlebot, Bingbot) qué pueden rastrear. Funciones: 1) Control crawl (bloquea áreas privadas: /admin/, /cart/). 2) Crawl budget optimization (bloquea parámetros URL, búsquedas internas sin valor). 3) Declara sitemap. 4) Protege contenido staging. NO previene indexación (usa meta noindex para eso). Robots.txt controla CRAWL, no indexación. Bots maliciosos pueden ignorarlo (no es seguridad, solo guía crawlers legítimos).

¿Cuál es la diferencia entre Disallow y noindex?

Disallow (robots.txt): impide CRAWL, Googlebot no visita URL. Noindex (meta tag): impide INDEXACIÓN, Google no incluye en resultados pero SÍ crawlea. Paradoja: URL bloqueada robots.txt PUEDE indexarse vía backlinks externos (Google indexa sin crawlear). Para NO indexar: meta noindex (requiere Google crawlee página detectar tag). Uso correcto: Disallow = crawl budget optimization (parámetros, búsquedas). Noindex = contenido crawleable pero no indexable (thin content, thank you pages). NO uses Disallow para evitar indexación (inefectivo).

¿Cómo bloquear parámetros URL con robots.txt?

Usa wildcard * para bloquear cualquier URL conteniendo parámetro. Ejemplos: Disallow: /*?color= (bloquea /productos?color=rojo), Disallow: /*?size= (bloquea variaciones size), Disallow: /*sort= (bloquea sorting), Disallow: /*?utm_ (bloquea tracking). Sintaxis: /* = cualquier ruta antes parámetro, ?param= = parámetro específico. Común ecommerces: filtros color/size/sort desperdician 60-80% crawl budget. Bloquear libera budget productos reales. Testing: Search Console Robots Tester con URL ejemplo.

¿Puedo bloquear CSS y JavaScript en robots.txt?

NO deberías (errores comunes). Google necesita CSS/JavaScript para rendering correcto (especialmente JavaScript sites). Bloquear causa: 1) Googlebot no puede renderizar página correctamente. 2) Mobile-Friendly Test falla. 3) JavaScript content no indexa. Evita: Disallow: /css/, Disallow: /js/, Disallow: /wp-includes/ (WordPress jQuery). Permite explícitamente si necesario: Allow: /wp-includes/js/. Excepción: CSS/JS áreas privadas admin (no afectan frontend). Regla: frontend CSS/JS siempre accesible Googlebot.

¿Qué hace User-agent: * en robots.txt?

User-agent: * = wildcard "todos los bots". Directivas después aplican ANY crawler (Googlebot, Bingbot, etc). Uso: reglas generales default. Específicos: User-agent: Googlebot (solo Google), User-agent: Bingbot (solo Bing). Order matters: específico antes wildcard. Ejemplo: User-agent: Googlebot / Disallow: (permite Google) → User-agent: * / Disallow: / (bloquea otros). Googlebot matchea primera regla específica. Común: User-agent: * con reglas generales (bloquea /admin/ todos bots).

¿Cómo declarar sitemap en robots.txt?

Sintaxis: Sitemap: https://example.com/sitemap.xml (URL absoluta completa, NO relativa). Beneficios: ayuda Google descubrir sitemap sin configurar Search Console, múltiples sitemaps permitidos (Sitemap: url1, Sitemap: url2). Ubicación: cualquier parte robots.txt (típicamente al final). Error común: Sitemap: /sitemap.xml (relativa, puede no funcionar). Nota: declarar robots.txt NO reemplaza submit Search Console (hacer ambos). Sitemap puede ser gzipped (.xml.gz). Example: Sitemap: https://example.com/sitemap.xml, Sitemap: https://example.com/sitemap-products.xml.gz.

¿Qué significa Disallow: / en robots.txt?

Disallow: / = bloquea RAÍZ y todo el sitio completo (/ = root). Googlebot NO puede crawlear NINGUNA página. Resultado: desindexación total sitio en días/semanas, tráfico orgánico = 0. Uso legítimo: staging/development sites (evitar indexación accidental). Producción: NUNCA uses Disallow: / a menos intentes bloquear sitio completo. Permitir todo: Disallow: (vacío) o omitir directiva Disallow. Error fatal común: copiar robots.txt staging → producción sin quitar Disallow: /. Siempre testea Search Console antes publicar cambios robots.txt.

¿Robots.txt funciona para subdominios y subdirectorios?

Subdominios: cada subdominio necesita robots.txt propio. example.com/robots.txt NO afecta blog.example.com (subdomain separado). Ubicación: blog.example.com/robots.txt. Subdirectorios: robots.txt raíz aplica todo site. example.com/robots.txt afecta example.com/blog/, example.com/shop/, etc. NO puedes poner robots.txt subdirectorio (example.com/blog/robots.txt ignorado Google). Regla: 1 robots.txt por dominio/subdomain en raíz. Paths case-sensitive: example.com/Admin/ ≠ example.com/admin/.

¿Cómo testear robots.txt antes de publicar cambios?

Testing methods: 1) Google Search Console Robots Tester: edita contenido, test URLs específicas, ve bloqueado/permitido. 2) Staging: implementa robots.txt staging primero, test completo, luego producción. 3) Validators online: technicalseotool.com/robots-txt-validator (sintaxis). 4) Curl: curl https://example.com/robots.txt (verifica accesible 200 OK). Checklist test: URLs importantes NO bloqueadas, /admin/ SÍ bloqueada, wildcards funcionan (test URLs parámetros), sitemap declarado, CSS/JS accesibles. Backup: copia robots.txt actual antes cambios (rollback rápido si problemas).

¿Cuánto tarda Google en procesar cambios robots.txt?

Timeline: Google re-crawl robots.txt frecuentemente (horas a 1 día típico). Cambios aplicados: próximo crawl páginas afectadas. Efecto completo: 1-4 semanas (depende frecuencia crawl sitio). Acelerar: Search Console → Submit new robots.txt (legacy tool), Request Indexing páginas críticas. Monitoreo: Search Console Coverage (páginas bloqueadas nuevas aparecen días/semanas), log file analysis (valida Googlebot respeta nuevas reglas). Warning: errores robots.txt (bloquear contenido accidentalmente) pueden devastar tráfico 24-48h. Revertir cambios inmediatamente si problemas detectados.

SEO Técnico

Robots.txt avanzado: Sintaxis completa y mejores prácticas

Cristian Programa

Especialista en SEO

• 22 enero, 2025 • 15 min lectura

Robots.txt avanzado: sintaxis completa y mejores prácticas SEO

El 54% de webs tienen errores críticos en robots.txt que causan desastres SEO: contenido bloqueado accidentalmente (Google no puede crawlear productos/artículos), sintaxis incorrecta (Google ignora archivo completo), wildcards mal usados (bloquean todo el sitio), sitemap no declarado (indexación lenta). Un solo error en robots.txt puede devastar tráfico orgánico en 24-48 horas.

Robots.txt es archivo de texto plano en raíz del dominio (example.com/robots.txt) que indica a bots (Googlebot, Bingbot, etc) qué pueden rastrear y qué NO. Es una de las herramientas SEO más poderosas: controla crawl budget, protege contenido privado, declara sitemap. Pero también es una de las más peligrosas: Disallow: / (una línea) bloquea todo tu sitio de Google.

En esta guía exhaustiva aprenderás: sintaxis robots.txt completa (User-agent, Disallow, Allow, Crawl-delay, Sitemap), wildcards (* y $), casos de uso específicos, errores fatales comunes, testing con Search Console, y ejemplos robots.txt reales para ecommerce, blogs, sites corporativos. Todo para dominar robots.txt sin destruir tu SEO accidentalmente.

⚠️ ¿Tu robots.txt tiene errores críticos bloqueando contenido?

Auditoría gratuita robots.txt y configuración crawl optimal.

Solicitar auditoría robots.txt

📝 Sintaxis Básica Robots.txt

Estructura Fundamental

User-agent: *
Disallow: /admin/
Allow: /admin/public/

Sitemap: https://example.com/sitemap.xml

Directivas Principales

        
            Directivas Robots.txt:
        
        User-agent: Especifica bot al que aplican reglas (Googlebot, Bingbot, *)
Disallow: Prohíbe crawl de URLs especificadas
Allow: Permite crawl (overrides Disallow más general)
Sitemap: Declara ubicación XML sitemap
Crawl-delay: Delay entre requests (solo Bing/Yandex, Google ignora)

    

User-agent Específicos

# Googlebot (Google Search)
User-agent: Googlebot
Disallow: /no-google/

# Bingbot (Bing)
User-agent: Bingbot
Disallow: /no-bing/

# Googlebot-Image (Google Images)
User-agent: Googlebot-Image
Disallow: /imagenes-privadas/

# Todos los bots (* = wildcard)
User-agent: *
Disallow: /privado/

Case Sensitivity y Formato

URLs: Case-sensitive (/Admin/ ≠ /admin/)
Directivas: Case-insensitive (Disallow = disallow = DISALLOW)
Ubicación: DEBE estar en https://example.com/robots.txt (raíz dominio)
Encoding: UTF-8 recomendado
Comments: Líneas empezando con #

🔧 Directivas Avanzadas

Disallow: Bloquear Crawl

Bloquear Directorio Completo:

User-agent: *
Disallow: /admin/          # Bloquea /admin/ y todo subdirectorios
Disallow: /private/        # Bloquea /private/*

Bloquear URL Específica:

Disallow: /secret-page.html    # Solo esa página exacta

Bloquear Todo el Sitio:

User-agent: *
Disallow: /                # ⚠️ PELIGROSO: bloquea TODO

No Bloquear Nada:

User-agent: *
Disallow:                  # Vacío = permite todo
# O simplemente omitir Disallow

Allow: Permitir Excepciones

Caso uso: Bloquea directorio pero permite subdirectorio específico

User-agent: *
Disallow: /admin/          # Bloquea /admin/*
Allow: /admin/public/      # EXCEPTO /admin/public/* (permitido)

# Googlebot rastrea:
# ✅ /admin/public/page.html
# ❌ /admin/private/page.html

Importante: Allow DEBE ser más específico que Disallow para funcionar

Sitemap: Declarar XML Sitemaps

User-agent: *
Disallow: /admin/

# Declarar sitemaps (múltiples permitidos)
Sitemap: https://example.com/sitemap.xml
Sitemap: https://example.com/sitemap-products.xml
Sitemap: https://example.com/sitemap-blog.xml

Beneficio: Ayuda Google descubrir sitemap sin configurar Search Console

Crawl-delay: Limitar Tasa Rastreo

# Solo Bing y Yandex (Google IGNORA)
User-agent: Bingbot
Crawl-delay: 10            # 10 segundos entre requests

User-agent: Googlebot
# Google usa Search Console → Settings → Crawl Rate en lugar

Nota: Crawl-delay NO es estándar Google. Para Google: Search Console crawl rate settings.

🔀 Wildcards: * y $

Wildcard * (Asterisco)

Significa: Cualquier secuencia caracteres (0 o más)

Ejemplos:

# Bloquea todas URLs con parámetro "sort"
Disallow: /*sort=           # /productos?sort=precio ❌
                            # /categorias?filter=rojo&sort=fecha ❌

# Bloquea archivos PDF
Disallow: /*.pdf$           # /documento.pdf ❌
                            # /docs/manual.pdf ❌

# Bloquea parámetros tracking
Disallow: /*?utm_           # /?utm_source=google ❌
                            # /page?utm_campaign=email ❌

# Bloquea todas paginaciones
Disallow: /*/page/          # /blog/page/2 ❌
                            # /productos/categoria/page/5 ❌

Wildcard $ (Dollar Sign)

Significa: Fin de URL

Ejemplos:

# Bloquea URLs terminando exactamente en .pdf
Disallow: /*.pdf$           # /doc.pdf ❌
                            # /doc.pdf?version=2 ✅ (permitido, no termina en .pdf)

# Bloquea URLs terminando en parámetro específico
Disallow: /*?print$         # /page?print ❌
                            # /page?print=true ✅ (permitido, no termina exacto)

Combinando Wildcards

# Bloquea todas variaciones color/size
Disallow: /*color=*
Disallow: /*size=*
Disallow: /*?*color*        # Aún más agresivo

# Bloquea búsquedas internas
Disallow: /*?s=*            # WordPress search
Disallow: /*?q=*            # Generic search
Disallow: /search*          # Todo bajo /search/

🎯 Casos de Uso Específicos

Ecommerce

User-agent: *

# Bloquea admin y checkout
Disallow: /admin/
Disallow: /cart/
Disallow: /checkout/
Disallow: /my-account/

# Bloquea parámetros filtros (crawl budget waste)
Disallow: /*?color=
Disallow: /*?size=
Disallow: /*?sort=
Disallow: /*?filter=

# Bloquea búsqueda interna
Disallow: /search
Disallow: /*?s=

# Permite productos (excepción)
Allow: /productos/

# Sitemaps
Sitemap: https://example.com/sitemap.xml
Sitemap: https://example.com/sitemap-products.xml

Blog / Medio Digital

User-agent: *

# Bloquea admin WordPress
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php    # Excepción (AJAX necesario)

# Bloquea archivos WordPress innecesarios
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/

# Bloquea tags combinatorios excesivos
Disallow: /tag/*/tag/              # Multiple tags

# Bloquea búsqueda
Disallow: /?s=

# Bloquea paginaciones muy altas
Disallow: /*/page/[5-9]*           # Páginas 5+
Disallow: /*/page/[0-9][0-9]*      # Páginas 10+

Sitemap: https://example.com/sitemap.xml

Sitio Corporativo

User-agent: *

# Bloquea áreas privadas
Disallow: /admin/
Disallow: /private/
Disallow: /internal/

# Bloquea archivos no-indexables
Disallow: /*.pdf$
Disallow: /*.doc$
Disallow: /*.docx$

# Bloquea formularios
Disallow: /forms/submit

# Permite recursos públicos
Allow: /recursos/
Allow: /documentacion/

Sitemap: https://example.com/sitemap.xml

Sitio Desarrollo/Staging

# STAGING: Bloquear TODO (evitar indexación accidental)
User-agent: *
Disallow: /

# Nota: Añadir TAMBIÉN meta noindex en pages:
# <meta name="robots" content="noindex, nofollow">

Bloquear Bots Malos (Scrapers)

# Googlebot: permite
User-agent: Googlebot
Disallow:

# Bingbot: permite
User-agent: Bingbot
Disallow:

# Bots malos: bloquea TODO
User-agent: SemrushBot
Disallow: /

User-agent: AhrefsBot
Disallow: /

User-agent: DotBot
Disallow: /

# Todos otros: permite (wildcard último)
User-agent: *
Disallow:

Nota: Bots maliciosos pueden ignorar robots.txt. Para bloqueo real: IP blocking, .htaccess

⚠️ Errores Fatales Robots.txt

Error #1: Bloquear Todo el Sitio Accidentalmente

# ❌ FATAL: Bloquea TODO tu sitio
User-agent: *
Disallow: /

# ✅ CORRECTO: Permite todo
User-agent: *
Disallow:
# O simplemente omitir Disallow

Resultado error: Google no puede crawlear NADA → desindexación completa → tráfico orgánico = 0

Error #2: Bloquear CSS/JavaScript

# ❌ MAL: Bloquea recursos rendering
Disallow: /css/
Disallow: /js/
Disallow: /wp-includes/      # Bloquea jQuery WordPress

# ✅ BIEN: Permite CSS/JS (Google necesita para rendering)
Allow: /css/
Allow: /js/
Allow: /wp-includes/js/

Resultado error: Googlebot no puede renderizar correctamente (JavaScript/CSS bloqueados)

Error #3: Sintaxis Incorrecta (Espacios)

# ❌ MAL: Espacio después User-agent
User-agent : *              # Espacio antes : = invalido
Disallow: /admin/

# ❌ MAL: Espacio en medio ruta
Disallow: /no allowed/      # Debería ser /no-allowed/ o /no%20allowed/

# ✅ BIEN:
User-agent: *
Disallow: /admin/

Error #4: Ubicación Incorrecta

❌ example.com/blog/robots.txt (subdirectorio: Google ignora)
❌ example.com/Robots.txt (case matters: debe ser lowercase)
✅ example.com/robots.txt (raíz dominio, lowercase)

Error #5: Confundir Disallow con Noindex

🚨 CRÍTICO: Disallow ≠ Noindex

Disallow: Impide CRAWL (Googlebot no visita)
Noindex: Impide INDEXACIÓN (Google no incluye en resultados)

Problema: URL bloqueada robots.txt PUEDE indexarse (vía backlinks externos)

Solución noindex: <meta name="robots" content="noindex">

Paradoja: Para noindex funcionar, Google DEBE crawlear página (detectar meta tag)

Conclusión: NO uses Disallow para evitar indexación. Usa meta noindex.

Error #6: Wildcards Incorrectos

# ❌ MAL: Olvida * antes parámetro
Disallow: ?color=           # Solo bloquea literalmente "?color=" (nada útil)

# ✅ BIEN: * captura todo antes parámetro
Disallow: /*?color=         # Bloquea cualquier URL con ?color=

# ❌ MAL: $ mal usado
Disallow: /*.pdf            # Bloquea .pdf y .pdf?version=2

# ✅ BIEN: $ solo si quieres terminal exacto
Disallow: /*.pdf$           # Solo URLs terminando exactamente .pdf

Error #7: Sitemap URL Relativa

# ❌ MAL: URL relativa
Sitemap: /sitemap.xml

# ✅ BIEN: URL absoluta completa
Sitemap: https://example.com/sitemap.xml

🧪 Testing Robots.txt

Herramienta 1: Google Search Console Robots.txt Tester

Ruta: Search Console → Legacy tools → robots.txt Tester

Cómo usar:

Ve al tester (muestra tu robots.txt actual)
Edita contenido (testing cambios sin publicar)
Test URLs específicas (input URL, click "Test")
Ve si bloqueado o permitido para Googlebot
Submit robots.txt actualizado (si correcto)

Herramienta 2: Validación Sintaxis Online

URLs:

technicalseotool.com/robots-txt-validator
ryte.com/free-tools/robots-txt/

Herramienta 3: Curl (Command Line)

# Verificar robots.txt accesible
curl https://example.com/robots.txt

# Debería retornar contenido robots.txt
# Status 200 OK

Testing Checklist

☐ Robots.txt accesible example.com/robots.txt (200 OK)
☐ Sintaxis correcta (sin espacios inapropiados, directivas válidas)
☐ Test URLs importantes NO bloqueadas (productos, artículos, landing pages)
☐ URLs privadas SÍ bloqueadas (/admin/, /cart/, /checkout/)
☐ CSS/JavaScript NO bloqueados (Google rendering necesita)
☐ Sitemap declarado (URL absoluta)
☐ Wildcards funcionan correctamente (test URLs con parámetros)

✨ Mejores Prácticas

1. Empieza Simple, Luego Expande

# Versión 1: Mínimo viable
User-agent: *
Disallow: /admin/
Sitemap: https://example.com/sitemap.xml

# Luego añade según necesidad (parámetros, crawl budget optimization)

2. Comenta Tu Código

User-agent: *

# Admin y áreas privadas
Disallow: /admin/
Disallow: /private/

# Crawl budget optimization: bloquea parámetros filtros
Disallow: /*?color=
Disallow: /*?size=

# Sitemap principal
Sitemap: https://example.com/sitemap.xml

3. Mantén Backup Antes de Cambios

Copia robots.txt actual antes modificar
Test en staging primero
Implementa cambios gradualmente
Monitorea Search Console Coverage post-cambios

4. Combina con Meta Robots

Robots.txt: Crawl control, crawl budget
Meta noindex: Indexation control (páginas crawleables pero no indexables)
Canonical: Duplicate content consolidation

5. Monitorea Regularmente

Search Console Coverage: páginas bloqueadas accidentalmente?
Log file analysis: Googlebot respeta robots.txt?
Tráfico orgánico: caídas súbitas post-cambios robots.txt?

✅ Checklist Robots.txt

Setup Básico

☐ Archivo ubicado https://example.com/robots.txt (raíz dominio)
☐ Accesible públicamente (200 OK, no 404/403)
☐ Encoding UTF-8
☐ Sintaxis válida (Search Console Tester sin errores)

Directivas Esenciales

☐ User-agent especificado (* o específico)
☐ Disallow áreas privadas (/admin/, /cart/, etc)
☐ Sitemap declarado (URL absoluta)
☐ CSS/JavaScript NO bloqueados

Crawl Budget Optimization

☐ Bloquea parámetros URL sin valor (filtros, sorting)
☐ Bloquea búsquedas internas (/search, ?s=)
☐ Bloquea paginaciones muy altas (crawl waste)
☐ Permite contenido importante (productos, artículos)

Testing

☐ Search Console Robots.txt Tester valida sintaxis
☐ Test URLs críticas NO bloqueadas
☐ Test URLs privadas SÍ bloqueadas
☐ Wildcards funcionan (test con URLs parámetros)

Monitoreo

☐ Search Console Coverage: zero páginas bloqueadas importante
☐ Tráfico orgánico estable post-cambios
☐ Log analysis: Googlebot respeta directivas

🎯 Conclusión: Robots.txt = Poder + Responsabilidad

Robots.txt es herramienta SEO más poderosa Y más peligrosa. Una línea (Disallow: /) puede desindexar todo tu sitio en 48 horas. Una directiva mal configurada puede bloquear contenido crítico durante meses sin que lo detectes. Pero usada correctamente, robots.txt optimiza crawl budget masivamente, protege áreas privadas, y guía Googlebot eficientemente.

El 54% webs tienen errores robots.txt porque: asumen sintaxis simple (pero wildcards/Allow/espacios son tricky), confunden Disallow con noindex, bloquean CSS/JavaScript accidentalmente, nunca testean cambios. La clave: empieza simple, test exhaustivo antes publicar, monitorea Search Console Coverage post-cambios, mantén backup siempre.

Robots.txt bien optimizado (bloquea parámetros inútiles, permite contenido importante, declara sitemap) libera 40-70% crawl budget desperdiciado, acelera indexación contenido nuevo 3-5x, previene problemas crawl que destruyen tráfico. Mientras competencia opera con robots.txt default (básico/ineficiente), tú optimizas crawl precision quirúrgica.

¿Necesitas Optimizar Tu Robots.txt?

Auditoría completa robots.txt con optimización crawl budget personalizada.

✅ Análisis robots.txt actual (errores, oportunidades)
✅ Log file analysis (identificar crawl waste)
✅ Robots.txt optimizado custom (ecommerce, blog, corporativo)
✅ Testing exhaustivo Search Console
✅ Implementación segura (staging → producción)
✅ Monitoreo post-cambios (validar mejoras)
✅ Documentación técnica

Solicitar optimización robots.txt

¿Listo para llevar tu negocio al siguiente nivel?

Solicita una consultoría gratuita y descubre cómo podemos ayudarte a crecer con SEO y marketing digital.

Solicitar consultoría gratuita

Negocios locales

Negocios digitales

Por Ciudad

Robots.txt avanzado: Sintaxis completa y mejores prácticas

📝 Sintaxis Básica Robots.txt

Estructura Fundamental

Directivas Principales

Directivas Robots.txt:

User-agent Específicos

Case Sensitivity y Formato

🔧 Directivas Avanzadas

Disallow: Bloquear Crawl

Bloquear Directorio Completo:

Bloquear URL Específica:

Bloquear Todo el Sitio:

No Bloquear Nada:

Allow: Permitir Excepciones

Sitemap: Declarar XML Sitemaps

Crawl-delay: Limitar Tasa Rastreo

🔀 Wildcards: * y $

Wildcard * (Asterisco)

Ejemplos:

Wildcard $ (Dollar Sign)

Ejemplos:

Combinando Wildcards

🎯 Casos de Uso Específicos

Ecommerce

Blog / Medio Digital

Sitio Corporativo

Sitio Desarrollo/Staging

Bloquear Bots Malos (Scrapers)

⚠️ Errores Fatales Robots.txt

Error #1: Bloquear Todo el Sitio Accidentalmente

Error #2: Bloquear CSS/JavaScript

Error #3: Sintaxis Incorrecta (Espacios)

Error #4: Ubicación Incorrecta

Error #5: Confundir Disallow con Noindex

🚨 CRÍTICO: Disallow ≠ Noindex

Error #6: Wildcards Incorrectos

Error #7: Sitemap URL Relativa

🧪 Testing Robots.txt

Herramienta 1: Google Search Console Robots.txt Tester

Cómo usar:

Herramienta 2: Validación Sintaxis Online

Herramienta 3: Curl (Command Line)

Testing Checklist

✨ Mejores Prácticas

1. Empieza Simple, Luego Expande

2. Comenta Tu Código

3. Mantén Backup Antes de Cambios

4. Combina con Meta Robots

5. Monitorea Regularmente

✅ Checklist Robots.txt

Setup Básico

Directivas Esenciales

Crawl Budget Optimization

Testing

Monitoreo

🎯 Conclusión: Robots.txt = Poder + Responsabilidad

¿Necesitas Optimizar Tu Robots.txt?

Compartir este artículo

Core Web Vitals: Guía Completa 2025 para Mejorar LCP, FID y CLS

Crawl Budget Optimization: Guía para maximizar rastreo de Google

Hreflang: Guía completa para SEO internacional en España

¿Listo para llevar tu negocio al siguiente nivel?