Volver al blog

Sitemap XML en Webflow: qué incluir y qué excluir

Guía técnica del sitemap.xml en Webflow: qué genera por defecto, qué URLs excluir, cómo validar, multi-idioma y los errores que matan indexación.

Tabla de contenido

El sitemap.xml es el mapa que le das a Google de tu sitio. Hecho mal, le mandas a Google a indexar páginas que no deberías rankear y bajas autoridad. Hecho bien, acelera la indexación de contenido nuevo y le marca a Google qué es importante.

La buena noticia: Webflow genera sitemap automáticamente. La mala: el sitemap por defecto incluye URLs que no quieres indexar y excluye otras que sí. Esta guía técnica explica qué hace Webflow, qué tocar, y cómo dejar tu sitemap perfecto antes de cada lanzamiento.

Qué es un sitemap.xml (versión técnica)

Un sitemap.xml es un archivo en formato XML que lista las URLs de tu sitio que quieres que los motores de búsqueda indexen. Cada entrada puede incluir:

  • URL (<loc>) — obligatorio
  • Última modificación (<lastmod>) — recomendado
  • Frecuencia de cambio (<changefreq>) — opcional, Google la ignora desde 2022
  • Prioridad (<priority>) — opcional, Google también la ignora

En 2026 lo que importa de verdad es <loc> + <lastmod>. El resto es ruido histórico.

Tu sitemap vive en tudominio.com/sitemap.xml y se referencia desde robots.txt:

Sitemap: https://tudominio.com/sitemap.xml

Qué hace Webflow por defecto

Webflow auto-genera el sitemap incluyendo:

  • Todas las páginas estáticas publicadas (Home, Servicios, About, etc.)
  • Todos los items de Collections del CMS que están publicados
  • URLs de categorías y templates de CMS

Lo accesas en tudominio.com/sitemap.xml automáticamente. No necesitas plugin ni nada.

Lo bueno: cobertura completa out-of-the-box. Lo malo: incluye páginas que NO deberías indexar (legal, thank-you pages, drafts, etc.) y a veces excluye páginas dinámicas relevantes.

Qué SÍ debe incluir tu sitemap

1. Páginas core de marketing

Home, Servicios, About, Casos, Blog index, Contacto, Industrias verticales. Todo lo que represente tu oferta principal.

2. Todas las páginas de blog y CMS items relevantes

Cada post de blog, cada caso de estudio, cada landing dinámica de CMS. Estas son las páginas que más tráfico orgánico capturan.

3. Páginas de servicios y verticales

Si tienes /servicios/X/, /industria/Y/, /ciudad/Z/ — todas deben estar.

4. Páginas de comparativa y recursos

Tu post de Webflow vs WordPress, Webflow vs Framer, recursos gratuitos. Alto SEO value.

5. Páginas de localización (si aplica)

Si tu sitio tiene versiones en otros idiomas (/en/, /pt/), todas las versiones deben estar en el sitemap. Más detalle abajo en la sección de multi-idioma.

Qué NO debe incluir tu sitemap

1. Thank-you pages / páginas de confirmación

URLs tipo /gracias/, /confirmacion/, /descarga/. No quieres que rankeen — son páginas post-conversión que no tienen SEO value.

2. Páginas legales con bajo intent

Términos de uso, política de privacidad, política de cookies. Estas pueden estar en el sitemap pero con prioridad baja o excluirlas — no son páginas que queremos rankear como “Términos de uso de [empresa]”.

Decisión: incluir si tienen contenido propietario relevante, excluir si son boilerplate genérico.

3. Páginas de error y de búsqueda interna

404, 500, search results dinámicos (/buscar?q=...). Estas nunca deben estar en el sitemap.

4. URLs con parámetros de tracking

?utm_source=newsletter, ?ref=affiliate. Versiones canonicales sí, versiones parametrizadas no.

5. Drafts y staging

Páginas no publicadas, URLs *.webflow.io (staging), URLs internas con /preview/. Webflow normalmente las excluye solas, pero verifica.

6. Páginas duplicadas o thin content

Categorías de blog con 1-2 posts, tags con baja densidad, archivos por fecha. Si tienen <100 palabras de contenido único, excluir o consolidar.

7. Páginas de membership / contenido detrás de paywall

Si tu sitio tiene contenido detrás de login, esas URLs no deben estar en el sitemap (Google no puede crawlearlas igual).

Cómo excluir páginas del sitemap en Webflow

Webflow tiene tres niveles de control:

Nivel 1: Page Settings → SEO Settings → “Exclude this page from sitemap”

Para excluir páginas estáticas individuales:

  1. Pages panel → click en la página → Settings (engranaje)
  2. SEO Settings → marca “Exclude this page from sitemap”
  3. Publica

Útil para thank-you pages, páginas internas, páginas de test.

Nivel 2: CMS Collection Template Settings → “Don’t include in sitemap”

Para excluir items de Collections enteras (ej. una colección “Drafts” o “Internal”):

  1. CMS panel → click en la Collection → Settings
  2. Template page → SEO Settings → marca “Don’t include in sitemap”

Cuidado: esto excluye TODA la colección. Si quieres excluir items individuales, usa el siguiente nivel.

Nivel 3: Robots.txt con Disallow (no es sitemap pero complementa)

Aunque robots.txt no es el sitemap, dictar Disallow para ciertas URLs evita que Google las crawlee:

User-agent: *
Disallow: /gracias/
Disallow: /descarga/
Disallow: /preview/
Disallow: /admin/

Project Settings → SEO → Edit robots.txt.

Importante: Disallow en robots.txt NO equivale a “no indexar”. Para no indexar, usa la meta tag <meta name="robots" content="noindex"> en Page Settings.

Multi-idioma y multi-país: sitemap correcto

Si tu sitio usa Webflow Localization (próximamente), el sitemap debe reflejar las locales.

Estructura recomendada

Sitemap único con todas las URLs en todas las locales:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:xhtml="http://www.w3.org/1999/xhtml">
  <url>
    <loc>https://tudominio.com/blog/post-name/</loc>
    <xhtml:link rel="alternate" hreflang="es-CO" href="https://tudominio.com/blog/post-name/"/>
    <xhtml:link rel="alternate" hreflang="en-US" href="https://tudominio.com/en/blog/post-name/"/>
    <xhtml:link rel="alternate" hreflang="x-default" href="https://tudominio.com/blog/post-name/"/>
  </url>
</urlset>

Webflow Localization genera esto automáticamente si tienes Localization configurado correctamente. Si lo armas manual, asegúrate de incluir hreflang para cada locale.

Sitemaps separados por locale (alternativa)

Para sitios muy grandes (10.000+ URLs), separa el sitemap por locale:

  • tudominio.com/sitemap-es.xml
  • tudominio.com/sitemap-en.xml
  • tudominio.com/sitemap-index.xml (referencia ambos)

Webflow no soporta esto nativamente — requiere Cloudflare Workers o un sitemap custom.

Image y Video sitemaps

Webflow incluye automáticamente referencias a imágenes en el sitemap principal. Si tu sitio tiene un image gallery serio o muchos videos, considera un sitemap dedicado:

Image sitemap

<url>
  <loc>https://tudominio.com/portafolio/proyecto-1/</loc>
  <image:image>
    <image:loc>https://tudominio.com/proyecto-1-hero.jpg</image:loc>
    <image:title>Proyecto 1 — Caso de estudio</image:title>
    <image:caption>Diseño web custom para SaaS B2B</image:caption>
  </image:image>
</url>

Útil si capturas tráfico desde Google Images.

Video sitemap

Similar para videos. Webflow no genera esto auto — usar custom code en el head si tu negocio depende de video search.

Cómo validar tu sitemap

1. Schema Markup Validator (validación XML)

validator.schema.org — pega tu URL /sitemap.xml y verifica que sea XML válido.

2. Search Console (validación práctica)

  1. Search Console → Sitemaps
  2. Submit tudominio.com/sitemap.xml
  3. Verifica:
    • Status: “Success”
    • Discovered URLs vs Indexed URLs — si gap es >30%, hay problemas
    • Errors: 0 idealmente
    • Warnings: revisar cada uno

3. Screaming Frog

Crawl mode → “List” → submit your sitemap URL. Verifica:

  • Todas las URLs retornan 200 OK
  • No hay redirect chains
  • No hay URLs con noindex
  • Title tags y meta descriptions presentes

4. Test manual con curl

curl -I https://tudominio.com/sitemap.xml

Debe retornar 200 OK con Content-Type: application/xml.

Errores comunes en sitemaps de Webflow

Error 1: Incluir thank-you pages

El sitemap por defecto las incluye. Excluye manual en Page Settings. Si no, Google las indexa, y peor: las puede mostrar en resultados orgánicos antes que tu landing real.

Error 2: No actualizar lastmod al editar contenido

Webflow actualiza lastmod automáticamente al publicar. Pero si editas en staging sin publicar, lastmod no cambia. Solución: republica después de cada edición importante.

Error 3: Sitemap con URLs antiguas tras migración

Si migraste tu sitio (ej. de WordPress a Webflow — ver guía de migración), el sitemap puede tener URLs viejas. Submit el nuevo a Search Console y marca el viejo como obsoleto.

Error 4: Sitemap inalcanzable (404 o 500)

Webflow a veces tiene downtime de minutos. Verifica tudominio.com/sitemap.xml mensualmente con un uptime monitor (UptimeRobot gratis).

Error 5: URLs en sitemap con noindex meta

Conflicto típico: una página con <meta name="robots" content="noindex"> que aparece en el sitemap. Google se confunde. Solución: si quieres no indexar, también excluye del sitemap.

Error 6: Sitemap superando 50MB o 50.000 URLs

Límites oficiales de Google. Si tu sitemap los supera, divídelo en sitemaps por sección + sitemap index. Webflow rara vez llega a estos límites en sitios marketing, pero publishers sí.

Error 7: No referenciar el sitemap en robots.txt

Es opcional pero recomendado. Edita robots.txt en Webflow:

User-agent: *
Allow: /

Sitemap: https://tudominio.com/sitemap.xml

Stack que aplicamos a cada cliente

Para sitios B2B marketing típicos en Webflow:

Pre-launch (en staging)

  1. Genera lista de TODAS las URLs del sitio (incluyendo CMS items)
  2. Marca cuáles deben excluirse del sitemap (thank-you, legal de bajo intent, internas)
  3. Configura exclusiones en Page Settings y Collection Templates
  4. Publica
  5. Verifica tudominio.com/sitemap.xml manualmente — debe coincidir con tu lista de “incluir”

Post-launch (semana 1)

  1. Submit sitemap a Search Console
  2. Edita robots.txt para referenciarlo
  3. Verifica indexación inicial en Search Console → Coverage

Continuo

  1. Semanal (primeros 2 meses): revisar Search Console → Sitemaps por errores
  2. Mensual: validar que sitemap retorna 200, contar URLs vs. lo esperado
  3. Trimestral: full crawl con Screaming Frog para detectar drift

Cuándo necesitas más que el sitemap default

El sitemap auto-generado de Webflow es suficiente para 90% de los sitios marketing. Casos donde necesitas custom:

1. Sitios con >5.000 URLs

A esa escala, considera dividir en sitemaps por sección. Requiere Cloudflare Workers o sitemap manual.

2. Multi-idioma con hreflang complejo

Si tienes 5+ locales con URLs distintas, el sitemap default puede no manejar bien el hreflang. Considera sitemap custom con <xhtml:link> explícito.

3. E-commerce con cientos de productos

Webflow E-commerce hasta 3.000 productos funciona bien. Más allá, dividir es buena práctica.

4. Sitios con contenido pesado en imágenes/videos

Si dependes de Image Search o Video SEO, sitemap dedicado de imágenes/videos da mejor cobertura.

5. Publishers con publicación diaria

Para news sites, además del sitemap general considera un News Sitemap (formato Google News). Webflow no genera esto nativo.

Próximos pasos

Si quieres una auditoría específica del sitemap de tu sitio Webflow (qué tiene de más, qué falta, cómo se compara a competencia), solicita la auditoría SEO gratuita — incluye análisis de sitemap, indexación en Search Console y plan de optimización.

Si vas a lanzar un sitio nuevo en Webflow, agenda una llamada — configuramos sitemap, robots.txt, schema y meta tags correctos desde el día uno como parte del entregable base.

Y si esto es para tu propio aprendizaje: la regla es el sitemap es un mapa para Google, no un inventario. Solo incluye URLs que quieres que Google priorice. Todo lo demás es ruido que diluye autoridad.

¿Listo para llevar tu presencia digital al siguiente nivel?