TL;DR
- YouTube es la fuente de vídeo más citada por LLMs en proporción 200:1 vs cualquier otro canal (TikTok, Vimeo, Twitch, Dailymotion).
- En 2025, YouTube apareció en el 29,5% de las AI Overviews de Google; en queries de marca enterprise llegó al 60%.
- 94% de las citas YouTube van a vídeos long-form (5-20 min), no a Shorts.
- Visualizaciones, likes y suscriptores no correlacionan con citaciones (r ≈ -0,03). El 40,83% de vídeos citados tenían <1.000 visualizaciones.
- Los LLMs no ven los vídeos: leen las transcripciones, los chapters y la metadata.
- Solo el 14% de marketers usa tracking AI; el 43% lo declara estrategia core 2026 → ventana de oportunidad alta.
Los datos duros (2025-2026)
| Plataforma | Cuota YouTube en respuestas | Fuente |
| Google AI Overviews | 29,5% avg — hasta 60% en queries de marca | BrightEdge 2025 |
| Google AI Overviews (mix social) | 36,6% del mix YouTube | OtterlyAI 2026 |
| Google AI Mode | 19,6% | OtterlyAI 2026 |
| Perplexity | 38,7% del mix YouTube; 22,7% del mix social | OtterlyAI 2026 |
| ChatGPT | 4,4% YouTube / 9,5% del mix social (Reddit domina al 53,6%) | OtterlyAI 2026 |
| Microsoft Copilot | 0,5% YouTube (LinkedIn lidera 43,8%) | OtterlyAI 2026 |
| Gemini | 0,2% YouTube | OtterlyAI 2026 |
YouTube es el canal dominante en el ecosistema Google (AI Overviews + AI Mode), competitivo en Perplexity, secundario en ChatGPT/Copilot. No es bala de plata: es la mejor apuesta si tu audiencia consulta principalmente Google y Perplexity.
Topic categories donde YouTube arrasa
- Salud: Google AI Overviews cita YouTube más que cualquier hospital site para queries médicas.
- Demos, walkthroughs, tutoriales, comparativas.
- Conferencias, lectures, interviews, case studies.
- How-to y "what is X / how does X work".
Por qué los LLMs eligen YouTube
No es por el vídeo. Es por la estructura del texto que lo rodea.
- Transcripciones automáticas — texto plano indexable.
- Metadata estructurada — título, descripción, tags, timestamps.
- Chapters con timestamps — segmentación semántica para citas a momentos específicos.
- Comentarios — señal social adicional.
- Subtítulos multi-idioma — amplían el corpus desde un solo asset.
- API pública de Google — Gemini y AI Overviews acceden vía pipeline directo del propietario.
"Los LLMs no ven tus vídeos. Leen las transcripciones." — Brainlabs Digital 2026
La paradoja virality vs citation (OtterlyAI 2026)
- Views vs citas: r ≈ -0,03 (cero).
- Likes vs citas: r ≈ -0,02.
- Subscribers vs citas: r ≈ -0,03.
- 40,83% de vídeos citados tenían <1.000 visualizaciones.
- 36% tenían <15 likes.
- 35% de canales citados tenían <10.000 suscriptores.
- 50% de canales citados tenían menos de 41 vídeos totales.
Un canal nuevo con 5 vídeos bien estructurados puede competir en citaciones LLM contra un canal con 1B vistas. Los LLMs valoran referencia y claridad, no popularidad.
Pipeline de ingestión LLM → YouTube
Vídeo subido a YouTube
↓
Auto-transcripción (whisper-style) ←─ override con transcript pulido (recomendado)
↓
Indexación por Google Search + YouTube API
↓
Disponible en:
- Google Search (resultados orgánicos vídeo)
- Google AI Overviews + AI Mode + Gemini (acceso privilegiado)
- Crawlers de Perplexity, ChatGPT, Copilot (vía YouTube público + transcripción)
↓
Cita en respuesta LLM cuando:
1. La transcripción contiene la respuesta directa a la query
2. Los chapters/timestamps coinciden con la pregunta
3. La metadata refuerza la entidad
Qué leen los LLMs (en orden de peso)
- Título (primera señal semántica).
- Descripción (primeras 150-300 palabras especialmente).
- Chapters/timestamps — 78% de vídeos con timestamps son citados repetidamente, en 2-5 chapters distintos.
- Transcripción completa (corpus principal).
- Tags y categoría.
- Comentarios destacados.
- Closed captions multi-idioma.
Lo que NO leen: thumbnails, edición visual, música, gráficos en pantalla (salvo si están textualmente en transcripción/captions).
Citas con timestamp: el unlock del ecosistema Google
- 73% de citas con timestamp aparecen en Google AI Overviews.
- 27% en Google AI Mode.
- 0% en ChatGPT, Copilot, Gemini, Perplexity.
Si tu audiencia objetivo está en Google AI Overviews, chapters bien marcados duplican o triplican la superficie de cita por vídeo.
Estructura de vídeo que maximiza citas
| Elemento | Recomendación validada |
| Duración | 5-20 min (cluster mayor: 10-20 min con 32,1%; 5-10 min con 26,1%) |
| Formato | Long-form reference (tutorial, walkthrough, explainer, lecture, case study) |
| Estructura | 3-7 chapters claramente marcados, ≥10s/chapter, primer chapter en 00:00 |
| Frase apertura | Primeros 30s = respuesta directa a la query objetivo, snippet-friendly |
| Idioma hablado | EN para máxima cobertura LLM; ES si la audiencia es local |
| Subtítulos | EN + ES + idiomas relevantes |
Optimización de transcripción
No te conformes con auto-transcripción. Sube transcripción pulida manualmente:
- Corrige nombres de marca, productos, conceptos técnicos.
- Inserta puntuación natural.
- Mantén lenguaje conversacional (mejor para query-matching).
- Repite la entidad/marca de forma natural 3-5 veces.
- Reformula la pregunta target dentro de la respuesta ("La razón por la que [query] sucede es…").
Metadata: la palanca infravalorada
Título
Estructura ganadora: [Query exacta o reformulación cercana] | [Diferenciador o contexto]
Ejemplos: "How does GEOradar measure brand visibility in LLMs? | 2026 walkthrough" · "Cómo aparece tu marca en ChatGPT (y cómo medirlo) | GEOradar demo"
Descripción
- Primeras 40-60 palabras = respuesta directa al título.
- 150-400 palabras de descripción real (no solo timestamps + links).
- 3-5 entidades clave (marca, producto, conceptos asociados).
- Hashtags al final (3-5 max).
Chapters
- Mínimo 3, idealmente 5-8.
- Primer chapter siempre en 00:00.
- Cada chapter ≥10 segundos.
- Nombre del chapter = pregunta o concepto clave, no "Intro" o "Parte 2".
Tags
5-15 tags. Mezcla de short-tail (GEO, AI search) y long-tail (how to track brand mentions in ChatGPT).
La frecuencia importa menos que la consistencia
- 50% de canales citados tienen <41 vídeos totales. No necesitas un canal masivo.
- 5-10 vídeos bien estructurados sobre tu nicho pueden generar citas LLM consistentes.
- Evita ráfagas: 1-2 vídeos/mes durante 12 meses > 24 vídeos en 1 mes y silencio.
Salud: YouTube > webs hospitalarias
Estudio Search Engine Land + SEJ 2026. Google AI Overviews citan YouTube más que Mayo Clinic, Cleveland Clinic o NHS para queries médicas. La autoridad institucional no protege si el formato es texto-en-web vs vídeo-en-YouTube.
SaaS: 6× crecimiento en trials atribuidos a IA en 7 semanas
Caso Discovered (Discovered Labs 2026). 575 → 3.500+ trials atribuidos a recomendaciones de ChatGPT, Claude y Perplexity en 7 semanas. Mix de optimización on-site + clustering + assets vídeo de referencia.
TRM: 8.337% crecimiento en referrals desde ChatGPT en 90 días
The RankMasters 2026. Detalle público limitado (caso comercial).
SaaS B2B: 20+ free trials/mes desde citas ChatGPT
SaaS anónimo via Virayo 2026. Doubling-down en clustering de contenido + tipos correctos + internal linking.
Estudio agregado (Stackmatix 2026): las marcas son citadas 6,5× más por terceros (YouTube, Reddit, Quora, Wikipedia) que por su propio dominio.
Decisión de canal
| Opción | Pros | Contras | Recomendación |
| Canal personal Carlos Ortet | Voz humana, GEO authority signal | No escala más allá de Carlos | Núcleo (semana 1) |
| Canal Zoopa Smart Studio | Brand authority, scaling | Reddit-style hostility no aplica a YouTube | Sí, fase 2 |
| Canal GEOradar (producto) | Tutorial-first, demo-rich | Audiencia más nicho | Sí, fase 2 |
Empezar por canal personal Carlos Ortet (rápido, low-friction). Semana 4 lanzar canal GEOradar para demos producto. Canal Zoopa más adelante si la oferta GEO-Reddit/Quora se materializa.
Plan de contenido — primeros 12 vídeos (3 meses)
| Bloque | # vídeos | Duración | Topic ejemplo |
| Explainer ("What is X") | 4 | 8-12 min | "What is GEO and why your brand needs it" |
| Walkthrough/Demo | 4 | 10-20 min | "How to audit your brand in ChatGPT in 30 minutes" |
| Comparison | 2 | 8-15 min | "GEOradar vs Profound vs Peec: tested" |
| Case study / lecture | 2 | 15-25 min | "How [Client] grew AI citations 10× in 90 days" |
Idioma: EN para 9 de 12 (audiencia técnica internacional). ES para 3 estratégicos (mercado local).
Cadencia operativa
- 1-2 vídeos/mes mínimos durante 12 meses (consistencia > volumen).
- Producción ágil: estilo "talking head" + screen recording. No production value alto.
- Tiempo estimado por vídeo: 3-5h (script + grabación + edición ligera + transcripción pulida + upload optimizado).
Reglas de oro YouTube-GEO
- Cada vídeo responde a 1 query objetivo clara.
- Primeros 30 segundos = respuesta directa.
- Nunca uses auto-transcripción sin revisar.
- Chapters obligatorios (sin chapters, pierdes el ecosistema Google).
- Long-form (>5 min). Shorts solo como teasers de tráfico.
- Menciona la entidad/marca 3-5 veces de forma natural.
- Una imagen/diagrama clave que se mencione verbalmente.
- Descripción de 200+ palabras con respuesta directa, entidades y links útiles.
Vlogs y company updates sin "espina informativa" → cero citas. Thought leadership genérico sin respuestas directas. Vídeos "tips" superficiales sin explicación profunda. Producción audiovisual elaborada sin contenido denso. Shorts como estrategia GEO. Solo auto-transcripción sin pulir. Sin chapters. Títulos clickbait que no coinciden con la query objetivo. Comentarios deshabilitados. Subir vídeos en ráfagas y luego silencio.
YouTube como output channel
youtube_script_ready.md → Script completo del vídeo (8-12 min target)
youtube_transcript_ready.txt → Transcripción pulida para upload (post-grabación)
youtube_metadata_ready.txt → Título, descripción, chapters, tags, categoría
youtube_thumbnail_brief.md → Brief visual para diseñador
Flujo desde source.md a YouTube publicado
- Content-factory genera script + metadata desde source.md.
- Carlos/equipo graba (3-5h totales).
- Edición ligera (Descript / DaVinci / CapCut).
- Upload con metadata pre-generada.
- Sustituir auto-transcripción por la transcripción pulida.
- Añadir chapters según script.
- Publicar.
- Output adicional:
youtube_promo_ready.txt para distribuir el vídeo en LinkedIn, Substack, X, Reddit.
Repurposing cross-channel desde un vídeo
Cada vídeo YouTube genera (vía content-factory):
- 1 post LinkedIn (con embed o screenshot + insight).
- 1 issue Substack (transcripción condensada + análisis).
- 1 thread X.
- 2-3 respuestas Quora derivadas.
- 1 post Medium (cross-post).
- N comentarios Reddit en hilos relevantes (sin spam, solo si aporta).
Un vídeo YouTube alimenta el stack completo de canales. Es el asset de mayor leverage en GEO.
Métricas operativas (mensual)
Vídeos publicados, vistas, watch time, retention curve, CTR thumbnail, comments, likes, suscriptores.
Métricas GEO (las que importan, vía GEOradar)
- Citation lift de YouTube en respuestas LLM (ChatGPT, Perplexity, Google AI Overviews, Gemini) para queries target.
- Brand mentions asociadas a vídeos del canal en respuestas LLM.
- Share of voice en queries del nicho GEO.
- Vídeos específicos citados y con qué frecuencia.
KPIs a 12 meses (objetivos realistas)
| KPI | Pesimista | Realista | Optimista |
| Vídeos publicados | 12 | 24 | 36 |
| Vistas totales canal | 5K | 50K | 500K |
| Vídeos con cita LLM ≥1 plataforma | 2-3 | 6-10 | 15-20 |
| Citation lift en GEOradar | flat | +30% | +150% |
| Suscriptores | 100 | 1.000 | 10.000 |
| Leads atribuibles | 0-2 | 10-30 | 100+ |
YouTube no funciona aislado. El stack GEO óptimo lo combina con:
| Canal | Peso GEO relativo | Por qué |
| Reddit | Alto (especialmente ChatGPT/Perplexity) | Ver plan dedicado |
| Wikipedia | Máximo | Establece entidad como "verdad" para LLMs |
| Hacker News | Alto en queries técnicas | Pesa más que LinkedIn para AI/dev |
| Quora | Medio-alto, long-tail | Ver plan dedicado |
| Stack Exchange | Alto en queries técnicas | Corpus clásico de training |
| LinkedIn (artículos largos) | Medio | Lidera en Copilot, secundario en otros |
| Medium / Substack cross-publicado | Medio | Authority de dominio + LLM ingestion |
| Podcast appearances con transcripción | Alto | Idéntica mecánica a YouTube |
Solo el 14% de marketers usa tracking de citaciones AI, pero el 43% lo declara estrategia core 2026. Quien empieza ahora con YouTube-GEO puede acumular 18-24 meses de ventaja en autoridad acumulada. El compounding effect (vídeos viejos siguen siendo citados años después) multiplica el ROI temprano.
Riesgo si no actúas: los competidores que sí ejecuten capturarán las queries de tu nicho de forma cuasi-permanente en los modelos.
| Dimensión | YouTube | Reddit | Quora |
| Vida útil de pieza | 5-10 años | Días-semanas | 5-10 años |
| Esfuerzo por pieza | Alto (3-5h) | Bajo (15 min) | Medio (30-60 min) |
| Peso GEO Google AI | Máximo | Medio | Alto |
| Peso GEO ChatGPT | Bajo | Máximo | Medio |
| Peso GEO Perplexity | Alto | Máximo | Medio |
| Riesgo ban/penalización | Bajo | Alto | Medio |
| Escalable cross-canal | Sí (asset reutilizable) | No | Parcial |
| Engagement comunidad | Bajo | Alto | Bajo |
Conclusión: YouTube es el canal más estratégico para GEO general por vida útil + reutilización + bajo riesgo. Reddit es más rápido y barato pero más arriesgado. Quora es complementario long-tail sin solapamiento real.
Fuentes
Estudios y datos primarios
Cobertura industria
Guías tácticas
Casos de éxito GEO
Tools y benchmarks
Guías generales SEO/AEO