NATAN FISCHER
← Volver al Blog
Publicado el 2026-03-26

Cómo Dirigir una Sesión de Locución: Guía para No Profesionales de VO

Cómo dirigir una sesión de locución sin perder tiempo ni dinero. Guía práctica para clientes que quieren mejores resultados en menos tomas.

Cómo Dirigir una Sesión de Locución: Guía para No Profesionales de VO

La primera toma suele ser la mejor. Sé que suena contraintuitivo, pero después de veinte años haciendo locución comercial puedo decirte que el cliente que pide cincuenta tomas termina eligiendo la primera o la segunda. Siempre. Porque la primera interpretación es la más natural, la menos contaminada por instrucciones que a veces contradicen lo que el proyecto realmente necesita.

Esto no significa que dirigir una sesión de grabación locución sea inútil. Significa que la dirección de locución efectiva funciona distinto a lo que la mayoría de los clientes imagina.

El problema de las cincuenta tomas

Hay un fenómeno que veo repetirse con clientes nuevos. Escuchan la primera toma, les gusta, pero sienten que deberían pedir más opciones porque para eso están pagando. Entonces empiezan: "¿Podés hacerla más rápida? Ahora más lenta. Más alegre. Menos alegre. Con más energía pero que suene natural."

Después de la toma quince, todos estamos confundidos. El locutor ya perdió la frescura inicial. Y cuando llega el momento de elegir, vuelven a la primera.

Un estudio de Microsoft Research mostró que la capacidad de atención promedio bajó de doce segundos en el año 2000 a ocho segundos en 2015. Menos que un pez dorado, supuestamente. Pero la atención durante una sesión de grabación locución funciona igual: después de cierto punto, nadie puede distinguir matices reales entre tomas. Solo están rotando variaciones sin criterio.

"Que no suene a locutor"

Los clientes llevan diez años diciéndome esto. El locutor ya lo escuchó mil veces antes de que vos se lo dijeras.

Lo que realmente querés decir es: que no suene como un presentador de televisión de los años cincuenta. Esa voz impostada, artificial, que nadie usa en la vida real. Y tenés razón, eso no funciona. Pero sí querés un locutor. Querés a alguien que hable bien, que tenga dicción clara, que maneje los tiempos, que sepa dónde poner énfasis sin que suene forzado.

La diferencia entre "natural" y "amateur" es enorme. Un locutor profesional puede sonar conversacional y seguir siendo técnicamente impecable. Un no-profesional puede sonar natural y arruinar tres palabras por oración.

La música cambia todo

¿Alguna vez intentaste actuar una escena emocional sin música de fondo? Es difícil. La música activa estados emocionales de forma casi automática.

Siempre recomiendo grabar contra la música que va a ir en el spot final. Si tenés el track seleccionado, mandalo antes de la sesión. Si todavía no lo tenés, al menos indicá el género o la energía: "Va a llevar algo electrónico y rápido" o "Estamos pensando en algo acústico, íntimo". El locutor puede ajustar su interpretación desde la primera toma. Según datos de Nielsen, los avisos con música congruente con el mensaje tienen un 23% más de efectividad emocional. Eso se construye desde la sesión de grabación locución, no en post-producción.

El cliente siempre tiene razón (pero puede ser mejor cliente)

Mirá, el locutor trabaja para vos. Si el brief dice que necesitás una voz rápida y energética, eso es lo que vas a obtener. Si querés diez tomas distintas, las vas a tener. El profesional se adapta sin quejarse porque entiende que está al servicio de la publicidad.

Pero. Ser mejor cliente hace que la sesión funcione mejor para todos.

¿Qué significa ser mejor cliente? Primero, tener claro qué querés antes de conectarte a Source Connect. "Algo como el tono de los avisos de Apple pero más cálido" es una dirección útil. "No sé, probemos cosas" es una invitación al desastre.

Segundo, confiar en que el locutor sabe algo que vos no sabés. Si te dice que el guión es demasiado largo para el tiempo disponible, probablemente tenga razón. Los guiones en español traducidos del inglés siempre necesitan edición porque el español es aproximadamente un 30% más extenso. Un estudio de la Universidad de Lyon confirmó que el español transmite menos información por sílaba que el inglés, lo que obliga a usar más palabras para decir lo mismo. Si no cortás, la entrega suena apresurada y poco natural.

Tercero, dar feedback específico. "No me convence" no ayuda. "Necesito que el cierre suene más como una invitación y menos como una orden" sí ayuda.

Lo que la dirección de locución realmente puede cambiar

Hay cosas que podés ajustar en sesión y cosas que no.

Podés cambiar: velocidad, energía, tono emocional, énfasis en palabras específicas, pausas, nivel de formalidad. El locutor puede hacer la misma oración de veinte formas distintas si le das instrucciones claras.

No podés cambiar: la voz misma, el rango natural del locutor, el acento (si contrataste a alguien con acento mexicano, no va a sonar argentino por más que se lo pidas). Por eso el casting importa tanto. La sesión de dirección es para afinar, no para reinventar.

(Hablando de acentos: si tu audiencia es panlatina, siempre recomiendo español neutro. Las rivalidades regionales son reales. Un colombiano escuchando acento chileno se desconecta. Un mexicano escuchando acento argentino se distrae. El neutro profesional resuelve todo eso.)

Cuándo intervenir y cuándo callarse

Después de la primera toma, esperá. Escuchala completa. Resistí el impulso de interrumpir a los tres segundos con "¡Pará, pará, más lento!". Dejá que el locutor termine su interpretación. A veces lo que suena raro al principio tiene sentido cuando escuchás el arco completo.

Si necesitás cambios, pedí uno a la vez. "Más rápido y más alegre y con más énfasis en la marca" es demasiada información. El resultado va a ser confuso. Pedí más velocidad primero. Escuchá. Después ajustá la alegría si hace falta.

Y por favor, si una toma te gusta, decilo. "Esa estuvo muy bien, hagamos una más de backup por si acaso" es música para los oídos del locutor. Sabe que va por buen camino. La siguiente toma probablemente sea igual de buena o mejor.

El español neutro resuelve problemas que no sabías que tenías

Los clientes angloparlantes creen que saben qué es el español neutro. Rara vez lo saben.

He visto briefs que piden "español neutro" y después especifican "con acento español". Eso es como pedir "inglés americano con acento británico". No funciona así. El español de España suena completamente diferente al latinoamericano, y contrario a lo que muchos angloparlantes asumen, el acento español no suena sofisticado para audiencias latinoamericanas. Es lo opuesto al efecto del acento británico en Estados Unidos. Los latinoamericanos no asocian España con elegancia; asocian España con España.

El español neutro real es una habilidad técnica específica. Es un acento construido para no sonar de ningún país en particular. Funciona en México, Colombia, Argentina, Chile, Perú, todos los mercados al mismo tiempo. Y solo un hispanohablante nativo puede hacerlo bien. Un no nativo no puede distinguir entre nativo y no nativo porque las sutilezas son demasiado complejas.

Lo que pasa después de la sesión

La sesión terminó. Tenés cuatro o cinco tomas buenas. Ahora viene la parte donde muchos proyectos se arruinan: la edición sin el locutor presente.

Si vas a cortar frases de diferentes tomas para armar un Frankenstein, avisá antes. El locutor puede grabar con consistencia de tono si sabe que vas a editar así. Si no lo sabe, cada toma puede tener una energía ligeramente diferente y el resultado final va a sonar raro.

Y si después de la sesión decidís que querés algo completamente distinto, eso es una nueva sesión. Reorganizar tres palabras está incluido. Cambiar la interpretación completa porque el cliente del cliente cambió de opinión es trabajo nuevo.

La voz humana tiene algo que la AI no puede copiar

Podría terminar este artículo sin mencionar la inteligencia artificial, pero sería irresponsable.

La AI va a matar el segmento bajo del mercado de locución. Ese segmento que Fiverr y los amateurs ya habían capturado de todas formas. Para un video interno que nadie va a ver, una voz sintética probablemente alcance.

Pero para publicidad real, la voz humana tiene una dimensión que la AI no puede reproducir. Hay estudios que muestran que la voz humana activa respuestas fisiológicas diferentes a la sintética: reduce cortisol, genera conexión emocional, construye confianza. El oyente a veces no sabe por qué rechaza una voz artificial. Simplemente la rechaza. Y en publicidad, donde cada segundo cuenta, esa reacción instintiva puede arruinar una campaña entera.

¿Necesitás una locución en español para tu próximo proyecto? Escribime y te respondo en menos de una hora.

Escribime

Artículos relacionados