0% encontró este documento útil (0 votos)
120 vistas70 páginas

Análisis de la Audiovisión en Cine

Este documento presenta una introducción al análisis conjunto de la imagen y el sonido en la audiovisión. Explica algunos conceptos fundamentales como el valor añadido que el sonido y la música proporcionan a la imagen, y la influencia del sonido en la percepción del movimiento, la velocidad y el tiempo en la imagen. También describe diferentes tipos de escucha como la escucha causal, semántica y reducida, y analiza conceptos como la escena audiovisual, el fuera de campo, y la relación entre lo real y lo expresado en la

Cargado por

Janny Gonzalez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
120 vistas70 páginas

Análisis de la Audiovisión en Cine

Este documento presenta una introducción al análisis conjunto de la imagen y el sonido en la audiovisión. Explica algunos conceptos fundamentales como el valor añadido que el sonido y la música proporcionan a la imagen, y la influencia del sonido en la percepción del movimiento, la velocidad y el tiempo en la imagen. También describe diferentes tipos de escucha como la escucha causal, semántica y reducida, y analiza conceptos como la escena audiovisual, el fuera de campo, y la relación entre lo real y lo expresado en la

Cargado por

Janny Gonzalez
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

MICHEL CHION

La audiovisión
Introducción
a un análisis conjunto
de la imagen y el sonido

PAIDOS Comunicación

Nº 53

Título original: L 'audio-vision


Publicado en francés por Éditions Nathan. París

Traducción de Antonio López Ruiz


Cubierta de Eskenazi & Asociados

@ 1990 by Éditions Nathan, Paris

@ de todas las ediciones en castellano. Ediciones Paidós Ibérica, S. A.,


Mariano Cubí. 92 -08021 Barcelona y Editorial Paidós, SAICF,
Defensa, 599 -Buenos Aires.

ISBN: 84-7509-859-2
Depósito legal: B- 3.948/1993

Impreso en Hurope. S.A..


Recaredo, 2 -08005 Barcelona

Impreso en España
Sumario
Introducción 10

PRIMERA PARTE
EL CONTRATO AUDIOVISUAL
1. Proyecciones del sonido sobre la imagen 12 I. La ilusión
audiovisual 12 II. El valor añadido, definición 13 III. Valor añadido por el texto 13
III.1 Vococentrismo y verbocentrismo del cine 13 III.2 El texto estructura la
visión 14

IV Valor añadido por la música 15 IV. 1 Efecto empático y anempático 15 IV. 2


Ruidos anempáticos 16

V. Influencias del sonido en las percepciones del movimiento y la velocidad 16 V.1


El sonido es movimiento 16 V.2 Diferencia de velocidad perceptiva 17 V.3
Consecuencias: movimientos visuales punteados o creados como una
ilusión por el sonido 18 V.4 Las almenas temporales del oído 19

VI. Influencia del sonido sobre la percepción del tiempo en la imagen 19 VI.1 Los
tres aspectos de la temporalización 19
- animación temporal de la imagen 19 - linealización temporal de los planos 20
- vectorización 20

VI.2 Condiciones para una temporalización de las imágenes por el sonido 20


Primer Caso: la imagen no por sí misma tiene animación temporal ni
vectorización 20
Segundo Caso: la imagen implica una animación temporal propia 20 Factores
de la temporalización: 20
- naturaleza del mantenimiento del sonido 20 - previsibilidad o
imprevisibilidad sonora 20 - papel del tempo 21 - definición del
sonido 21 - modelo de integración entre sonido e imagen 21 -
distribución de los puntos de sincronización 21
VI.3 El cine sonoro es una cronografía 22 VI.4 Linealización temporal 22 VI.5
Vectorización del tiempo real 23 VI.6 El estridor y el trémolo: carácter cultural o
natural de esta influencia 24

VI. Ejemplo de la reciprocidad del valor añadido:


los sonidos de lo horrible 25

2. Las tres escuchas 28 I. Primera actitud de escucha: la escucha causal 28 I.1


Definición 28 I.2 Naturaleza de la identificación causal 28 I.3 La fuente es un cohete de
varios cuerpos 29
II. Segunda actitud de escucha: la escucha semántica 30 III. Tercera actitud de
escucha: la escucha reducida 30 III.1 Definición 30 III.2 Exigencias de la escucha
reducida 31 III.3 Para qué sirve la escucha reducida 32 III.4 Acusmática y escucha
reducida 32 IV. Oír/ escuchar y ver/ mirar 33

3. Líneas y puntos 35 I. La cuestión de lo horizontal y de lo vertical 35 I.1


¿Armonía o Contrapunto? 35 I.2 La disonancia audiovisual 36 I.3 Predominio de las
relaciones verticales en la cadena audiovisual (no hay banda sonora) 37

II. El sonido y la imagen en relación con la cuestión del montaje 38 II. 1 El montaje
de los sonidos no ha creado una unidad específica 38 II. 2 Posibilidad de un
montaje audible de los sonidos 39 II. 3 ¿Forma un plano de sonido un tramo de
sonido audible? 40 II. 4 La condición para un lugar del sonido 41 II. 5
Unidades, pero no específicas 42 II. 6 El flujo sonoro: lógica interna, lógica
externa 42
III. El sonido en la cadena audiovisual 44 III.1 Reunir: El agregado 44 III.2 Puntuar
44 III.3 Puntuaciones simbólicas mediante la música:
el ejemplo de “El Delator” 45 III.4 Utilización puntuadora de los Elementos del
Decorado Sonoro (E.D.S) 49 III.5 Convergencias / Divergencias: la Anticipación
50 III.6 Separar: el Silencio 51
IV. El punto de Sincronización: la Síncresis 52 IV.1 Definición 52 IV.2 Punto de
sincronización evitado 53 IV.3 El golpe, símbolo del punto de sincronización 54
IV.4 “P.D.S.” acentuados y elasticidad temporal 55 IV.5 El resorte de la
sincronización: la síncresis 56 IV.6 Sincronismo amplio, medio y estrecho 57

4. La escena audiovisual 58 I. ¿Hay una escena sonora? 58 I.1 La


imagen es el marco 58 I.2 No hay continente sonoro de los sonidos 59

II. Imantación espacial del sonido por la imagen 60

III. La acusmática 62 III.1 Definición 62 III.2 Visualidad / Acusmática 62

IV. La cuestión del fuera de campo 63 IV.1 Fuera de campo in y off: el tricírculo 63
IV.2 Las excepciones destruyen la regla (gráfico 1 – pág 64) 63 IV.3 El punto
de vista topológico y espacial 65 IV.4 El Sonido Ambiente (Sonido Territorio) 65
IV. 5 El Sonido Interno 65 IV. 6 El sonido On the Air (gráfico 2 – pág 67) 65 IV.
7 Lugar del sonido y lugar de la fuente 67

V. La excepción de la música 68 V.1 Música de foso y música de pantalla 68


V.2 La música como plataforma espacio-temporal 69

VI. Fuera de campo relativo y fuera de campo absoluto 70 VI.1 El “Fuera de


Campo” sólo es una relación 70 VI.2 Efecto de bastidores y Fuera de Campo –
Cubo de Basura
(en el cine en el multipista) 71 VI.3 Fuera de Campo Activo y Fuera de Campo
Pasivo 72 VII. La extensión 73 VII.1 Modulación del Campo y del Fuera de Campo
visual por el sonido 73 VII.2 Las Variaciones de la extensión 74 VIII. El punto de
escucha 75 VIII.1 Punto de escucha en sentido espacial y en sentido subjetivo 75
VIII.2 Dificultades de definir criterios acústicos para un punto de escucha 76 VIII.3
Es la imagen la que crea el punto de escucha (subjetivo) 77 VIII.4 Voz de enfrente
y voz de espalda 77 VIII.5 Escotomización del micro-oído 78

5. Lo real y lo expresado 80 I. La ilusión unitaria 80 II. Problemática de la


reproducción sonora 81
II.1 Definición y fidelidad 81
II.2 Aislamiento y desconexión de los valores sonoros
(ejemplo: la concepción acústica del sonido THX) 82

II.3 la cuestión de la fotogenia: el dispositivo técnico 84 II.4 Los silencios del


Sonido Directo 86 II.5 Verdad y Verosimilitud sonora 88

III. Expresión y reproducción 90 III.1 ¿Qué es la expresión? 90 III.2 Lo expresado


es una bola de sensaciones 91 III.3 Los Indicios Sonoros Materializadores
(I.S.M.) 93 III.4 Dos ejemplos de expresión: “El Oso” y “quién engañó a Roger
Rabbit” 95 III.5 El sonido en la animación: Sonorizar los trayectos 97
6. La audiovisión en negativo 100 I. Más allá de la imagen 100 II. Un cuerpo
en el vacío: el hombre invisible 101 III. El acúsmetro 103
III.1 Definición 103 III.2 Poderes del acúsmetro 104 III.3 La desacusmatización
105
IV. La suspensión 105 V. Visuales del oído, auditivos de la vista 107 V.1 Un visual
que deja huellas sonoras 107 V.2 Los visuales del oído 108 V.3 ¿Temporal =
Sonido y Espacial = Imagen? 109 VI. La transensorialidad: ejemplo del ritmo 109

SEGUNDA PARTE
MAS ALLA DE LOS SONIDOS Y DE LAS IMÁGENES 7.
Digno del nombre sonoro 112 I. Sesenta años de añoranzas 112 II. Una
definición ontológicamente visual 113
III. Efectos directos o indirectos del sonido multipistas 114 III.1 Rehabilitación /
Afirmación del Ruido 114 III.2 Ganancia en Definición 116 III.3 Infusión del
sonido en la imagen 117 III.4 Supercampo: influencia en el dècoupage 118
IV. Hacia un Cine sensorial 119 IV.1 ¿Una crisis? 119 IV.2 Retorno al cine mudo: el
continuum sensorial 121
8. Televisión, clip, vídeo 123 I. La televisión: una imagen añadida 123 II. El
deporte acústico 124
III. La boca y el video 125 III.1 Fija o en movimiento, la imagen es la misma 125 III.2
Una imagen rápida como texto 127 III.3 El arte del vídeo y el lugar del sonido 127
IV. La radio con imágenes 128
9. Hacia una audiologovisual 131 I. Libertad del texto en el cine mudo 131
II. La palabra-teatro 132 III. La palabra-texto 133
III.1 Definición 133 III.2 Desafío entre palabra-texto e imagen 134 III.3 Un caso
particular: el texto errante 135

IV. La palabra-emanación 136 IV.1 Definición 136


IV.2 Modos de relativización de la palabra en el cine hablado 137 - rarefacción
138 - proliferación y adlibs 138 - poliglotia o empleo de una lengua
extranjera 138 - palabra inmersa 139 - pérdida de inteligibilidad 139 -
descentrado 140
V. Una integración sin fin 141

10. Introducción a un análisis audiovisual 142 I. La exigencia verbal


142

II. Procedimiento de observación 143 II.1 Método de los ocultadores 143 II.2
Matrimonio a la fuerza 144

III. Esbozo de un cuestionario tipo 145 III.1 Búsqueda de dominancias y


descripción de conjunto 145 III.2 Localización de los puntos de sincronización
importantes 145 III.3 Comparación 146

IV Trampas y hallazgos del análisis audiovisual ejemplos sobre un fragmento de


La Dolce Vita de Fellini 147 V. Análisis del prólogo de Persona, de Bergman 151
V.1 Descripción plano por plano 151
V.2 Esbozo de Análisis Audiovisual 156 - localización de las dominancias 156 -
localización de los puntos de sincronización 157 - análisis narrativo 157 -
comparación 160 - la tela audiovisual 161
Bibliografía esencial 163 Índice de filmes citados 165
INTRODUCCIÓN
Hasta hoy, las teorías sobre el cine, en conjunto, han eludido prácticamente la
cuestión del sonido: unas veces dejándola de lado y otras tratándola como un terreno
exclusivo y menor. Aunque algunos investigadores hayan propuesto aquí y allá enfoques
muy valiosos sobre la cuestión, sus aportaciones (y las mías, en las tres obras que ya he
publicado sobre el tema) no han ejercido aún suficiente influencia como para imponer una
reconsideración del conjunto del cine, en función del lugar que en él ocupa el sonido desde
hace sesenta años.
Sin embargo, las películas, la televisión y los medios audiovisuales en general no se
dirigen sólo a la vista. En su espectador -su «audio-espectador»- suscitan una actitud
perceptiva específica que, en esta obra, proponemos llamar la audiovisión.
Una actividad que, curiosamente, nunca se ha considerado en su novedad: sigue
diciéndose «ver» una película o una emisión, ignorando la modificación introducida por la
banda sonora. O bien se considera suficiente un esquema aditivo. Asistir aun espectáculo
audiovisual vendría a ser en definitiva ver las imágenes más oír los sonidos, permaneciendo
dócilmente cada percepción en su lugar.
El objeto de este libro es mostrar cómo, en realidad, en la combinación audiovisual,
una percepción influye en la otra y la transforma: no se «ve» lo mismo cuando se oye; No sé
«oye» lo mismo cuando se ve.
El problema, pues, no nace de una supuesta redundancia entre los dos campos, ni de
una relación de fuerzas entre ellos (la famosa pregunta, planteada en los años 70: «¿Qué es
más importante, el sonido o la imagen?.
Esta obra es a la vez teórica y práctica, puesto que, habiendo descrito y formulado la
relación audiovisual como contrato (es decir, como lo contrario de una relación natural que
remitiese a una armonía preexistente de las percepciones entre sí), esboza un método de
observación y de análisis, susceptible de aplicarse a las películas, a las emisiones de
televisión, a los vídeos, etc., y nacido de nuestras numerosas experiencias pedagógicas.
Dada la novedad de la perspectiva aquí propuesta, se me perdonará que no sea ni
definitivo, ni exhaustivo.
En relación con los tres libros ya publicados sobre el tema en las ediciones de
Cahiers du Cinéma (La Voix au cinéma, Le Son au cinéma, La Toile trouée), el lector
encontrará aquí nociones ya abordadas, pero también una conceptualización más amplia,
una presentación más sistemática y muchos avances inéditos.
Los capítulos que constituyen la primera parte, «El contrato audiovisual», recapitulan
una serie de respuestas posibles; los siguientes, «Más allá de los sonidos y de las
imágenes», intentan formular las preguntas y superar las barreras establecidas y las
visiones demasiado compartimentadas.
El cine es el principal afectado, pero los casos particulares de la televisión, del vídeo y
del clip se consideran en un capítulo aparte.
Siendo la percepción sonora la peor conocida y la menos ejercitada, se plantean al
principio del volumen ciertas bases de aculogía, es decir, de teoría de la escucha y del
sonido. Para más detalles sobre estas cuestiones, remitimos a nuestra Cuide des objets
sonores (INA/Buchet-Chastel).
Esta investigación debe mucho a reuniones e intercambios con estudiantes del
IDHEC, del IDA, del DERCA V, del INSAS de Bruselas, del Centre Parisien d 'Études
Critiques de París, de la École des Arts de Lausana, de la asociación Gen Lock de Ginebra,
de la ACT de Toulouse y de la Universidad de Iowa City. Nuestro agradecimiento a los
animadores y responsables de estos diferentes centros, así como, por sus fructíferos
comentarios, a Christiane Sacco-Zagaroli, Rick Altman, Patrice Rollet y, por su- puesto, a
Michel Marie, a quien este libro debe su existencia

M. C.
PRIMERA PARTE
EL CONTRATO AUDIOVISUAL

1. Proyecciones del sonido sobre la imagen 12 2. Las tres

escuchas 28

3. Líneas y puntos 34 4. La escena audiovisual 58

5. Lo real y lo expresado 80 6. La audiovisión en negativo 100

1. Proyecciones del sonido sobre la imagen

I. LA ILUSIÓN AUDIOVISUAL
La sala queda a oscuras, empieza la película. En la pantalla se suceden imágenes
brutales, enigmáticas: una proyección de cine, la película en primer plano. Escenas
traumatizadoras de animales sacrificados. Una mano clavada. Luego: un depósito de
cadáveres, en el que se desliza el tiempo cotidiano; en este depósito, un niño que parece al
principio un cuerpo como los demás, y que en realidad se agita, vive, lee un libro, acerca su
mano a la superficie de la pantalla, y bajo esa mano parece modelar el rostro de una mujer
muy hermosa.
He aquí lo que hemos visto. He aquí la secuencia-prólogo de Persona de Bergman,
que ha sido analizada, en distintos libros y clases, por un Rayrnond Bellour, un David
Bordwell o una Marylin Johns Blackwell. Y la película podría seguir desarrollándose así.
¡Alto!

Rebobinamos la película de Bergman hasta el principio y ahora, sencillamente,


cortamos el sonido, para intentar ver la película olvidando lo que hemos visto antes. Lo que
«vemos» ahora es otra cosa.
En primer lugar, el plano de la mano clavada: en el silencio, se nos revela que se trataba de
tres planos distintos, cuando no habíamos visto sino uno, porque estaban encadenados
mediante el sonido. y sobre todo, privada de sonido, la mano clavada es algo abstracto.
Sonorizada, es aterradora, real. Las imágenes del depósito: sin el sonido que las enlazaba
(un goteo de agua), descubrimos en ellas una serie de fotografías fijas, fragmentos de
cuerpos humanos aislados los unos de los otros, desprovistos de espacio y de tiempo. y la
mano derecha del muchacho, sin la nota vibrante que acompaña y estructura su exploración,
ya no da forma al rostro, evoluciona simplemente al azar , sin finalidad. Toda la secuencia
ha perdido su ritmo y su unidad. ¿Es acaso Bergman un realizador sobrevalorado? ¿Era el
sonido la máscara de una imagen vacía?
Observemos por otra parte una conocida secuencia de Tati, en Las vacaciones de
Monsieur Hulot: en una pequeña playa, se desarrollan unos sutiles gags que nos hacen reír.
¡ Y los veraneantes resultan tan graciosos con su aspecto cohibido, aburridos, in- quietos!
Aquí lo que eliminamos son las imágenes y... ¡sorpresa! Como el reverso de la
imagen aparece otra película, que «vemos» ahora sólo con nuestro oído: gritos de niños que
se divierten y que juegan, voces que resuenan en un espacio abierto, todo un universo de
juego y de animación. ¡Todo esto estaba allí, en el sonido, y sin embargo no estaba allí!
Devolvamos ahora a Bergman sus sonidos y a Tati su imagen, y todo recupera su
lugar. La mano clavada hiere la vista, el niño modela sus rostros, los veraneantes tienen un
aspecto cómico y unos ruidos que no oíamos demasiado, cuando sólo existía el sonido,
surgen de la imagen como bocadillos de tiras dibujadas.
Sólo que, ahora, hemos leído y oído de otro modo. El cine, arte de la imagen: ¿una
ilusión? Ciertamente, ¿qué otra cosa puede ser en cualquier caso? Y de eso es, desde
luego, de lo que habla este libro: de la ilusión audiovisual.
Una ilusión que se encuentra, para empezar, en el corazón de la más importante de
las relaciones entre sonido e imagen: la del valor añadido (ilustrada más arriba por
Bergman).

II. EL VALOR AÑADIDO: DEFINICIÓN

Por valor añadido designamos el valor expresivo e informativo con el que un sonido
enriquece una imagen dada, hasta hacer creer, en la impresión inmediata que de ella se
tiene o el recuerdo que de ella se conserva, que esta información o esta expresión se
desprende de modo «natural» de lo que se ve, y está ya contenida en la sola imagen. Y
hasta procurar la impresión, eminentemente injusta, de que el sonido es inútil, y que
reduplica la función de un sentido que en realidad aporta y crea, sea íntegramente, sea por
su diferencia misma con respecto a lo que se ve.
Este fenómeno del valor añadido funciona sobre todo en el marco del sincronismo sonido /
imagen por el principio de la síncresis (véase el capítulo 3), que permite establecer una
relación inmediata y necesaria entre algo que se ve y algo que se oye. En particular, todo lo
que en la pantalla es choque, caída, explosión más o menos simulados o realizados con
materiales poco resistentes, adquiere por medio del sonido una consistencia, una
materialidad imponentes. Pero en primer lugar, en el nivel más primitivo, el valor añadido es
el del texto sobre la imagen. ¿Por qué hablar ante todo del texto? Porque el cine es
vococentrista, y con mayor precisión, verbocentrista.

llI. VALOR AÑADIDO POR EL TEXTO

llI.1. Vococentrismo y verbocentrismo del cine


Formular que el sonido en el cine es mayoritariamente vococentrista es recordar que en
casi todos los casos favorece a la voz, la pone en evidencia y la destaca de entre los demás
sonidos. La voz es lo que recoge, en el rodaje, la toma de sonido, que es casi siempre, de
hecho, una toma de voz; y la voz es lo que se aísla en la mezcla como
instrumento solista del que los demás sonidos, músicas o ruidos, no serían sino el
acompañamiento.
Igualmente, lo esencial del perfeccionamiento tecnológico aportado a la toma de sonido en
los rodajes (invención de nuevos micros y de nuevos sistemas de registro) se ha
concentrado palabra.

Pues, por supuesto, no se trata de la voz de los gritos y de los gemidos, sino de la voz
como soporte de la expresión verbal. Y lo que se persigue obtener al registrarla no es tanto
la fidelidad acústica a su timbre original como la garantía de una inteligibilidad sin esfuerzo
de las palabras pronunciadas. El vococentrismo del que hablamos es, pues, casi siempre,
un verbocentrismo.
Pero si el sonido en el cine es voco y verbocentiista, es ante, todo porque el ser humano, en
su conducta y sus reacciones cotidianas, también lo es. Si en cualquier ruido cercano
procedente de su ambiente oye unas voces en medio de otros sonidos (ruido del viento,
música, vehículos, son esas voces as que captan y centran en primer lugar su atención.
Seguidamente, en rigor, si las conoce y sabe muy bien quién habla y lo que aquello quiere
decir, podrá apartarse de ellas para interesarse por el resto.
Si estas voces hablan en una lengua que le es accesible, buscará primero el sentido
de las palabras, sin pasar a la interpretación de los demás elementos hasta que esté
saturado su interés por el sentido.

llI.2 El texto estructura la visión

Hay un ejemplo elocuente que utilizamos a menudo en nuestras clases para


demostrar el valor añadido por el texto, y que está tomado de una emisión televisada
difundida en 1984. Se ve en ella una exhibición aérea que tiene lugar en Inglaterra y que
comenta desde un estudio francés el locutor Léon Zitrone. Visiblemente desconcertado ante
aquellas imágenes que le llegan en desorden, el valeroso presentador hace su oficio, sin
embargo, lo mejor que puede. En un momento dado, afirma «Son tres pequeños aviones»
ante una imagen en la que vemos, desde luego, tres pequeños aviones sobre un fondo de
cielo azul, y la enormidad de la redundancia no deja nunca de provocar la risa.
Sólo que Zitrone habría podido decir igualmente: «Hoy el tiempo es magnífico», y eso es
precisamente lo que se hubiera reflejado en la imagen, en la cual, en efecto, no era visible
nube alguna. O bien: «Los dos primeros aviones llevan ventaja sobre e/ tercero» y todo el
mundo podría verlo entonces. O incluso: «¿Adónde ha ido a parar e/ cuarto?», y la ausencia
de este último avión, salido del sombrero de Zitrone por el puro poder del Verbo, habría
resultado evidente. El comentador, en suma, tenía otras cincuenta cosas que decir,
igualmente «redundantes», pero de una redundancia ilusoria, puesto que en cada ocasión,
estas cosas habrían guiado y estructurado de manera tan eficaz nuestra visión que las
habríamos visto allí de modo «natural».
La debilidad y los límites de la célebre demostración -ya criticada por Pascal Bonitzer
en otro sentido- que Chris Marker quiso hace en su documental Lettre de Sibérie, cuando
superpuso a una misma y anodina secuencia varios comentarios de inspiración política
diferente (estalinista, antiestalinista, etc.), consiste en que hace creer -con sus exagerados
ejemplos- que allí no hay sino una cuestión de ideología y que, aparte de eso, sólo existe
una manera neutra de hablar.
Ahora bien, el valor añadido del texto sobre la imagen va mucho más allá de una
opinión incrustada en una visión (sería fácil contradecirlo), ya lo que se refiere es a la
estructuración misma de la visión, enmarcándola rigurosamente. En todo caso, la visión de
la imagen cinematográfica, fugitiva y pasajera, no se nos da a explorar según nuestro ritmo,
contrariamente a un cuadro en una pared o una fotografía en un libro, cuyo tiempo de
exploración determinamos nosotros mismos, de modo que nos es más fácil verlos
separándolos de su leyenda, de su comentario.
Así, si la imagen cinematográfica o televisiva parece hablar por sí misma, de hecho es una
palabra... de ventrílocuo. y cuando el plano de los tres pequeños aviones en un cielo puro
dice «Tres pequeños aviones», es una marioneta animada por la voz del comentador .

IV. VALOR AÑADIDO POR LA MÚSICA

IV.I. Efecto empático y anempático


Como ya quedó dicho en Le Son au cinéma, para la música hay dos modos de crear en el
cine una emoción específica, en relación con la situación mostrada. En uno, la música
expresa directamente su participación en la emoción de la escena, adaptando el ritmo, el
tono y el fraseo, yeso, evidentemente, en función de códigos culturales de la tristeza, de la
alegría, de la emoción y del movimiento. Podemos hablar entonces de música empatía (de
la palabra empatía: facultad de experimentar los sentimientos de los demás).
En el otro, muestra por el contrario una indiferencia ostensible ante la situación,
progresando de manera regular, impávida e ineluctable, como un texto escrito. y sobre el
fondo mismo de esta «indiferencia» se desarrolla la escena, lo que tiene por efecto, no la
congelación de la emoción sino, por el contrario, su intensificación, su inscripción en un
fondo cósmico. De este último caso, que puede denominarse anempático (con una «a»
privativa), se derivan en especial las innumerables músicas de organillo, de celesta, de caja
de música y de orquesta de baile, cuya frivolidad e ingenuidad estudiadas refuerzan en las
películas la emoción individual de los personajes y del espectador en la medida misma en
que fingen ignorarla.
Este efecto de indiferencia cósmica se utilizaba ya sin duda en la ópera, aquí y allá, cuando
la emoción era tan fuerte que helaba las reacciones de los personajes y provocaba en ellos
una especie de regresión psicótica: el famoso efecto de locura, la musiquilla idiota que se
repite como meciéndose, etc. Pero en la pantalla, este efecto anempático ha adquirido tal
importancia que impulsa a creerlo íntimamente relacionado con la esencia del cine: su
mecánica oculta.
Toda película procede, en efecto, de un fluir indiferente y automático, el de la proyección,
que provoca en la pantalla y en los altavoces simulacros de movimientos y de vida, y este
fluir debe ocultarse y olvidarse. ¿Qué hace la música anempática, sino develar su verdad, su
aspecto robótico? Ella es la que hace surgir la trama mecánica de esta tapicería emocional y
sensorial.
Hay también, finalmente, músicas que no son ni empáticas ni anempáticas, que tienen o
bien un sentido abstracto, o una simple función de presencia, un valor de poste indicador y,
en todo caso, sin resonancia emocional precisa.

IV.2. Ruidos anempáticos

El efecto anempático, la mayoría de las veces, concierne ala música, pero puede utilizarse
también con ruidos: cuando por ejemplo, en una escena muy violenta o tras la muerte de un
personaje, sigue desarrollándose un proceso cualquiera (ruido de una máquina, zumbido de
un ventilador, chorro de una ducha, etc.), como si no pasara nada, por ejemplo en Psicosis,
de Hitchcock, o en El reportero, de Antonioni..

V. INFLUENCIAS DEL SONIDO EN LAS PERCEPCIONES DEL


MOVIMIENTO y LA VELOCIDAD
V .1. El sonido es movimiento
Comparadas una con otra, las percepciones sonora y visual son de naturaleza mucho más
dispar de lo que se imagina. Si no se tiene sino una ligera conciencia de ello es porque, en
el contrato audiovisual, estas percepciones se influyen mutuamente, y se prestan la una a la
otra, por contaminación y proyección, sus propiedades respectivas.
Ante todo, la relación de estas dos percepciones con el movimiento y con la inmovilidad es
siempre fundamentalmente diferente, puesto que el sonido supone de entrada movimiento,
contrariamente a lo visual.
En una imagen cinematográfica en la que normalmente se mueven ciertas cosas, muchas
otras pueden permanecer fijas. El sonido, por su parte, implica forzosamente por naturaleza
un desplazamiento, siquiera mínimo, una agitación. Tiene sin embargo la capacidad de
sugerir la fijeza pero en casos limitados.
En el caso límite, el sonido inmóvil es el que no presenta variación alguna en su desarrollo,
particularidad que no se encuentra sino en algunos sonidos de origen artificial: la tonalidad
de un teléfono o el ruido de fondo de un amplificador sonoro. Algunos torrentes y cascadas
crean también a veces un rumor cercano al ruido blanco, pero es muy raro que en él no esté
presente algún indicio de irregularidad y de movimiento. Puede crearse igualmente el efecto
de un sonido fijo, pero con un sentido diferente, por medio de una variación o una evolución
indefinidamente repetida tal cual, como «en bucle».
Huella de un movimiento o de un trayecto, el sonido tiene, pues, una dinámica temporal
propia.

V.2. Diferencia de velocidad perceptiva


A priori, las percepciones sonora y visual tienen cada una su ritmo medio propio: el oído,
grosso modo, trabaja y sintetiza más deprisa que la vista. Tomemos un movimiento
precipitado -un gesto de la mano- y comparémoslo con un trayecto sonoro brusco de la
misma duración. El movimiento visual brusco no formará una figura nítida, no será
memorizado un trayecto preciso: En el mismo tiempo, el trayecto sonoro podrá dibujar una
forma nítida y consolidada, individualizada, reconocible entre todas.
No es un problema de atención: por mucho que revisemos diez veces el plano del
movimiento visual y lo consideremos atentamente (por ejemplo, un gesto complicado
realizado por un personaje con el brazo), seguirá sin dibujar una figura clara. Repitamos diez
veces la audición de un trayecto sonoro brusco: su percepción se afirma, se impone cada
vez mejor.
Hay varias razones para esto: ante todo, para los oyentes, el sonido es el vehículo del
lenguaje, y una frase hace bajar al oído muy deprisa (comparativamente, la lectura con la
vista es sensiblemente más lenta, salvo entrenamiento especial: en los sordos, por ejemplo).
Por otra parte, si la vista es más lenta, es porque tiene más que hacer: trabaja a la vez en el
espacio, que explora, y en el tiempo, al que sigue. Se ve, pues, pronto superada cuando ha
de asumir los dos. El oído, por su parte, aísla una línea, un punto, de su campo de escucha,
y sigue en el tiempo este punto, esta línea. (Pero si se trata de una partitura
musical familiar al oyente, la escucha de éste deja más fácilmente el hilo temporal para
pasearse espacialmente.) Grosso modo: en un primer contacto con un mensaje audiovisual,
la vista es, pues, más hábil espacialmente y el oído temporalmente.

V.3. Consecuencias: movimientos visuales puntuados o creados como una ilusión


por el sonido
Durante la audiovisión de una película sonora, estas diferencias de velocidad en el análisis
no son percibidas como tales por el espectador en la medida en que interviene el valor
añadido.
¿Por qué, por ejemplo, los movimientos visuales rápidos que acumulan las películas de
Kung-Fu o de efectos especiales no crean una impresión confusa? Pues porque son
ayudados y «puntuados» por medio de puntuaciones sonoras rápidas (silbidos, gritos,
choques y tintineos) que marcan perceptivamente ciertos momentos e imprimen en la
memoria una huella audiovisual fuerte.
El cine mudo, sin embargo, ya tenía cierta predilección por los montajes de sucesos
rápidos: observemos, no obstante, que, en este tipo de secuencia, procuraba simplificar la
imagen hasta d el máximo, es decir, limitar la percepción espacial y exploratoria, o, para
facilitar la percepción temporal. Esto implicaba una visión, altamente estilizada, análoga aun
croquis. Buen ejemplo de ello es la secuencia de la desnatadora de La línea general, de
Eisenstein, con sus primeros planos.
Si el cine sonoro, por su parte, puede utilizar a menudo movimientos complejos y fugitivos
producidos en el seno de un marco ~~ visual saturado de personajes y de detalles, es
porque el sonido sobreimpresionado en la imagen es susceptible de puntuar y des-tacar en
ésta un trayecto visual particular. No sin un posible efecto de ilusionismo: cuando el sonido
consigue hacer ver, articulado en la imagen, un movimiento rápido ¡ qué no está en ella!
Es el ejemplo, muy elocuente, del trabajo del encarado de sonido Ben Burtt sobre la saga
de La guerra de las galaxias: había éste fabricado, como efecto sonoro para una apertura
automática de puerta (se trata de esas puertas automáticas romboidales o hexagonales de
las películas de ciencia ficción), un sonido sibilante y neumático, muy dinámico y
convincente. Tan convincente que, en varias ocasiones, el realizador Irving Kershner,
cuando rodó El imperio contraataca, y al tener que rodar un efecto de cierre de puerta,
pudo limitarse a encadenar un plano de la puerta cerrada con un plano de la misma
abierta. En el montaje, con el «pschhtt» de Ben Burtt, el espectador, que no tenía a la vista
sino un encadenado cut, veía deslizarse la puerta! El valor añadido funcionaba aquí
plenamente, a partir de un fenómeno propio del cine sonoro, y que podría llamarse el más
rápido-que-la-vista.
Está comprobado que los sordos formados en el lenguaje gestual desarrollan una
capacidad particular de leer y de estructurar los fenómenos visuales rápidos. Esto plantea la
cuestión de saber si, en este caso, no movilizan las mismas áreas cerebrales que las
empleadas para el sonido por quienes no son sordos: uno de los numerosos hechos que
llevan a cuestionar nuestras ideas previas sobre la separación de las categorías del sonido y
de la imagen.

V.4. Las almenas temporales del oído


Por otra parte, decir que la escucha funciona «al hilo del tiempo» es una fórmula que
precisa ciertas correcciones. De hecho, el oído escucha por tramos breves, y lo que por él
se percibe y memoriza consiste ya en breves síntesis de dos a tres segundos de la
evolución del sonido, formando Gestalt globales.
Sólo que, en el interior de esos dos a tres segundos percibidos como una forma de
conjunto, el oído (en realidad, el sistema oído- cerebro) ha realizado cuidadosa y seriamente
su trabajo de en- cuesta, de manera que su informe global del suceso, formulado
periódicamente, está repleto de detalles precisos y característicos tomados in situ.
Llegamos entonces a esta paradoja: no oímos los sonidos -en el sentido de
reconocerlos- hasta algo después de haberlos percibido. Si palmeamos breve y secamente,
y escuchamos el ruido que esto provoca, la escucha -de hecho la aprehensión sintética de
¡ un pequeño fragmento de la historia sonora depositado en la memoria- seguirá muy de
cerca al suceso: no será totalmente simultánea.

VI. INFLUENCIA DEL SONIDO SOBRE LA PERCEPCIÓN


DEL TIEMPO EN LA IMAGEN
VI.I. Los tres aspectos de la temporalización

Entre los diferentes efectos del valor añadido, uno de los más importantes se refiere a la
percepción del tiempo de la imagen, susceptible de verse considerablemente influido por el
sonido. Un ejemplo extremo de ello se encuentra, como se ha visto, en el prólogo de
Persona, en el que unas imágenes fijas desprovistas de toda temporalidad se inscriben en
un tiempo real por unos sonidos de goteo de agua y de ruidos de pasos.
Este efecto de temporalización tiene tres aspectos:

- animación temporal de la imagen: la percepción del tiempo de la imagen se hace por el


sonido más o menos fina, detallada, inmediata, concreta o, por el contrario, vaga, flotante y
amplia.
- linealización temporal de los planos que, en el cine mudo, no siempre corresponden a
una duración lineal en la que el contenido del plano 2 seguiría obligatoriamente a lo que
muestra el plano 1, y así sucesivamente. Mientras que el sonido síncrono, por su parte,
impone una idea de sucesión.

- vectorización o, dicho de otro modo, dramatización de los planos, orientación hacia un


futuro, un objetivo, y creación de un sentimiento de inminencia y de expectación. El plano va
a alguna parte y está orientado en el tiempo. Este efecto es localizable en su forma pura en
el prólogo de Persona (el plano 1, por ejemplo).

VI.2. Condiciones para una temporalización de las imágenes por el sonido Estos tres
efectos dependen, para ser actualizados, de la naturaleza de las imágenes y de los sonidos
relacionados.
Primer caso: la imagen no tiene por sí misma animación temporal ni
vectorización alguna. Es el caso de una imagen fija, o cuyo movimiento sólo es una
fluctuación global que no deja esperar resolución alguna: por ejemplo, un reflejo en el agua.
En este caso, el sonido es susceptible de conducir esta imagen a una temporalidad que él
mismo introduce de principio a fin.
Segundo caso: la imagen implica una animación temporal propia (desplazamiento
de personajes o de objetos, movimientos de humos, de luces, variación de encuadre). La
temporalidad del sonido se combina entonces con la ya existente de la imagen: sea para ir
en el mismo sentido, sea para contrariarla ligeramente, como dos instrumentos que suenan
simultáneamente.

La temporalización depende también del tipo de sonidos. Según su densidad, su


textura interna, su aspecto y su desarrollo, un sonido puede temporalmente animar una
imagen en mayor o menor grado, aun ritmo más o menos jadeante y opresivo. Aquí entran
en juego diferentes factores:

- naturaleza del mantenimiento del sonido: un sonido mantenido de modo liso y continuo
es menos «animador» que un sonido sostenido de modo accidentado y trepidante. Si se
intenta alternativamente, para acompañar a una misma imagen, una nota tenue y
prolongada de violín y después la misma nota ejecutada en trémolo con punteados de arco,
la segunda creará en la imagen una atención más tensa e inmediata que la primera.

- previsibilidad o imprevisibilidad de la progresión sonora: una cadencia en el


sonido modulada con regularidad, como un bajo continuo de música, o un tic-tac mecánico,
y por tanto previsible, tiende a crear una animación temporal menor que un sonido de
progresión irregular y, por ello, imprevisible, que pone en constante alerta el oído y el
conjunto de la atención. Las gotas de agua de Persona, o las que Tarkovski gusta de hacer
oír en sus películas, son ejemplo de ello: fijan la atención por su ritmo fina o fuertemente
desigual.
Pero un ritmo demasiado regularmente cíclico puede crear también un efecto de tensión,
porque esta regularidad mecánica nos mantiene expectantes ante la posibilidad de una
fluctuación.

- papel del tempo: la animación temporal de la imagen por el sonido no es una cuestión
mecánica de lempo; una música más rápida no acelera forzosamente la percepción de la
imagen. La temporalización, a decir verdad, depende más de la regularidad o irregularidad
del flujo sonoro que del lempo en el sentido musical de la palabra. Por ejemplo, si el flujo de
las notas de la música es inestable pero de ritmo moderado, la animación temporal será
mayor que si el ritmo es rápido pero regular.

- Definición del sonido: un sonido rico en frecuencias agudas creará una percepción más
alerta, lo que explica que en muchas películas recientes el espectador se mantenga en
tensión.

La temporalización depende también del modelo de integración entre sonido e


imagen, y de la distribución de los puntos de sincronización (véase más abajo).
También aquí el sonido activa más o menos una imagen según introduzca puntos de
sincronización más o menos previsibles o imprevisibles, variados o monótonos. De una
manera general, la anticipación controlada es un factor poderoso de temporalización.
Para que el sonido influya temporalmente en la imagen, se necesitan en resumen un
mínimo de condiciones. Es preciso, en primer lugar, que la imagen se preste a ello, ya por
su fijeza y su receptividad pasiva (caso de las imágenes fijas de Persona), ya por su propia
actividad (microrritmos «temporizables» por el sonido), es decir, en ese caso, que implique
un mínimo de elementos de estructura, de concordancia, de encuentro y de simpa- tía (como
se dice de las vibraciones), o de antipatía activa hacia el flujo sonoro.
Los microrritmos visuales de los que acabamos de hablar son movimientos rápidos en la
superficie de la imagen, causados por cosas tales como volutas de humo, lluvia, copos,
ondulaciones de la superficie rizada de un lago, arena, etc. , y en último grado, por el
hormigueo del grano fotográfico mismo cuando es aparente. Estos fenómenos crean valores
rítmicos rápidos y fluidos, instaurando en la imagen misma una temporalidad vibrante,
estremecida. Kurosawa los emplea sistemáticamente en su película Dreams (lluvia de
pétalos de árboles en flor, de copos en una tormenta de nieve, de niebla, etc.), y a Hans
Jürgen Syberberg le gusta instalar también, en sus larguísimos planos fijos y sostenidos,
microrritmos visuales (fumígenos en Hitler, llama vacilante de una vela en la lectura del
monólogo de Molly Bloom por Edith Clever, etc.), yeso para afirmar la duración propia del
cine sonoro en cuanto grabación de la microestructura del presente.
VI.3. El cine sonoro es una cronografía

Hay que recordar, en efecto, un aspecto histórico oculto hasta hoy: es al sonido síncrono al
que debemos el haber hecho del cine un arte del tiempo. La estabilización de la velocidad de
paso de la película, convertida en necesaria por el sonoro, ha tenido ciertamente
consecuencias mucho más allá de lo que podía preverse: a causa de ella, el tiempo fílmico
se ha convertido, no ya en un valor elástico más o menos transportable según el ritmo de la
proyección, sino en un valor absoluto. Desde entonces se estaba ya seguro de que lo que
tenía tal duración en el montaje, conservaría en la proyección esa misma duración exacta, lo
que no era el caso en el cine mudo. Los planos del cine mudo, por su parte, no tenían
duración interna exacta, vibración temporal fija, al dejar a cada empresario o al
proyeccionista cierto margen para el ritmo de flujo de la película. No es casual tampoco que
la mesa de montaje con un motor que controla y regulariza la velocidad de flujo de la
película no apareciera sino con el sonoro.
Atención: hablamos aquí del ritmo de la película terminada, en el interior de la cual pueden
introducirse perfectamente planos trucados en la filmación, acelerados o ralentizados, como
hicieron en diferentes épocas del cine sonoro un Michael Powell, un Scorsese, un Peckinpah
o un Fellini. Sólo que, si la velocidad de esos planos no reproduce forzosamente la velocidad
real con la que los actores actuaron en el rodaje, sí que se fija en todo caso en el tiempo de
la película con un valor preciso, determinado y controlado.
El sonido, pues, ha temporalizado la imagen no sólo por el efecto del valor añadido, sino
también, sencillamente, imponiendo una normalización y una estabilización de la velocidad
de flujo de la película. Un Tarkovski mudo no habría sido concebible; y lo que el realizador
ruso decía del cine, que es el «arte de esculpir en el tiempo», no habría podido decirlo, ni
sobre todo hacer- 10, en la época del cine mudo, él, que ilustraba sus largos planos con
estremecimientos, sobresaltos y apariciones fugitivas, combinados con amplias evoluciones
controladas, en una estructura temporal hipersensible. El cine sonoro puede llamarse, pues,
«crono- gráfico».

VI.4. Linealización temporal


Cuando una sucesión de imágenes no prejuzga por sí misma el encadenamiento temporal
de las acciones que ilustra (haciéndolas ver como capaces de ser tanto
simultáneas como sucesivas), la superposición de un sonido realista y diegético impone a
ésta i un tiempo real (es decir, contado según nuestra medida cotidiana) y sobre todo lineal,
sucesivo.
Tomemos una escena, tal como se ven con frecuencia en el cine mudo, de reacción
colectiva, construida como un montaje de primeros planos de rostros coléricos o divertidos:
sin el sonido, no hay necesidad alguna de que los planos que se suceden en la pantalla
designen acciones que se encadenen en la realidad.
Pueden comprenderse muy bien las reacciones como simultáneas, y situarlas en un
tiempo análogo al perfectivo.
En cambio, aplicando a estas imágenes unos sonidos de abucheos o de risa
colectiva, éstas se alinean como mágicamente en un tiempo lineal: el plano 2 muestra a
alguien que ríe o increpa después del personaje del plano 1, y así sucesivamente. De ahí
procede el efecto «torpe» de ciertas escenas de reacción colectiva, en las primerísimas
películas sonoras: por ejemplo, en el banquete inicial de La golfa, de Renoir, en la que el
sonido (risas, conversaciones diversas entre convidados) aparece como superpuesto a unas
imágenes concebidas según un tiempo aún no lineal. La audición de la voz hablada tiene
especialmente, en todo caso cuando se inscribe en el tiempo diegético y se sincroniza con la
imagen, el poder de inscribir a ésta última en un tiempo real y linealizado que ya no tiene
elasticidad. De ahí ese efecto, en un primer momento, de «tiempo cotidiano», que consternó,
ala llegada del sonoro, a muchos cineastas del mudo.
La síncresis, de la que se hablará con más detalle en el capítulo 3, es un poderoso factor de
linealización y de inscripción en un tiempo real.

VI.5. Vectorización del tiempo real


Imaginemos un apacible plano de alguna película exótica en el cual hay una mujer
recostada en una mecedora, en un mirador, adormilada, y con su pecho elevándose con
regularidad. La brisa agita los toldos y hace tintinear las campanillas de bambú colgadas
cerca de la entrada. Las hojas de los plátanos se agitan al viento. Podemos muy bien
proyectar este plano tan poético des- de la última a la primera imagen y nada esencial
cambiará en él; todo parecerá ahora igualmente natural. Se dirá entonces que el tiempo del
que es portador este plano es real, puesto que está lleno de microsucesos que reconstituyen
la textura del presente, pero que no está vectorizado: entre el sentido del pasado hacia el
futuro o del futuro hacia el pasado, no advertimos diferencia sensible alguna.
Tomemos ahora los sonidos con los que podría sonorizarse esta escena, sonidos
grabados in situ, en directo, o que se han reconstituido después: la respiración de la mujer,
el viento, el tintineo de las wood-chimes. Y pasemos de nuevo la película: nada encaja ya en
absoluto, sobre todo el tintineo. ¿Por qué? Porque cada uno de estos entrechocamientos,
constituido por un choque y una pequeña resonancia decreciente, es una historia acabada,
orientada en el tiempo de una manera precisa e irreversible. Invertido, se advierte enseguida
como «al revés». Los sonidos están vectorizados. Lo mismo en cuanto a las gotitas de agua
del prólogo de Persona: la menor de ellas impone un tiempo real, irreversible, por- que
presenta una curva orientada de cierta manera en el tiempo (pequeño choque y resonancia
muy fina) que concuerda con la lógica de la gravedad y del retorno a la inercia.
Es la diferencia, en cine, entre el orden de lo sonoro y el de lo visual: a escala
temporal comparable (pongamos de dos a tres segundos), los fenómenos sonoros están
mucho más característicamente vectorizados en el tiempo -con un principio, un medio y un
fin no reversibles- que los fenómenos visuales.

Si esto se nos escapa es porque el cine, en el plano visual, se ha entretenido muchas veces
con las excepciones y las paradojas, jugando con lo irreversible visual: un objeto roto que
recobra su forma a partir de sus trozos, un muro demolido que se reconstruye, o el inevitable
gag del bañista que sale de la piscina con los pies hacia arriba y que vuelve de nuevo a su
trampolín. Pero en casos cinematográficos muy frecuentes, un personaje que habla, sonríe,
toca el piano..., ofrece una imagen periódica y reversible, en la que el sentido pasado-futuro
no se marca como en el caso del sonido, que es por el contrario muchas veces una sucesión
de pequeños fenómenos orientados todos en el tiempo: ¿no está la música de piano, por
ejemplo, constituida por millares de pequeños indicios de tiempo real vectorizado, pues cada
nota, apenas nacida, empieza a extinguirse?.

En cambio, una imagen que muestre acciones debidas a fuerzas no reversibles (caída de
un objeto por efecto de la gravedad, explosión que dispersa fragmentos, etc.) está
claramente vectorizada.

VI..6. El estridor y el trémolo: carácter cultural o natural 1de esta influencia La


animación temporal de la imagen por el sonido no es un fenómeno puramente físico y
mecánico: desempeñan también su papel códigos cinematográficos y culturales. Una
música, o un efecto sonoro y vocal, que se perciban como culturalmente desplazados en el
decorado, no harán vibrar la imagen. y sin embargo, el fenómeno tiene, en todo caso, una
base no cultural.
Tomemos el ejemplo del trémolo de instrumentos de cuerda, procedimiento clásicamente
empleado en la ópera y la música sin- fónica para crear un sentimiento de tensión
dramática, de sus- pensión, de alerta.
El cine es susceptible de utilizar igualmente, para el mismo resultado, una
estridulación de insectos nocturnos, como por ejemplo en la escena final de Hijos de un dios
menor, de Randa Haines. Ese sonido ambiental no está sin embargo explícitamente
codificado en ese sentido; no es un procedimiento de escritura oficialmente inventariado, ya
pesar de esto puede tener sobre la percepción dramática del tiempo exactamente la misma
propiedad que tiene el trémolo orquestal: concentrar la atención y hacernos sensibles a la
menor vibración en la pantalla. Los encarga- dos de sonido y los mezcladores utilizan
además con frecuencia tales ambientes nocturnos, y dosifican su efecto como directores de
orquesta, mediante la elección de ciertas grabaciones y por el modo de mezclarlas para
crear un sonido global. Pues el efecto variará evidentemente según la densidad del estridor,
su carácter más o menos regular fluctuante, y su duración, exactamente como para un
efecto de orquesta.
Ahora bien, ¿qué hay de común, para el espectador de cine, entre un trémolo de cuerdas
en una orquesta, que él localiza como procedimiento musical cultural, y un ruido animal, que
percibe como una emanación natural del decorado en el que se sitúa la acción, sin
considerar ni siquiera durante un segundo que éste haya podido grabarse
independientemente de la imagen y recomponer- se cuidadosamente? Sólo una identidad
acústica: la de una vibración aguda, ligera y sutilmente desigual, que alerta al tiempo que
fascina. Parece, pues, que estamos ante un efecto universal y espontáneo. Efecto frágil, sin
embargo, y que cualquier detalle -una mezcla de sonido deficiente, una pérdida de confianza
por parte del espectador en el contrato audiovisual, debido aun defecto de realización, de
interpretación del guión- basta para comprometer.
Así sucede, por otra parte, con todos los efectos de valor añadido, que nada tienen de
mecánico: fundados en una base psicofisiológica, no operan sino en ciertas condiciones
culturales, estéticas y afectivas, por una interreacción de todos los elementos.

VIl. EJEMPLO DE RECIPROCIDAD DEL VALOR AÑADlDO:


LOS SONIDOS DE LO HORRIBLE

El valor añadido es recíproco: si el sonido hace ver la imagen de modo diferente a lo que
esta imagen muestra sin él, la imagen, por su parte, hace oír el sonido de modo distinto a
como éste resonaría en la oscuridad. Sin embargo, a través de esa doble ida-y-vuelta, la
pantalla sigue siendo el principal soporte de esta percepción. El sonido transformado por la
imagen sobre la que influye reproyecta finalmente sobre ésta el producto de sus influencias
mutuas.
El caso de los sonidos horribles o impresionantes, sobre los cuales la imagen
proyecta por sugestión un sentido que ellos no poseen en modo alguno, es el ejemplo de
esta reciprocidad.
Todo el mundo sabe, en efecto, que el cine sonoro clásico, en el que se evitaba mostrar
ciertas cosas, acudía al sonido en ayuda de su tabú visual para sugerir el espectáculo de
una manera mucho más impresionante que si se hubiese tenido ante la vista. El ejemplo
arquetípico de ello se encuentra al principio de la obra maestra de Aldrich El beso mortal,
cuando la fugitiva ala que Ralph Meeker ha recogido en autostop es atrapada por sus
perseguidores y sometida a tortura: de esta tortura el espectador no ve sino dos piernas
desnudas que forcejean, mientras que oye los gritos de la desdichada. He aquí, se dirá, un
efecto típicamente sonoro. Ciertamente, pero a condición de precisar que lo que hace tan
aterradores los gritos no es su propia realidad acústica, sino lo que la situación narrada y lo
que se deja entrever inducen a proyectar sobre ellos.
Buscando otro efecto sonoro traumático procedente de una película, se impone el ejemplo
de una escena de La pie/, de Liliana Cavani (según Malaparte), en la que un tanque
americano aplasta accidentalmente aun muchacho italiano, con un ruido espantoso, que
evoca una sandía aplastada, si debemos dar crédito al recuerdo. El espectador pocas veces
habrá oído el ruido real de un cuerpo humano así tratado, pero puede imaginar que el
acontecimiento tendrá también algo de húmedo y viscoso. Por otra, parte, es evidente que el
sonido de la película de Cavani ha sido, elaborado con un truco de sonido, acaso,
justamente, aplastando una fruta.
Más tarde veremos que el valor figurativo, narrativo, de un ruido reducido a sí mismo es
muy impreciso. Un mismo sonido puede, pues, según el contexto dramático y visual, contar
cosas muy distintas, puesto que, para el espectador de cine, más que el realismo acústico,
es el criterio de sincronismo ante todo, y secundariamente de verosimilitud global (una
verosimilitud que es asunto no de verdad, sino de convención), el que lo llevará a
superponer un sonido a un suceso o un fenómeno. El mismo sonido podrá, pues, sonorizar
de manera convincente en una comedia la sandía que se aplasta y, en una película de
guerra, el cráneo hecho papilla. Ese mismo ruido será en un sitio jubiloso, y en otro
insoportable.
En Los ojos sin rostro, de Franju, se encuentra también uno de los pocos sonidos fílmicos
realmente inquietantes que tanto el público como los críticos advirtieron y comentaron
después: el de la caída del cadáver de una chica, espantoso residuo de un fracasado intento
de trasplante, cuando el cirujano Pierre Brasseur lo deja caer en un foso, ayudado por su
cómplice Alida Valli. Lo que de común tiene ese sonido sordo y denso, que nunca deja de
hacer estremecerse al público, con el ruido citado más arriba de la película de
Cavani, es que transforma al ser humano en cosa, en vil materia inerte y desechable, con
sus cavidades óseas y su montón de entrañas.
Pero es también un ruido impresionante por su manera de re- presentar, en el ritmo de la
escena y de la película, una interrupción de palabra, un momento en el que falta la palabra
de los personajes, aquí los dos cómplices. Algunos ruidos sólo resuenan así, en el cine o en
la vida, porque sobreviven en cierto lugar, en una cadena de lenguaje en la que forman un
vacío. Atroz ilustración de esta idea: la escena de Andrei Rublev, de Tarkovski, en la que un
príncipe ruso torturado por los tártaros sale cubierto de vendas, que ocultan su cuerpo
mutilado y no dejan ya visibles más que los labios. Abandonado en un lecho, maldice a sus
torturadores, pero, justamente después, la mano del verdugo trae un cazo lleno de aceite
hirviendo que le es vertido en la garganta. El gesto se nos oculta por medio de la espalda del
verdugo, misericordiosamente (o más bien hábilmente) interpuesta en ese momento entre el
espectador y la cabeza del ajusticiado. No oímos más que un ruido de gargarismos
espantoso que nos pone la carne de gallina. Sólo que, como en el caso del ruido del aplasta-
miento anterior, podría ser el mismo ruido que haría Peter Sellers haciendo gárgaras en una
comedia de Blake Edwards.
Aquí, el ruido alcanza esa intensidad porque representa la palabra humana afectada en su
centro físico: se ha destruido una laringe, una lengua que acababa justamente de hablar.
2. Las tres escuchas

I. Primera Actitud de Escucha: La Escucha Causal

I.1. Definición
Cuando hacemos hablar a alguien sobre lo que ha oído, sus respuestas suelen
impresionarnos por el carácter heteróclito de los niveles en los que se sitúan. Y es que hay -
al menos- tres actitudes de escucha diferentes, que apuntan a tres objetos diferentes: la
escucha causal, la escucha semántica y la escucha reducida.
La escucha más extendida es la primera, la escucha causal, la cual consiste en servirse del
sonido para informarse, en lo posible, sobre su causa. Puede que esta causa sea visible y
que el sonido pueda aportar sobre ella una información suplementaria, por ejemplo en el
caso de un recipiente cerrado: el sonido que se produce al golpearlo nos dice si está vacío o
lleno. O puede, a fortiori, que sea invisible y que el sonido constituya sobre ella nuestra
principal fuente de información. La causa puede además ser invisible, pero identificada por
un saber o una suputación lógica a: propósito de ella. También aquí, sobre este saber,
trabaja la escucha causal, que pocas veces parte de cero. - No habría que ilusionarse, en
efecto, acerca de la exactitud y de las posibilidades de la escucha causal, es decir, sobre su
capacidad de proporcionarnos informaciones seguras y precisas a partir sólo del análisis del
sonido. En realidad, esta escucha causal, que es la más extendida, es también la más
susceptible de verse influida... y engañada.

1.2. Naturaleza de la identificación causal


La escucha causal puede realizarse en diferentes niveles. Unas veces reconocemos la
causa precisa e individual: la voz de una persona determinada, el sonido de un objeto único
entre todos.
Pero este reconocimiento se hace pocas veces sólo a partir del sonido, fuera de todo
contexto. Apenas hay nada, fuera del individuo humano, que emita, mediante su voz
hablada, un sonido característico suyo y sólo suyo. En cambio, diferentes perros de la
misma especie tienen el mismo ladrido. O en todo caso, lo que viene a ser lo mismo, no
somos capaces de diferenciar el ladrido de un bulldog del de otro bulldog, o incluso del de
un perro de raza semejante. Si se supone que loS perros son capaces de identificar entre
cientos de voces la de su dueño, es muy dudoso que ese dueño pueda discernir entre todas,
Con los ojos cerrados y sin informaciones suplementarias, la voz de su perro.
Lo que disimula, en este caso, esta deficiencia de nuestra escucha causal es que,
cuando estamos en casa y oímos ladrar en la habitación vecina, deducimos lógica y
naturalmente que se trata de Toby o de Rolf.
Al mismo tiempo, una fuente reconocida no siempre puede nombrarse. Podemos muy bien
escuchar todos los días a una locutora de radio cuyo físico y nombre ni siquiera conocemos;
eso no nos impide en modo alguno abrir en nuestra memoria una ficha descriptiva vocal y
personal de esta locutora, ficha en la cual dejamos temporalmente en blanco su nombre y
otras características (color del pelo y rasgos de su rostro, que su voz, naturalmente, no
delata).
Pues hay una gran diferencia entre lo que podría llamarse tomar nota del timbre de voz de
un individuo, e identificar a éste, tener una imagen visual suya, memorizarla y darle un
nombre.
Segundo caso: no reconocemos un ejemplar, un individuo o un ítem único y
particular, sino una categoría con causa humana, mecánica o animal: voz de un hombre
adulto, motor de una Mobylette, canto de una alondra.
De modo más general, en casos aún más ambiguos -y mucho más numerosos de lo que se
cree- lo que reconocemos es sólo una naturaleza de causa, la naturaleza misma del agente:
«Debe de ser algo mecánico» (identificado por un ritmo, una regularidad justamente llamada
mecánica); «Debe de ser algo animal, o algo humano», etc. Se localizan entonces, a falta de
algo mejor, ciertos indicios, en especial temporales, de los que intentamos servirnos para
deducir esta naturaleza de la causa.
También podemos, sin identificar la fuente en el sentido de la naturaleza del objeto causal,
seguir con precisión la historia causal del propio sonido. Por ejemplo, conseguimos seguir la
historia de un roce (acelerado, precipitado, ralentizado, etc.) y sentir cambios de presión, de
velocidad y de amplitud, sin saber en modo alguno lo que roza y cómo lo roza.

1.3. La fuente es un cohete de varios cuerpos


No hay que olvidar, finalmente, que un sonido no siempre tiene una fuente única, sino al
menos dos, incluso tres o aún más. Tomemos el rasgueo del rotulador con el que se escribe
el borrador de este texto; las dos fuentes del sonido son el rotulador y el papel, pero también
el gesto de escribir y, además, nosotros que escribimos; y así sucesivamente. Si este sonido
se graba y se escucha en un magnetófono, la fuente del sonido será también el altavoz, la
banda magnética en la que se ha fijado el sonido, etc.
Observemos que, en el cine, la escucha causal es manipulada constantemente y por
completo por el contrato audiovisual, y especialmente por la utilización de la síncresis. Se
trata, en efecto, la mayoría de las veces, no de las causas iniciales de los sonidos, sino de
causas en las que se nos hace creer.
II. SEGUNDA ACTITUD DE ESCUCHA: LA ESCUCHA SEMÁNTICA

Llamamos escucha semántica a la que se refiere aun código o aun lenguaje para interpretar
un mensaje: el lenguaje hablado, por supuesto, y también códigos tales como el morse.
Esta escucha, de funcionamiento extremadamente complejo, es la que constituye el
objeto de la investigación lingüística y ha sido mejor estudiada. Se ha observado, en
particular, que es puramente diferencial. Un fonema no se escucha por su valor acústico
absoluto, sino a través de todo un sistema de oposiciones y de diferencias.
De suerte que, en esta escucha, podrán pasar desapercibidas diferencias importantes de
pronunciación, y por tanto de sonido, si no son pertinentes en el seno de una lengua dada.
La escucha lingüística en francés es insensible por ejemplo a ciertas variaciones
importantes en la pronunciación del fonema «a».
Desde luego, la escucha causal y la escucha semántica pueden ejercitarse paralela e
independientemente en una misma cadena sonora. Oímos a la vez lo que alguien nos dice,
y cómo lo dice. En cierto modo, la escucha causal de una voz, por otra parte, es a su
escucha lingüística lo que la percepción grafológica de un texto escrito es a su lectura.
Hay que precisar que la investigación lingüística ha intentado distinguir y articular
percepción del sentido y percepción del sonido, estableciendo una diferencia entre fonética,
fonología y semántica.

III. TERCERA ACTITUD DE ESCUCHA: LA ESCUCHA REDUCIDA

III.1. Definición
Pierre Schaeffer ha bautizado como escucha reducida a la escucha que afecta a las
cualidades y las formas propias del sonido, independientemente de su causa y de su
sentido, y que toma el sonido -verbal, instrumental, anecdótico o cualquier otro- como objeto
de observación, en lugar de atravesarlo buscando otra cosa a través de él (el calificativo
«reducida» se ha tomado de la noción fenomenológica de reducción en Husserl). Una
sesión de escucha reducida es una experiencia muy instructiva: los participantes acaban
advirtiendo en ella que tenían la costumbre, al hablar de los sonidos, de realizar un vaivén
constante de la materia de esos sonidos a su causa ya su sentido. Se dan cuenta de que
hablar de los sonidos por sí mismos, limitándose a calificarlos independientemente de
toda causa, sentido o efecto, no es empresa menor. Y las palabras analógicas habituales
revelan aquí toda su ambigüedad: tal sonido es chirriante, decimos, pero, ¿en qué sentido?
Chirriante, ¿es sólo una imagen, o no es sino una remisión a una fuente que chirría? ¿O la
evocación de un efecto desagradable?.
Se ven surgir entonces, ante esta dificultad de interesarse por los sonidos en sí, ciertos
tipos de reacción específicos que son otras tantas defensas: sea la burla, la evocación de
causas triviales o peregrinas, cacerolas o grifos. En otros, la huida ante la descripción se
traduce en la pretensión de objetivar el sonido, recurriendo a máquinas tales como
analizadores de espectro o cronómetros, los cuales no captan sino valores físicos y no
designan lo que se oye. Una tercera actitud de repliegue consiste en atrincherarse tras un
subjetivismo a ultranza: así, cada uno oiría una cosa distinta, y el sonido percibido seguiría
siendo siempre irreconocible. Sin embargo, la percepción no es un fenómeno puramente
individual, puesto que deriva de una objetividad particular, la de las percepciones
compartidas. Y en esta subjetividad, nacida de una «intersubjetividad», es donde pretende
situarse la escucha reducida, tal como Schaeffer la ha definido muy bien.
El inventario descriptivo de un sonido en la escucha reducida no puede contentarse con
sólo una aprehensión. Se necesita reescuchar y, para eso, mantener el sonido fijo en un
soporte. Pues un instrumentista o un cantante, interpretando ante nosotros, son incapaces
de repetir todas las veces el mismo sonido: no pueden reproducir sino su altura y su perfil
general, no las cualidades concretas que particularizan un suceso sonoro y lo hacen único.
La escucha reducida implica, pues, la fijación de los sonidos, los cuales acceden así al
status de verdaderos objetos.

III.2. Exigencias de la escucha reducida

La escucha reducida es una gestión nueva, fecunda. ..y poco natural. Altera las costumbres
y las perezas establecidas, y abre a quien la aborda un mundo de preguntas que antes ni
siquiera imaginaba plantearse. Todo el mundo la practica un poco, pero de manera muy
elemental: cuando situamos la altura de una nota o los intervalos entre dos sonidos
hacemos escucha reducida sin saberlo, pues la altura es desde luego un carácter propio del
sonido, independiente de la identificación de su causa o de la comprensión de su sentido.
El problema consiste en que un sonido no se define únicamente por una altura precisa, y
que, tiene desde luego otros caracteres perceptivos. Y por otra parte, en que muchos
sonidos cotidianos no tienen una altura precisa y observable, sin la cual la escucha reducida
no sería nada distinto del apacible solfeo tradicional.
¿Puede formularse algo descriptivo sobre los sonidos, haciendo, al mismo tiempo
abstracción de su causa? Schaeffer ha mostrado que era posible, pero sólo pudo abrir el
camino, proponiendo un sistema de clasificación en su Tratado de los objetos musicales,
sistema que, ciertamente, no está terminado ni al abrigo de toda crítica, pero que tiene el
inmenso mérito de existir.
Imposible, en efecto, desarrollar una escucha reducida si no se crean conceptos y criterios
nuevos, ya que el lenguaje corriente, así como el lenguaje musical especializado, están
totalmente desarmados ante algunos de esos rasgos sonoros que la escucha reducida de
los sonidos fijados nos hace reconocer.
En este volumen no vamos a hacer un curso de escucha reducida y descripción sonora;
sobre este tema, remitimos a los libros dedicados a la cuestión y, en especial, a nuestro
propio resumen de los trabajos de Pierre Schaffer, publicado bajo el título de Cuide des
Objets Sonores.

III.3. ¿Para qué sirve la escucha reducida?

Pero, ¿para qué nos sirve la escucha reducida? , se preguntaban unos estudiantes a
quienes habíamos hecho practicar intensamente durante cuatro días, y que aspiraban a una
dedicación audiovisual. En efecto, si el cine y el vídeo emplean los sonidos, es, parece, sólo
por su valor figurativo, semántico o evocador, en referencia a causas reales o sugeridas o a
textos, pero pocas veces en cuanto formas y materias en sí.
No obstante, la escucha reducida tiene la inmensa ventaja de ampliar la escucha y de afinar
el oído del realizador, del investigador y del técnico, que conocerán así el material de que se
sirven y lo dominarán mejor. En efecto, el valor afectivo, emocional, físico y estético de un
sonido está ligado no sólo a la explicación causal que le superponemos, sino también a sus
cualidades propias de timbre y de textura, a su vibración. Paralelamente, en el plano visual,
a un realizador o un operador-jefe les interesará muchísimo perfeccionar su conocimiento de
la materia y de la textura visuales, incluso aunque nunca hagan películas abstractas.

III.4. Acusmática y escucha reducida

La escucha reducida y la situación acusmática están en concordancia, pero de una manera


más ambigua de lo que dejaba entender Pierre Schaeffer, a quien debemos el haber
establecido estas dos nociones.
Schaeffer, en efecto, subrayaba hasta qué punto la situación de escucha acusmática,
definida más abajo como aquella en la que se oye el sonido sin ver su causa, puede
modificar nuestra escucha y atraer nuestra atención hacia caracteres sonoros que la visión
simultánea de las causas nos enmascara, al reforzar la percepción de ciertos elementos del
sonido y ocultar otros. La acusmática permite revelar realmente el sonido en todas sus
dimensiones.

Al mismo tiempo, Schaeffer pensaba que la situación acusmática podía alentar por sí
misma la escucha reducida, es decir, alejarse de las causas o de los efectos en beneficio de
una localización consciente de las texturas, de las masas y de las velocidades r sonoras.
Contrariamente, muchas veces, se produce lo inverso al menos en un primer momento, ya
que la acusmática empieza por exacerbar la escucha causal privándola del socorro de la
vista. Frente aun sonido que pasa por un altavoz y que no se presenta t con su tarjeta de
visita visual, el oyente es inducido a plantearse con mucha más ansia la pregunta «¿Qué
es?» (traducible por «¿Qué causa ese sonido?») y a acechar los menores indicios de
identificación de la causa, a menudo interpretados por otra parte en sentido contrario.
En cambio, la escucha repetida de un mismo sonido, en la t escucha acusmática de los
sonidos fijos, es la que nos permite separarnos gradualmente de su causa, y precisar mejor
sus caracteres propios.
Paralelamente, gracias a sus correlaciones: ¿a partir de qué, en efecto, deducimos una
causa sino a partir de la forma característica a la que obedece el sonido? El saber que es
«el sonido de...» ya no presenta el riesgo de ocultar la pregunta: ¿qué sucede con el sonido
mismo?

IV. OÍR / ESCUCHAR y VER / MIRAR


Nos ha parecido importante plantear la distinción de las tres actitudes de escucha en el
marco de este ensayo sobre la audiovisión, pero hay que recordar igualmente en qué
contexto, variado y múltiple, se recubren entre sí y se combinan estas tres escuchas en el
cine.
La cuestión de la escucha es inseparable del hecho de oír, igual que la de la mirada está
ligada al ver. Dicho de otro modo, para describir los fenómenos perceptivos es obligatorio
tener en cuenta que la percepción consciente y activa no es sino una elección en un dado
más amplio que está ahí imponiendo su presencia.
En el cine, la mirada es una exploración, espacial y temporal a la vez, en un dado a la
vista delimitada que se mantiene en el marco de una pantalla. Mientras que la escucha, por
su parte, es una exploración en un dado-al-oído e, incluso, un impuesto- a/-oído mucho
menos delimitado en todos los aspectos, con unos contornos inciertos y cambiantes.
Por razón de hechos naturales conocidos de todos (la ausencia de párpados para las
orejas, la omnidireccionalidad de la escucha, y la naturaleza física misma del sonido), pero
también de una ausencia de verdadera cultura auditiva, este impuesto-al-oído es tal que
difícilmente podemos excluir, seleccionar y cortar en él cosa alguna. En el sonido siempre
hay algo que nos invade y nos sorprende, hagamos lo que hagamos. y que, incluso y sobre
todo cuando nos negamos a prestarle nuestra atención consciente, se inmiscuye en nuestra
percepción y produce en ella sus efectos. La percepción consciente puede, por supuesto,
ejercitarse esforzadamente por someter todo a su control, pero, en la situación cultural
actual, el sonido tiene, más fácilmente que la imagen, el poder de saturarla y cortocircuitarla.
Sus consecuencias, para el cine, son que el sonido es, más que la imagen, un medio
insidioso de manipulación afectiva y semántica. Sea que el sonido actúe en nosotros
fisiológicamente (ruidos de respiración); o sea que, por el valor añadido, interprete el sentido
de la imagen, y nos haga ver en ella lo que sin él no veríamos o veríamos de otro modo.
Por eso, el sonido no se puede investir y localizar del mismo modo que la imagen.
3. Líneas y puntos

I. LA CUESTIÓN DE LO HORIZONTAL y DE LO VERTICAL 1.1.


¿Armonía o contrapunto?

Hacia finales de los años 20, justamente a la llegada del sonoro, que coincidió con un
extraordinario impulso estético en el cine mudo, gustaba mucho hacer comparaciones entre
cine y música. Por eso, cuando llegó el sonido, se lanzó la expresión, aún hoy en boga, de
contrapunto, para designar la fórmula ideal in abstracto de cine sonoro: aquella en la que,
lejos de resultar redundantes como se decía, sonido e imagen formarían dos cadenas
paralelas y libremente enlazadas, sin, dependencia unilateral.

Recordemos que, en la terminología de la música clásica occidental, se llama contrapunto


al modo de escritura que piensa las diferentes voces simultáneas como necesariamente
seguidas cada una en su desarrollo horizontal, coordinado con el de las demás voces, pero
individualizado; mientras que la armonía considera el punto de vista vertical, el de las
relaciones de cada nota con las oídas en el mismo momento, que forman acordes todas
juntas, y regula la conducta de las voces en relación con el logro de estos acordes
verticales. El aprendizaje de la escritura musical clásica implica estas dos disciplinas y, de
hecho, la mayor parte de las obras del repertorio occidental, a partir de cierto período,
combinan más o menos en su escritura estas dos dimensiones, difíciles de disociar
totalmente.
Un supuesto contrapunto audiovisual, ejercido en condiciones muy diferentes del
contrapunto musical (puesto que este último funciona con el mismo material de notas,
mientras que el sonido y la imagen pertenecen a categorías sensoriales diferentes),
implicaría pues, si la comparación tiene sentido, que pudiera constituirse en el cine una «voz
sonora», horízontalmente percibida como coordinada con la cadena visual, pero
individualizada y diseñada por sí misma.
Lo que queremos demostrar aquí es que el cine, en su dinámica particular y por la
naturaleza de sus elementos, tiende a excluir la posibilidad de ese funcionamiento horizontal
y contrapuntístico. Es tal, por el contrarío, que las relaciones armónicas y verticales (sean
consonantes, disonantes o ni-Io-uno-ni-Io-otro, a lo Debussy), es decir, específicamente, las
relaciones entre un sonido dado y lo que sucede al mismo tiempo en la imagen, son en él
más ampliamente impositivas. La aplicación al cine de la noción de contrapunto es, pues, un
parche, resultante de una especulación intelectual, más que un concepto vivo.
Prueba de ello es que este paralelismo pronto se convirtió en un embrollo empleándose
incluso en sentido contrario, y que muchos ejemplos presentados como modelos de
contrapunto eran, en rigor, casos de armonía disonante, puesto que atestiguaban
justamente una discordancia momentánea entre una imagen y un sonido, en relación con su
naturaleza figurativa. Nosotros mismos, si bien vamos a utilizar la metáfora musical, no
debemos engañarnos: el término armonía no da cuenta tampoco de la especificidad del
fenómeno audiovisual.
Realmente, nuestra interrogación sobre el doble aspecto horizontal y vertical de la cadena
audiovisual, a la que va a dedicarse todo este capítulo, pone de relieve su interdependencia
y su dialéctica: por ejemplo, las películas en las que es posible una especie de libertad
horízontal ejemplo típico de ellas es el videoclip, con sus cadenas paralelas de imágenes y
de sonidos, sin relación precisa muchas veces- muestran al mismo tiempo una vigorosa
solidaridad perceptiva, marcada por la disposición regular, de vez en cuando, de puntos de
sincronización. Los cuales, para recurrir a la comparación clásica, dan el armazón armónico
del sistema audiovisual.

1.2. La disonancia audiovisual

El contrapunto audiovisual, llamado, interpelado, reclamado, sin cesar a voz en grito en el


cine, puede encontrarse diariamente en la televisión, pero nadie parece advertirlo. Se
produce en especial en retransmisiones de ciertos acontecimientos deportivos, cuando la
imagen sigue un camino y el comentario otro. Hay un ejemplo al que nosotros recurrimos
con frecuencia para evidenciarlo, y que está tomado de una secuencia del reportaje sobre
una carrera ciclista en Barcelona: la imagen muestra a los corredores tomados desde un
helicóptero y es totalmente muda. El sonido, por su parte, es un diálogo a través de las
ondas entre los periodistas y unos corredores que no participan. Visiblemente, en este
fragmento, los que hablan no miran las imágenes ni un segundo, y tampoco las comentan.
Durante dos minutos, todo eso sigue caminos perfectamente divergentes y solamente la
circunstancia ciclista da algún sentido a la cohabitación de esos dos universos. Y sin
embargo, nadie a quien se da a ver este ejemplo observa nunca el contrapunto que reina en
él.
¿Por qué? Porque el contrapunto audiovisual no se advierte salvo si opone sonido e imagen
sobre un punto preciso, no de naturaleza, sino de significación; es decir, si prejuzga la
lectura que va a hacerse, tanto del sonido como de la imagen, al postular una cierta
interpretación lineal del sentido de los sonidos, rebajando por otra parte ese «sentido», en
general, a una pura cuestión de identificación y de causa.
Así, el problema del contrapunto-contradicción, o más bien de la disonancia audiovisual, tal
como ha sido empleada y reivindicada en películas como L 'Homme qui ment, de Robbe-
Orillet, con una partitura sonora de Michel Fano, es que implica una prelectura de la relación
sonido/imagen, y la bloquea en una comprensión de sentido único, pues supone un desfase
retórico preestablecido (al modo de: «Debería oír eso, u oigo eso»). De hecho, introduce el
lenguaje y sus categorías abstractas, manejadas en ¡ términos de sí/no,
redundante/contradictorio.
Sobre una imagen dada, hay en efecto cientos de sonorizaciones posibles, toda una escala
de soluciones, algunas de las cuales reproducen exactamente el código convencional,
mientras que otras, sin llegar aun desmentido formal de la imagen, hacen deslizar su
percepción a otro plano. La disonancia audiovisual, por su parte, no es sino un desfase
invertido de la convención y, por tanto, un homenaje a ésta, y nos encierra en una lógica
binaria que poca relación tiene con el cine.
El ejemplo de un verdadero contrapunto libre, lo tenemos en una asombrosa escena de
resurrección de la película Solaris, de Tarkovski.
La antigua amante del héroe, que se ha suicidado tiempo antes, se le aparece de nuevo en
carne y hueso, en una estación espacial, bajo el efecto de fuerzas misteriosas suscitadas
por un planeta-cerebro. Desesperada y consciente de su naturaleza de artefacto, se suicida
de nuevo bebiendo oxígeno líquido. El héroe estrecha su cuerpo totalmente helado. Pero,
despiadadamente, el cerebro-océano la resucita, y entonces puede verse el cuerpo yacente
agitado por sobresaltos que no son ya los de la agonía ni los del placer, sino los del retorno
a la vida.
Sobre estas imágenes, Tarkovski pensó en colocar sonidos de tintineos de vidrio cuyo
efecto es prodigioso: no se oyen como no-los-sonidos-que-deberían-ser, sino que traducen
de manera turbadora, incluso terrorífica, el carácter a la vez frágil y artificial de la criatura,
así como el sentimiento de la precariedad de los cuerpos.

1.3. Predominio de las relaciones verticales en la cadena audiovisual

(no hay banda sonora)

Ya en nuestro libro La Voix au cinéma anunciamos la cuestión del sonido en el cine


formulando lo que debería ser una evidencia: que no hay banda de sonido. Que haya en el
sentido puramente técnico de la palabra una banda sonora que discurre a lo largo de la
película, es un hecho, pero eso no implica la existencia de un total unitario que formarían
entre sí los sonidos del filme.
Si bien vamos a emplear el término en esta obra, no será sino para designar técnica y
empíricamente la simple sucesión, inerte y desprovista de significación autónoma, de todos
los sonidos de la película, sin prestarle en modo alguno un sentido activo. La noción de
banda de sonido, tal como se emplea, es en realidad un puro calco mecánico de la idea de
banda de imagen, la cual existe, en efecto, puesto que debe su ser y su unidad ala
presencia de un marco, de un lugar de imágenes investido por el espectador. Al formular
que no hay banda sonora, queremos decir, pues, de entrada, que los sonidos de la película
no forman, tomados aparte de la imagen, un complejo dotado en sí mismo de unidad interna,
que pueda confrontarse globalmente con lo que se llama banda de imagen. Pero queremos
decir también que cada elemento sonoro establece con los elementos narrativos contenidos
en la imagen -personajes, acción-, así como con los elementos visuales de textura y
decorado, relaciones verticales simultáneas mucho más directas, fuertes y apremiantes que
las que ese mismo elemento sonoro puede establecer paralelamente con los demás
sonidos, o que los sonidos establecen entre sí en su sucesión. Es como una receta: aunque
mezcláramos aparte los constituyentes sonoros antes de verterlos sobre la imagen, se
produciría una reacción química que des-solidarizaría los sonidos y los haría reaccionar a
cada uno individualmente en el campo visual.

La relación más sencilla y más intensa, la de su fuera de campo, supone por ejemplo la
confrontación del sonido con la imagen que lo establece como fuera-de-campo, al tiempo
que lo hace resonar en su superficie. Suprimid la imagen, y los sonidos fuera- de-campo,
que se mantenían aparte de los otros sonidos, por el puro efecto de la exclusión visual de
sus fuentes, pasan a ser como los demás. La estructura global se derrumba y los sonidos
rediseñan juntos otra completamente nueva. La película, privada de su imagen y
transformada en banda sonora, se revela así insólita, por poco que se la escuche y no se
superpongan las imágenes memorizadas a los sonidos que se oyen. Sólo entonces puede
hablarse de una banda sonora.
No hay, pues, en el cine una banda de imagen y una banda de sonido, sino un lugar de la
imagen y de los sonidos.

II. EL SONIDO y LA IMAGEN EN RELACIÓN CON LA CUESTIÓN DEL


MONTAJE

II.l. El montaje de los sonidos no ha creado una unidad especifica


Los sonidos, como las imágenes cinematográficas, se montan: es decir, se fijan en
porciones de banda magnética, de sonido óptico o de película, que pueden cortarse, unirse y
desplazarse a voluntad.

Para la imagen, esta fabricación a través del montaje es incluso la que ha creado la unidad
específica del cine: el plano. Una unidad más o menos pertinente en cuanto al análisis
fílmico (eso depende de las gestiones y de los realizadores), pero que, de todos modos,
sigue siendo muy práctica para señalizar las películas. Aunque no se considere el plano 67
como una unidad narrativa estructural en sí -y sí sólo como un plano, es decir como una
porción de película comprendida entre dos cortes-, es de un interés formidable poder decir:
el elemento interesante, pertinente, significativo del que hablamos se sitúa entre la mitad del
plano 92 y el final del plano 94. El plano tiene, en efecto, la inmensa ventaja de ser una
unidad neutra, objetivamente definida, sobre la cual todo el mundo puede entenderse, tanto
los que han hecho la película como los que la ven.
Se advierte enseguida que no tenemos nada semejante para el sonido: el montaje de los
sonidos en el cine no ha creado una unidad específica. No percibimos unidades de montaje-
sonido, y los cortes sonoros no nos saltan al oído ni nos permiten delimitar entre sí bloques
identificables.
Eso no es, además, específico del cine: se montan sonidos desde que la técnica lo permite
(es decir, desde hace unos 60 años), tanto en la radio y en el disco como en la música sobre
banda magnética. Ahora bien, en ninguno de estos casos, haya o no imagen, ha podido
emerger la noción de plano sonoro en cuanto unidad de montaje como unidad neutra y
reconocida por todos.
Hay varias razones para eso.

II.2 Posibilidad de un montaje in audible de los sonidos

Por una parte, como se sabe, la «banda de sonido» de una película está a menudo
constituida por varias capas realizadas y depositadas independientemente, que se recubren
las unas alas otras. Imaginemos una película producto de una mezcla de tres capas de
imágenes en sobreimpresión: muy difícil sería localizar en ella los cortes. Es el caso, en
algunos momentos, del Napoleón de Abel Gance, o de Tchéloviek s kino-apparatom [El
hombre de la cámara] de Dziga Vertov.
Por otra parte, está en la naturaleza misma del fenómeno sonoro fijado en un soporte, el
poder ser añadido a otro mediante el montaje sin que se note la unión: un diálogo fílmico
puede, por ejemplo, rellenarse con añadidos inaudibles, imposibles de detectar para un
oyente. Mientras que, como se sabe, es muy difícil unir de manera invisible dos planos
rodados en momentos diferentes: la unión salta a la vista. En La soga, película «en un solo
plano», Hitchcock sólo pudo hacerlo con una tosca astucia, que consistía en hacer pasar
ante la cámara la espalda de un personaje.
Al lado de eso, desde luego, los cortes sonoros pueden oírse y localizarse de una manera
casi brutal. Las dos cosas son, pues, posibles con el sonido: tanto el montaje audible como
el montaje inaudible.
Además, la mezcla de las pistas sonoras es esencialmente, en la práctica más corriente, el
arte de suavizar las aristas por medio de degradados de intensidad. Todo esto hace ya
imposible por sí mismo la adopción, para el sonido, de una unidad de montaje en cuanto
unidad de percepción, ni siquiera en cuanto unidad de lenguaje.
Algunos, sin embargo, ven en este estado de hecho, no un dato «natural», sino la
traducción de una posición ideológica y estética determinada que sería propia del cine
dominante, y correspondiente a la voluntad de ocultar las huellas de la elaboración, para dar
a la película un aire de continuidad y de transparencia: en los años 60 y 70 se han hecho
muchos análisis de este tipo, invariablemente concluidos con la exhortación a hacer reinar
en el cine una discontinuidad desmitificadora.
En realidad, muy pocos realizadores respondieron a esta exhortación, salvo, en algunas de
sus películas, Godard, uno de los pocos en cortar tanto los sonidos como imágenes,
acusando las discontinuidades y los cambios de ritmo, limitando al máximo el montaje
invisible y los degradados de intensidad, así como todos los efectos de encadenado y de
fundido, universalmente emplea- dos en el montaje del sonido en el cine.

II.3. ¿Forma un plano de sonido un tramo de sonido audible?

Además, Godard pone tanto más al descubierto el montaje de los sonidos cuanto que evita
mezclar demasiadas pistas diferentes ala vez (en algunas de sus películas se limitan a dos),
de manera que nuestra atención no se ve solicitada por cortes y rupturas de la cadena
sonora en diferentes niveles; está pues en condiciones de seguir el hilo del discurso sonoro
y de oír «al desnudo» todas las rupturas, cuando éstas se efectúan de modo que sean
audibles. Con sus películas estamos, pues, en las más francas y radicales condiciones para
aprehender lo que podría ser un plano del sonido.
Por ejemplo, al principio de le vous salue Marie, se oyen claramente los cortes que aíslan
tramos sonoros: fragmento de un preludio de Bach interpretado al piano, gritos de un equipo
femenino de baloncesto en un estadio cubierto, frases de voces en off, etc. Sólo que estos
tramos de sonido perfectamente delimitados no crean en modo alguno el sentimiento de una
unidad. Para la escucha no constituyen bloques: la percepción, siempre sobre el hilo del
tiempo con respecto al sonido, se limita a saltar el obstáculo del corte y pasar enseguida
a otra cosa, olvidando la forma de lo que había oído precedentemente. El tramo de sonido,
al menos si sobrepasa una duración muy corta, no se sintetiza en la percepción en una
totalidad particular.
Notemos que lo mismo sucede en los planos visuales, cuando éstos son planos en
movimiento que implican una variación constante del encuadre entre su principio y su fin. La
visión se sitúa entonces mucho más sobre el hilo del tiempo, puesto que no tiene estabilidad
espacial. En cambio, en el caso de un desglose a partir de planos fijos o discretamente
reencuadrados, cada plano se identifica para nosotros con cierta disposición de objetos, con
cierta perspectiva, y nos es fácil representarlo en nuestra memoria por esta disposición.
En sentido opuesto, incluso en el caso de un ambiente sonoro estable fragmentado en
pequeños fragmentos, como en Godard, no hay nada que hacer; para el sonido es la
percepción secuencial, temporal, la que domina, al menos más allá de una duración muy
corta.
Por otra parte, y sobre todo entre dos tramos sonoros que se suceden (fragmentos de
cantos de aves o grabaciones musicales), no es posible crear una relación de naturaleza
abstracta y estructural como las que pueden establecerse entre los planos visuales del tipo:
alguien mira algo / el objeto de su mirada; el conjunto de un decorado / un detalle de este
conjunto, etc. Si se intenta algo similar con el sonido, la relación abstracta que ha querido
establecerse queda ahogada en el flujo temporal; lo que se impone es más bien el carácter,
individualmente dinámico, particular y momentáneo, de la ruptura entre los dos fragmentos.
La explicación de este misterio es que, cuando hablamos de plano en el cine, efectuamos
un enlace entre el espacio del plano y su duración, entre su superficie espacial y su
dimensión temporal. Mientras que, en nuestros tramos sonoros, parece predominar
ampliamente la dimensión temporal y no existir en absoluto la dimensión espacial.
De suerte que, cuando hay contrato audiovisual y superposición de cadenas visuales y
sonoras, los cortes visuales siguen sien- do el punto de referencia de la percepción. En
cuanto a los cortes secos godardianos en el terreno del sonido, si bien fracturan la
continuidad del plano, como dicen poéticamente algunos investigadores, apenas son otra
cosa que una línea de fisura en un vidrio que permanece entero.

II.4. La condición para un lugar del sonido

El ejemplo de le vous salue Marie es además interesante por más de un aspecto: la regla
que se ha impuesto en ella el realizador, de no emplear más de dos pistas simultáneamente,
es una limitación personal que no crea sin más en el espectador la con ciencia autónoma de
dos pistas separadas. En realidad, el único modo de experimentar
estas dos pistas sería adjudicarles en la sala una fuente espacial diferente y específica. Con
esta condición, con cada pista ligada aun altavoz, se tendría entonces la sensación de un
verdadero lugar del sonido, de un continente sonoro de los sonidos. Sería preciso, además,
no sólo que éstos proviniesen de una fuente claramente distinta del espacio sonoro de la
pantalla, sino también, por añadidura, que evitasen sincronizarse con la imagen, para
sustraerse al efecto de imantación espacial por - la imagen que estudiaremos más tarde, j Y
que en general es el más fuerte!.

11.5. Unidades. pero no especificas


¿Quiere esto decir que una banda de sonido fílmica constituye para la escucha un flujo sin
cortes? De ningún modo, pues de todas maneras distinguimos en ella unas unidades: pero
éstas -frases, ruidos, temas musicales, células sonoras- son exactamente del mismo tipo
que en la experiencia corriente, y se localizan en función de criterios específicos de los
diferentes tipos de sonidos oídos. Si se trata por ejemplo de un diálogo, dividimos el flujo
vocal en frases, palabras, y, por tanto, en unidades lingüísticas. Si se trata de ruidos,
realizamos un desglose perceptivo en sucesos sonoros, más fácil si se trata de sonidos
aislados. En una música aislamos melodías, temas y células rítmicas, según el grado de
nuestra cultura musical. En resumen, funcionamos como de costumbre, con unidades que
no son específicamente cinematográficas y dependen totalmente del tipo de sonido y del
nivel de escucha elegido (semántica, causal o reducida).
Del mismo modo, si necesitamos aislar los sonidos unos de otros en su superposición y no
en su sucesión, nos referimos para esto a una multitud de indicios y de niveles de escucha:
escucha causal, diferenciación en masa, en calidad acústica, etc. A partir de aquí puede
explicarse que la unidad visual del plano, específicamente cinematográfica, siga siendo con
mucho la más imperativa, y que el desglose sonoro se someta a ella ya ella se refiera.

II.6. El flujo sonoro: lógica interna, lógica externa

El flujo del sonido de una película se caracteriza por el aspecto más o menos ligado, más o
menos insensible y fluidamente encadenado de los diferentes elementos sonoros, sucesivos
y superpuestos o, por el contrario, más o menos accidentado y roto por cortes secos, que
interrumpen brutalmente un sonido para sustituirlo por otro.
La impresión general del flujo sonoro, por otra parte, es consecuencia no de las
características de montaje y de mezcla separadamente consideradas, sino del conjunto de
los elementos. Jacques Tati, por ejemplo, utiliza efectos sonoros extremadamente
puntuados y delimitados, realizados por separado y localizados en el tiempo, cuya simple
sucesión daría una banda sonora fragmentada y espasmódica, si no emplease para enlazar
el conjunto unos elementos de ambiente continuo -por ejemplo ambientes vocales
«fantasmas» (los juegos playeros en Las vacaciones de Monsieur Hulot, O los gritos propios
de un mercado en Mi tío)- que sirven de lazo de unión y disimulan oportunamente las
rupturas de flujo que se derivan inevitablemente de una elaboración muy fragmentada y
puntual de los sonidos.
Llamaremos lógica interna del encadenamiento audiovisual a un modo de encadenamiento
de las imágenes y de los sonidos concebido para que parezca responder aun proceso
orgánico flexible de desarrollo, de variación y de crecimiento, que naciera de la situación
misma y de los sentimientos que ésta inspira: la lógica interna privilegia, pues, en el flujo
sonoro, las modificaciones continuas y progresivas, y no utiliza las rupturas sino cuando la
situación lo sugiere. En cambio, se llamará lógica externa (al material) a la que acusa los
efectos de discontinuidad y de ruptura en cuanto intervenciones externas al contenido
representado: montaje que corta el hilo de una imagen o de un sonido, rupturas, arritmias,
cambios bruscos de velocidad, etc.
Películas como Madame de..., de Ophuls; La Dolce Vita, de Fellini; o Hijos de un dios
menor, de Randa Haines, adoptan una lógica interna: el sonido se dilata, desaparece,
reaparece, se estrecha o se amplifica según procesos que parecen emanar de los
personajes mismos, de sus afectos y de sus sensaciones, mientras que películas como
Alien, el octavo pasajero, de Scott, M, de Lang, o Nouvelle vague, de Godard, recurren a
una lógica externa, con efectos marcados de encadenamientos y de rupturas. El empleo de
la lógica externa no es forzosamente fuente de distanciamiento crítico, como se sugiere a
menudo a propósito de Godard.
En Alien, por ejemplo, los numerosos episodios espasmódicos de la continuidad sonora, el
flujo accidentado de la banda sonora y visual, característicos de la lógica externa, sirven
para reforzar la tensión de las situaciones. Es cierto que se trata, en este caso, de un tema
de ciencia-ficción, en el cual la retransmisión hertziana o telefónica, con sus vicisitudes y sus
cortes, está presente como elemento concreto en el guión, y justifica directamente
muchos de estos efectos (vemos a los personajes accionar conmutadores, iluminar pantallas
y manejar consolas, comportándose, pues, ellos mismos, como manipuladores de sonidos y
de imágenes). De manera general, el cine de acción moderno juega mucho con la lógica
externa.
Pero en una película contemplativa como El miedo del portero ante el penalty, de Wenders,
la lógica externa se emplea también, tanto en el sonido como en la imagen, en
relación con una voluntad muy diferente de escritura «literaria» y de fragmentación
existencial en «impresiones», en pequeños haikus sensoriales.

III. EL SONIDO EN LA CADENA AUDIOVISUAL

III.1. Reunir: el agregado unificador

La función más extendida del sonido en el cine es la que consiste en unificar el flujo de las
imágenes, en enlazarlas por una parte, en el nivel del tiempo, desbordando los cortes
visuales (efecto de encabalgamiento u overlapping)

- Por otra parte, en el nivel del espacio, haciendo oír ambientes globales, cantos de
pájaros o rumores de tráfico, que crean un marco general en el que parece
contenerse la imagen, un algo oído que baña la visto, como en un fluido
homogeneizador;

- en tercer lugar, finalmente, por la presencia eventual de una música orquestal que, al
escapar a la noción de tiempo y espacio reales, desliza las imágenes en un mismo
flujo.

Esta función de agregado unificador, en la que el sonido desborda temporal y


espacialmente los límites de los planos visuales, ha sido criticada por la doctrina que puede
llamarse diferencialista, partidaria de que el sonido y la imagen actúen en zonas separadas.
Es curioso que esta doctrina olvide criticar la misma decisión previa unificadora cuando se
aplica a la imagen misma: aludimos al cuidado por la continuidad visual que preside la
fotografía de casi todas las películas, sean mudas o sonoras (incluidas las de Godard,
Duras, Syberberg) y que procura, en el nivel de las mediciones, los ajustes de luz y las
dominantes del color, hacer de la película un conjunto. Viendo una película constituida por
cuatrocientos o quinientos planos, ¿estaríamos dispuestos a percibir- la como una sucesión
de quinientas unidades perfectamente distintas, como han intentado algunas películas
experimentales?

III.2. Puntuar
La función de puntuación en sentido amplio, en toda la extensión de su sentido gramatical
(poner comas, puntos y coma, puntos, signos de exclamación, de interrogación, puntos
suspensivos, que modularán el sentido y el ritmo del texto, o lo determinarán
incluso), es desde hace mucho tiempo la base de la puesta en escena teatral. El texto de la
obra se aborda como una especie de continuum que se debe puntuar con elementos
escénicos más, o menos indicados ya en las acotaciones, pero también puestos apunto
durante los ensayos: pausas, entonaciones, respiraciones, gestos, etc. El cine mudo
recuperó los procedimientos clásicos de puntuación de las escenas y en particular de los
diálogos (pues, recordémoslo, ese cine era dialogado) tanto más fácilmente cuanto que
tomaba muchos de sus procedimientos narrativos de la ópera, que practicaba una gran
variedad de efectos musicales puntuadores, utilizando todos los recursos de la orquesta.
En el cine mudo la puntuación era múltiple: gestual, visual y rítmica. Y los rótulos,
evidentemente, funcionaban como un elemento de puntuación nuevo y específico. Más allá
del texto escrito, el grafismo de sus caracteres, su eventual repetición, su dimensión en la
Imagen, constituían otros tantos medios de otorgar una cadencia a la película.

El sonido síncrono trajo, pues, al cine, no el principio de la puntuación en sí mismo, sino un


medio más discreto y subrepticio de introducirlo en las escenas sin recargar el trabajo de los
actores o el découpage. Un ladrido de perro en fuera de campo, un reloj de pared que suena
en el decorado o un piano vecino son medios discretos para subrayar una palabra, dar
cadencia a un diálogo o cerrar una escena.
Esta utilización puntuadora del sonido deriva con gran naturalidad de la iniciativa del
montador o del encargado de sonido, los cuales, basándose en el ritmo del plano, la labor de
los actores y el sentido general de la escena deciden, a partir de los ruidos que se les
proporcionan o que ellos eligen, el lugar en el que se colocará la puntuación sonora, a
menos que el realizador, en un caso de protagonismo bastante raro, se ocupe él mismo de
ello muy de cerca. Algunas puntuaciones sonoras están previstas también ya en el estadio
de guión.
Naturalmente, la música en el cine puede desempeñar un papel eminentemente puntuador,
papel que desempeñaba también en el cine mudo, pero más vagamente, por razón del
carácter aproximado que revestía entonces su sincronización con la imagen. Y no es
extraño que ciertas películas de los comienzos del sonoro se atrevieran a emplear la música
de modo patente con un papel muy puntuador. El delator, de John Ford, es buen ejemplo de
ello, con su música de Max Steiner.

III.3. Puntuación simbólica mediante la música: el ejemplo de El delator

Durante mucho tiempo, esta película de John Ford -saludada en su estreno como un
acontecimiento- fue incluida en la lista de las diez mejores películas de la historia del cine.
Hoy, muchos fordianos apenas le conceden ya atención por sorprender el expresionismo de
esta película con la idea de serenidad y la amplia mirada con las que están habituados a
asociar a su cineasta favorito. No obstante, esta obra, aunque haya envejecido (su principal
debilidad reside en la escritura y la interpretación de los papeles femeninos), sigue siendo
muy relevante.
No es, sin embargo, por sus propias cualidades por lo que El delator destaca en las
historias del cine, sino a causa de la legendaria historia de un trago de cerveza. Pues no es
sólo en el Oeste donde, por citar una réplica de El hombre que mató a Liberty Valance, se
imprime la leyenda cuando ésta es más seductora que la realidad; en el mundo sucede lo
mismo por todas partes. ¿Cómo nacen las leyendas? De una ausencia, de un hueco que se
debe llenar. Sólo se establecen cuando se les ha dejado espacio. Es el caso de la
anécdota, presentada como el colmo del ridículo en materia de música fílmica, de la
deglución de un bebedor, que el compositor de El delator, en su frenesí imitador, habría
llega- do a traducir en música.
Ya el compositor Maurice Jaubert, en un célebre artículo, muchas veces citado, destacaba
el procedimiento supuestamente empleado:
«..En El delator, la técnica [del sincronismo] es llevada a su más alto grado de perfección,
es la música la encargada de imitar el ruido de las monedas que caen al suelo e incluso -por
medio de un pequeño arpegio juguetón- el paso de la cerveza de un vaso al gaznate de un
bebedor» (conferencia pronunciada en 1937, y citada por Henri Colpi en su excelente obra
Défense et illustra tion de la musique dans le film).
Resulta evidente el camino por el que esta historia circula por las obras que versan sobre la
música en el cine, incluida nuestra Le Son au cinéma, en la cual, no habiendo visto aún la
película, la habíamos repetido confiando en la tradición (cosa que no debería hacerse
nunca). Pero cuando el biógrafo Tag Gallagher cuenta la misma anécdota y en casi los
mismos términos ( «beer gurgling in a man's throat»), ¿la extrae de Jaubert? Lo dudo.
Asistimos aquí a la formación espontánea de una leyenda.
La realidad, como puede comprobarse en el vídeo, es que hay en efecto un momento en
que el héroe bebe, y en el que un tema musical acompaña su gesto. Pero, en primer lugar,
se trata de un vaso de whisky, y sobre todo, el tema que entonces se oye no puede ser
menos imitativo de lo que es. Lejos de ser un «pequeño arpegio juguetón» descendente, se
trata de un motivo interpretado por una sola trompa, y que termina con una quinta
disminuida ascendente, con un matiz heroico e interrogativo ala vez, que en modo alguno
puede imitar un gorgoteo. Reconocemos incluso en él uno de los temas principales de la
partitura, con mayor precisión las cinco primeras notas del tema de Gypo, ya preludiado en
la ficha técnica. Este motivo acompaña al héroe en toda la película y subraya su destino de
un modo más expresivo que imitativo.
La partitura de Max Steiner para El delator se escribió en efecto, según el principio que,
desde entonces, dominará el 90 % de la música cinematográfica: el del leit-motiv, en virtud
del cual cada personaje-clave o cada idea-fuerza del relato están dotados de un " tema que
loS caracteriza y constituye su ángel guardián musical.
Aquí es principalmente el tema de Gypo, relativamente neutro en el plano expresivo, más
bien enérgico y marcato (en su integridad, tiene acentos de música popular irlandesa), y el
tema de Katie -la prostituta de buen corazón de la que está enamorado Gypo-, que es por el
contrario espressivo y legato. Más un motivo especial para el personaje simbólico del ciego
(una fórmula quejumbrosa que evoca la expresión de lo vago y de lo informe en Debussy) y
así sucesivamente, sucediéndose estos temas en la orquesta en relación con las
apariciones de loS personajes y su- friendo transformaciones que reflejan las variaciones de
su hábitat exterior y de su estado interior.
Por supuesto, la teorización y sistematización del leit-motiv se remonta a Wagner , pero si
hay una ópera que haya podido inspirar a Steiner para El delator, sería más bien Pelléas et
Méli- sande, de Debussy. Una ópera en la cual el autor, aunque se hubiese burlado del
procedimiento en términos sarcásticos, lo recoge intentando hacerlo más discreto, con
temas más lacónicos y menos triunfalistas. Igualmente debussianos en El delator -como
veremos más tarde-, son la insistencia en loS silencios y cierta estética de lo entrecortado:
cuando la música se detiene y una palabra se inscribe en esta interrupción.
Todo esto demuestra una tentativa de hacer del cine sonoro una especie de ópera hablada,
tentativa en la que puede verse la mano de John Ford tanto como la del Compositor. Nada
tiene, en efecto, El delator de una película a la cual se hubiese aplicado aun músico, tras el
rodaje, para que le diese una capa de esmalte musical. La película había sido objeto de una
concertación previa entre el realizador, el decorador y el Compositor, concertación en la que,
según confesión de loS participantes, se profundizó mucho más allá de lo habitual en el
cine. Las selecciones musicales ~ de El delator no sólo fueron toleradas por Ford, sino que
también obtuvieron su aprobación, y acaso incluso siguieron sus sugerencias.
La clave estilística de The Informer es, en efecto, una vo1untad de estilización y de
expresión simbólica en el seno de un cine que, tras la llegada del sonoro, acababa de sufrir
los ataques del naturalismo. Esta estilización persigue evidentemente recuperar el espíritu
del mudo, y realizar incluso algo de lo que para el cine mudo sólo había sido un sueño. La
puntuación por parte de la orquesta de ciertos gestos y de ciertas réplicas apunta, pues, a
arrebatarles su carácter puramente realista y momentáneo, para hacer de ellos elementos
significativos en el seno de una escenificación global.

De hecho, la música de Max Steiner en la película es muy poco imitativa de la materialidad


inmediata de los acontecimientos, mucho menos en todo caso que la inmensa mayoría de
las músicas para la pantalla, pasadas o actuales. No subraya el ruido de los elementos, el
cierre de las puertas o las caídas de cuerpos, y cuando se hace oír sobre un gesto
particular, su perfil intenta no imitar la forma de éste. Por ejemplo, la escena a la que Jaubert
aludía de memoria.
Para situarla, recordemos que Gypo, un patán rechazado por su entorno, acaba de entregar
ala policía a su amigo Frankie, un independentista irlandés acorralado, y de recibir el dinero
correspondiente a su delación. Muy pronto, se entera de que Frankie ha sido asesinado
poco después de su detención. Cuando entra en un café, pide un whisky e inclina la cabeza
para beber: quiere olvidar. Ahora bien, el tema que suena sobre este gesto es el suyo: como
si tras su ausencia de sí mismo asomase y se afirmase su identidad. Mitad enferma de la
pareja que él formaba con Frankie -el cual lo trataba con afectuosa condescendencia, como
si fuera el cuerpo que albergara su cerebro-, Gypo, ser incompleto, no se encontrará a sí
mismo sino entregando al otro y abocándose ala desesperación: la película es la historia de
su acceso ala conciencia.
Ya en Wagner, ciertos temas del tejido orquestal hacen aparecer el inconsciente del
personaje, enunciando lo que él ignora de sí mismo. Por ejemplo, en el primer acto de La
walkyria, el motivo de la espada que actúa, por mediación de la orquesta, sobre el
inconsciente de Sigmundo, antes de que éste encuentre el arma en la cabaña en la que se
ha refugiado. Todo el ambiente de la escena de la taberna, en El delator, tiene además
cierto carácter de meditación, de agitación previa y de preludio que está muy cerca de este
primer acto wagneriano, el cual presentaba ya un tejido musical muy brillante y de aspecto
discontinuo, con interrupciones, repeticiones, silencios, etc.
Pueden, incluso, considerarse ridículas las cuatro notas instrumentales que puntúan, en
sincronismo, las monedas que el camarero devuelve a Gypo. Pero no hay que olvidar que
ese dinero es la moneda de la traición, el dinero de Judas. La caída de las cuatro monedas
es fatal: inicia una cuenta atrás que desembocara en la condena del delator (en efecto,
sumando todas las cantidades repartidas a su alrededor por un Gypo derrochador es como
los independentistas, al reconocer en ellas el total del dinero, verán confirmarse sus
sospechas sobre él). Max Steiner no hace aquí; sino repetir un procedimiento de
expresividad simbólica de las acciones por la música, que tiene numerosos ejemplos en la
opera. .
Por una parte, la música no sustituye el ruido de las monedas, ruido que se oye al
mismo tiempo, con muy ligero desfase; y por otra parte, el perfil de las notas repite
precisamente un leit-motiv de la partitura: el de la traición.

¿Qué es lo que da, sin embargo, a estas intervenciones musicales un aspecto imitativo? El
hecho de ser puntuales y síncronas. Pues -como recordamos más tarde y ya dijimos en La
Toile trouée, en el capítulo «Le clap»- la sincronización es en el cine un criterio
predominante, que consigue superponer sonidos e imágenes que, sin embargo, resultan
opuestos por todos los conceptos. En la ópera, este sincronismo música-acciones,
corrientemente utilizado, no plantea problema alguno, puesto que se integra en cierta
estilización gestual y decorativa del conjunto. En el cine debe manejarse de manera más
insidiosa, para que no se perciba en una intención solamente imitativa, ni caiga en el puro
gag de cartoon. Y si las tentativas de estilización operística de El delator han envejecido mal
al utilizar de modo patente este sincronismo, puede reconocérseles en cambio el mérito de
la audacia y la franqueza. El cine, sin duda, es un arte realista, en el cual se acepta una
cierta estilización de modo distinto que en el escenario; es cierto, por otra parte, que este
arte realista no ha progresado sino por medio de infracciones de su propio principio, y
mediante demostraciones de irrealismo.
¿Cuál es la causa de la gran peculiaridad del empleo de la música en ciertas escenas
de El delator, que le da una presencia que puede parecer fastidiosa? Es la manera en que
se detiene. No se eclipsa con sigilo, como aprenderá a hacer más tarde, sino que se
interrumpe brutalmente, con el pie alzado, creando un silencio en el cual la réplica que sigue
suena de modo diferente. Todo sucede entonces como si la música se designase a sí
misma, deteniéndose y dando paso a la palabra. El cine posterior tenderá a evitar este
efecto de paso, de relevo explícito y de puntuación evidente, sustituyéndolo por un modo de
existencia más fluido y más integrado en la película, más constante e indistinto al mismo
tiempo.

III.4. Utilización puntuadora de los Elementos del Decorado Sonoro (E.D.S)


Llamaremos elementos del decorado sonoro (E.D.S., en abreviatura) a los sonidos de fuente
más o menos puntual y de aparición más o menos intermitente, que contribuyen a poblar y a
crear el espacio de una película por medio de pequeños toques distintos y localizados.
Un sonido típico del decorado sonoro es el ladrido lejano de un perro, el timbre del teléfono
en el despacho vecino, o la sirena de un coche de la policía. Habita y define un espacio,
contrariamente a un sonido permanente, como un canto continuo de pájaros o el sonido de
las olas marinas, que son el espacio mismo.
Aparte de su papel narrativo (establecer o recordar el marco de la acción y sus
dimensiones), el elemento del decorado sonoro puede desempeñar también, por la gracia
del montaje, un papel puntuador. La inteligencia de su distribución en el ritmo de la escena
puede renovar y transfigurar completamente su empleo.
Esta pluralidad de funciones nos recuerda que el análisis sonoro de la película debe tener
siempre en cuenta una posible superdeterminación de los elementos, es decir, que uno de
ellos pueda tener sentido en varios niveles a la vez.

III.5. Convergencias/divergencias: la anticipación

Desde el punto de vista horizontal, los sonidos y las imágenes no son elementos alineados
como los postes de una empalizada, todos ellos desfilando idénticos entre sí. Tienen
tendencias, indican direcciones, poseen leyes de evolución y de repetición que mantienen
un sentimiento de expectación, de esperanza, de saturación que romper o, por el contrario,
de vacío que llenar.
En la música es donde este efecto es más conocido: tiene a menudo su curva, que
deja esperar una cadencia, y la anticipación de esta cadencia por parte del oyente viene a
subyacer en su percepción.
Del mismo modo, un movimiento de cámara, un ritmo sonoro o una evolución de uno de los
actores desencadenan en el espectador un movimiento de anticipación, cuya expectativa
será confirmada o negada por el paso posterior: ésta es la dinámica según la cual funciona
una secuencia audiovisual. Uno de los más aficionados a este juego es Godard, sobre todo
en su Lettre a Freddy Buache. La música elegida para acompañar al conjunto de este vídeo
-el Bolero de Ravel- es una amplia curva melódica que prepara, pero difiere sin cesar, su
cadencia, como un orgasmo retenido, mientras que, por su parte, el texto recitado por
Godard busca sus palabras con un malicioso placer, con el fin de que se hagan esperar en
la imagen, constantes panorámicas dejan imaginar, al final de los trayectos que recorren,
por unos paisajes urbanos o bucólicos, no se sabe qué revelación.
En una cadena audiovisual, el audioespectador localiza, consciente o inconscientemente,
unas direcciones de evolución (un crescendo, un accelerando que se inician) y verifica
seguidamente si esta evolución iniciada se realiza como ha previsto. Evidentemente, es a
menudo más interesante cuando la tendencia iniciada resulta contrariada. A veces también,
cuando todo sucede como se ha dejado anticipar, la perfección y la tersura con que esa
anticipación se realiza bastan para emocionarnos.
En Hijos de un dios menor, cuando William Hurt acaba de salir de la sala de baile iluminada
y se aleja en la noche, se vuelve y Marlee Matlin se reúne con él, toda vestida de blanco:
entonces el sonido de la música de baile empieza a decrecer suavemente,
amortiguado por el potenciómetro. El espectador anticipa conscientemente la reunión de los
dos personajes, y menos consciente- mente la desaparición de la música sobre el encuentro
de los dos amantes, así como el silencio que se produce cuando se tocan. Eso es desde
luego lo que sucede, la convergencia de una reunión y de un amortiguamiento, pero tan
justa y finamente ejecutada, que resulta siempre emocionante cuando la disolución de la
música disco en el silencio y la inmovilización del hombre y de la mujer reunidos se
sincronizan casi en un suspiro.
Pues nunca se cansa uno de anticipar y de sorprender la anticipación: es el
movimiento mismo del deseo.

III.6. Separar: el silencio

Es célebre el aforismo de Bresson que nos recuerda que el cine sonoro ha aportado
el silencio, y esta fórmula ilumina una justa paradoja: ha sido preciso que existan ruidos y
voces para que sus
Ausencias e interrupciones profundicen en eso que se llama silencio, mientras que en
el cine mudo, todo, por el contrario, sugería ruidos.

Sin embargo, este elemento cero -al menos lo parece- de la banda sonora que es el
silencio no es nada fácil de obtener, ni siquiera en el nivel técnico. No basta, en efecto con
interrumpir el flujo sonoro y poner en su lugar unos centímetros en blanco. Se
experimentaría entonces el sentimiento de una ruptura técnica (efecto, sin embargo,
utilizado varias veces por Godard, en especial en Vivir su vida). Cada lugar tiene su silencio
específico, y por eso, durante una toma de sonido en exteriores, en estudio o en auditorium,
se procura grabar unos segundos de silencio específico del lugar, que servirán para los
eventuales encadenados entre las réplicas y crearán el sentimiento buscado: que el marco
de la acción sea temporalmente silencioso.
No obstante, la impresión de silencio en una escena fílmica no es el simple efecto de una
ausencia de ruido; no se produce sino cuando se introduce por medio de un contexto y una
preparación, la cual consiste, en el más sencillo de los casos, en hacerlo preceder de una
secuencia especialmente ruidosa. El silencio, dicho de otro modo, nunca es un vacío neutro;
es el negativo de un sonido que se ha oído antes o que se imagina; es el producto de un
contraste.
Otra manera de expresar el silencio -que puede o no asociarse con el procedimiento
evocado más arriba- consiste en....hacer oír ruidos; pero ruidos tenues, de esos que
asociamos naturalmente ala idea de la calma, porque no atraen nuestra atención, no son
siquiera audibles sino a partir del momento en que los demás -tráfico, conversaciones,
vecinos o ruidos laborales- se han callado. Por ejemplo, cuando oímos el tic-tac de un
despertador.
Un buen ejemplo se encuentra en A/ien, cuando Ridley Scott quiere crear -sobre el primer
plano del gato-mascota en la nave espacial- la impresión de un silencio inquietante y
portador de sombríos acontecimientos. Los planos inmediatamente precedentes son ricos en
accidentes sonoros. Preparan el vacío que va a sobrevenir. Pero se ha procurado no
provocar ese silencio demasiado bruscamente: los tres primeros segundos de la imagen del
gato permiten oír brevemente un ruido tenue y no identificado, semejante aun tic-tac, y cuya
aparición y rápido decrecimiento posterior forman un puente hasta el vacío total de la banda
sonora.
En Cara a cara, Bergman utiliza con este mismo tic-tac el procedimiento inverso: su
personaje es una mujer en pleno período depresivo. En un momento dad la vemos en su
casa preparándose para acostarse y luego meciéndose en la cama. Instantáneamente, el
ruido del despertador que vemos sobre su mesita de noche, que hasta entonces ha pasado
desapercibido, se intensifica y se hace más fuerte. Se tiene entonces, paradójicamente, la
angustiosa impresión del silencio, en un grado tanto mayor cuanto más intenso y estridente
resuena ese sonido, que es lo único que emerge de él, subrayado por el vacío de los demás
ruidos y destacando a su vez ese vacío de una manera horrible. (El toque típicamente
bergmaniano, aquí, es la rapidez y la áspera precisión con que se realiza ese aumento del
sonido.)
Los demás ruidos utilizados en el cine como sinónimos del silencio son: los sonidos
lejanos producidos por animales, los relojes de pared en una habitación cercana, los roces y
los ruidos que sugieren intimidad y proximidad...
Curiosamente también, un toque de discreta reverberación a rededor de sonidos aislados
(por ejemplo, pasos en una calle) puede reforzar este sentimiento de vacío y de silencio. Tal
reverberación no puede percibirse, efectivamente, cuando otros ruidos -por ejemplo, del
tráfico diurno- se dejan oír al mismo tiempo.

IV. EL PUNTO DE SINCRONIZACIÓN, LA SINCRESIS

IV .1. Definición
Un punto de sincronización es, en una cadena audiovisual, un momento relevante de
encuentro síncrono entre un instante sonoro y un instante visual; un punto en el que el
efecto de síncresis (véase más adelante) está más acentuado: como un acorde musical más
afirmado y más simultáneo que los demás en una melodía.
La emergencia de los puntos de sincronización más significativos obedece en alto
grado a leyes guestálticas. Así, un punto de sincronización emerge a veces más
especialmente en una secuencia:
- como doble ruptura inesperada y síncrona en el flujo audio- visual (cortes cut-cut del
sonido y de la imagen, característicos de la lógica externa, frecuentes por ejemplo en Alien);
- como puntuación premeditada en la que vienen a coincidir, los caminos, separados
antes, del sonido y de la imagen (punto de sincronización de convergencia); - por su simple
carácter físico; por ejemplo, cuando el punto de sincronización recae en un primer plano que
crea un efecto de fortissimo visual, o cuyo sonido tiene más volumen sonoro que los demás;

- pero también por su carácter afectivo y semántico: una palabra en el diálogo, que tenga
cierta fuerza semántica y se diga de cierta manera, puede ser el lugar de un punto de
sincronización importante con la imagen.

Un punto de sincronización puede ser el encuentro de elementos de naturaleza muy


variable; por ejemplo, de un corte visual de la imagen con una palabra o con un grupo de
palabras especialmente destacadas en el comentario de la voz en off. En Lettre a Freddy
Buache, de Godard, son varios encuentros entre cortes de plano en la imagen y finales de
frase en la voz los que constituyen los p.d.s. (puntos de sincronización) principales sobre los
cuales se estructura toda la película, basándose en la palabra arco. El punto de
sincronización es, en efecto, el lugar en el que el arco audiovisual toca el suelo y se eleva de
nuevo.
Naturalmente, estos puntos de sincronización tienen siempre un sentido en relación con el
contenido de la escena y la dinámica de la película en general. Asimismo, son ellos los que
imponen a la cadena audiovisual su fraseo, como pueden imponerlo en una secuencia
musical los acordes simultáneos o las cadencias; en una palabra, los encuentros verticales
entre elementos.
Se da también el caso particular de lo que podría llamarse punto de sincronización
evitado.

IV .2. Punto de sincronización evitado

En efecto, de igual modo que en la música clásica occidental existe lo que se llama
cadencias evitadas (es decir, cadencias que, por la inflexión melódica y la progresión
armónica, se procura anticipar antes de eludirlas súbitamente), lo mismo sucede en la
cadena audiovisual, donde hay puntos de sincronización evitados, a veces más poderosos
que los que llegan a producirse. ¿Por qué? Porque se han ofrecido para la elaboración
mental del audioespectador .
El ejemplo más conocido es la escena del suicidio de un miembro de la clase alta, corrupto
y comprometido en un atraco (La jungla del asfalto, de John Huston). Se le ve encerrarse en
su despacho, abrir un cajón, coger una pistola que allí se encuentra y... lo único que llega a
nosotros es una detonación, pues el découpge nos transporta entonces fuera de la sala.
¿Por decoro? No sólo por eso...
En Je vous salue Marie, Godard siembra el principio de su película de p.d.s. evitados,
cuando nos hace oír sonidos repetidos de «pluf» y en la imagen no vemos sino la superficie
de un lago agitado por las ondas producidas por la caída, dejando fuera de campo el lugar
del impacto y el objeto que cae. Se oye, pues, la causa en el sonido, mientras que las
consecuencias se manifiestan en la imagen. Pero en la cabeza del espectador hay un punto
de sincronización tanto más poderoso cuanto que se postula pero no se realiza (se oiría y se
vería lo que cae), y el objeto en cuestión, acusmático, puede ser cualquier cosa: ¿un guijarro
lanzado distraídamente, un aerolito, o el Espíritu Santo?

IV .3. El golpe, símbolo del punto de sincronización

En la realidad, un puñetazo, aunque haga daño, no produce necesariamente ruido.


Mientras que en una audioimagen de cine o de televisión, el ruido del impacto es casi
obligatorio; en otro caso no se creería en ellos, aunque los golpes se aplicasen de ver- dad.
Estos van acompañados, pues, casi sistemáticamente, de ruido. Este encuentro puntual,
instantáneo, abrupto, de un sonido y de un impacto visible se convierte entonces en la
representación más directa e inmediata del punto de sincronización audiovisual, como
referencia, como puntuación, «punto de acolchado», diría Lacan, de la secuencia. El golpe
se convierte en el instante alrededor del cual se estructura el tiempo del relato; antes se
piensa, se anuncia, se presiente; luego se sufren sus vibraciones y se afrontan sus
resonantes efectos. Es el punto audiovisual hacia el que converge todo, a partir del cual las
cosas se difuminan. Y es también, en la audioimagen, expresión privilegiada de la
instantaneidad.
Abandonada a sí misma, en efecto, la imagen ultrabreve del golpe no se fija en la
memoria, queda como perdida, mientras que un sonido ultrabreve pero bien definido tiene el
privilegio de fijar directamente su forma y su timbre en la conciencia, en la que se repite
como eco. El sonido es el golpe de tampón que marca la imagen con el sello de la
instantaneidad (sobre esta metáfora del tampón, véase el gag del bibliotecario en Indiana
Jones y la última cruzada, de Steven Spielberg).
¿Cuál es el objeto más importante en la figuración audiovisual? El cuerpo humano.
¿Cuál puede ser el encuentro más inmediato y más breve entre dos de estos objetos? El
golpe. ¿ Y cuál es la relación audiovisual más inmediata ? La sincronización entre un choque
oído y un choque visto, o que se ha creído ver. Pues, de hecho, el golpe no se ve realmente,
lo que puede verificarse cortando el sonido de la escena. Lo que se oye, en suma, es lo que
no se ha tenido tiempo de ver.

IV .4. «P.d.s. » acentuados y elasticidad temporal

A este esquema, ya presente en el cine de imágenes reales y en especial en todas


las películas de lucha y de artes marciales, los dibujos animados japoneses difundidos por la
televisión tienen la característica, favorecida incluso por su rudimentaria animación, de
añadir algo más: un análísis del movimiento (como en las célebres fotos de Muybridge o
Marey que están en el origen del cine), el empleo del ralentí y la radical estilización del
tiempo: procedimientos que se inspiran en las ralentizaciones y paradas de imagen de las
retransmisiones deportivas, pero también extraídas directamente de las historietas
japonesas o mangas. De algún modo, en estas aventuras someramente dibujadas, el punto
de sincronización constituido por el golpe, ese punto de conexión, de vínculo entre
continuidad sonora y continuidad visual, es lo que permite que, alrededor de él, el tiempo se
dilate, se pliegue, se tense, se estire o, por el contrario, se entreabra como un tejido.
Alrededor de un p.d.s. tan característico como el golpe, la capacidad de elasticidad temporal
puede así hacerse casi infinita: durante los episodios de la serie Dragon Ball, los personajes
que pelean quedan fijados constantemente en pleno movimiento, se les detiene en pleno
cielo (pues dan saltos prodigiosos) y dialogan interminablemente, ralentizando, acelerando y
encadenando sus posturas como una sucesión de diapositivas discontinuas, antes de
lanzarse precipitadas series de pu etazos y puntapiés.
El puñetazo sonorizado es, en suma, en el lenguaje audiovisual, la ocasión, el
pretexto de lo que en música se llama un acorde, derivado de la dimensión vertical. Ya en
las durísimas escenas de ring de su Toro salvaje, con actores reales, Scorsese se servía de
los golpes sonorizados para conferir a los combates de boxeo una elasticidad temporal
máxima: ralentís, imágenes repetidas O aisladas, etc.
Lo paradójico del asunto es que esta elasticidad temporal era, sobre todo al principio, propia
del cine mudo, dado que este último no tenía que doblarse punto por punto y segundo por
segundo mediante sonido síncrono; de ahí su facilidad para dilatar el tiempo o contraerlo.
Con la llegada del sonoro, esta elasticidad empezó a ser eliminada del cine hablado. Y si
pudo reintroducirse en él en un contexto realista fue en especial con las
secuencias de acción y de combate de las películas de Peckinpah; dicho de otro modo, no
en una relación sonido/imagen deslizante y asíncrona, sino por el contrario en escenas con
fuertes puntos de sincronización, en las que los golpes, las colisiones, las explosiones crean
referencias y encuentros.

IV .5. El resorte de la sincronización: la síncresis

La síncresis (palabra que forjamos combinando «sincronismo» y «síntesis» ) es la


soldadura irresistible y espontánea que se produce entre un fenómeno sonoro y un
fenómeno visual momentáneo cuando éstos coinciden en un mismo momento,
independientemente de toda lógica racional.
La síncresis es la que hace, en el prólogo de Persona, que no dudemos ni un instante de
que los sonidos escuchados sobre las manos clavadas sean los sonidos del martillo que las
clava.
La síncresis es la que permite el doblaje, la postsincronización y el sonorizado, otorgando a
estas operaciones un amplio margen de elección. Gracias a ella, para un solo cuerpo y un
solo rostro en la pantalla, hay decenas de voces posibles o admisibles, igual que, para un
martillazo que se ve, pueden funcionar centenares de ruidos diferentes.
Como demuestran ciertas experiencias de vídeo o de cine experimental, la síncresis puede
funcionar incluso sobre el vacío, es decir, sobre imágenes y sonidos momentáneos que no
tienen, literalmente, nada que ver los unos con los otros, formando en la percepción
aglomerados monstruosos, pero irresistibles e inevitables: la sílaba «Fa» y la imagen de un
perro; el ruido de un golpe y la imagen de un triángulo. La síncresis es pavloviana.
Pero no es totalmente automática; está en función del sentido y se organiza según
leyes guestálticas y efectos de contexto. Si se siembran al azar fenómenos sonoros y
visuales puntuales y rápidos, podrá verse a algunos reunirse por síncresis y otros no. La
secuencia se «frasea» ella sola en razón de fenómenos de refuerzo, de «buena forma» que
no obedecen a una ley sencilla. A veces esta lógica es evidente: cuando se trata de un
sonido más potente que los demás, éste se alía con la imagen que le es más síncrona que
las demás que están antes o después de él. Esto puede ser también un fenómeno de
sentido o de ritmo.
Para ciertos tipos de situaciones que hacen esperar un tipo de sonidos precisos -un
personaje que camina, por ejemplo- la síncresis resulta imparable. Permite sonorizar unos
casos con cualquier cosa, en función de lo que se quiera expresar. En Mi tío, Tati sonorizó
unos pasos humanos con toda clase de cosas: pelotas de ping-pong u objetos de vidrio.
El efecto de síncresis es evidentemente susceptible de verse influido, reforzado y orientado
por los hábitos culturales. Pero al mismo tiempo tiene muy probablemente -lo demuestran
las experiencias-límite de Gary Hil- una base innata. Han podido observarse reacciones
específicas en recién nacidos ante fenómenos sonoros y visuales sincronizados.
El «modesto» fenómeno de la síncresis -modesto por humilde y cotidiano, sin relieve
particular- es el que abre las puertas del cine sonoro; gracias a él pueden crearse las
configuraciones audiovisuales más sutiles y más asombrosas. Pero hoy, cuando ver en una
pantalla una figura que se mueve al mismo tiempo que se oye un movimiento se ha
convertido en algo banal, cuesta trabajo representarse la fascinación que podían suscitar en
1927 las primeras películas de sonido e imagen síncronos, por su mismo sincronismo. Que
el sonido y la imagen evolucionaran como una pareja de bailarines perfectamente acoplados
constituía ya en sí un espectáculo. Lo atestiguan los textos escritos sobre el tema en aquella
época; y también las películas que, especialmente cuando eran musicales, exaltaban el
sincronismo como tal, mostrando a violinistas o instrumentistas de banjo, cada uno de cuyos
gestos en la imagen desencadenaba una nota distinta.
La costumbre nos ha llevado a considerar este fenómeno como «natural» y
cinematográficamente desprovisto de interés. Redescubrámoslo, sin embargo.

IV .6. Sincronismo amplio/medio/estrecho


La síncresis no funciona a base de todo o nada. Hay varias escalas, varios pasos de
sincronismo, y éstos determinan cierto estilo cinematográfico, en especial para la
sincronización labial.
Lo que los franceses, por ejemplo, adeptos de un sincronismo estricto y rígido, consideran
defecto de postsincronización en el sonido original de las películas italianas es, de hecho, un
sincronismo más amplio, tolerante, que no se inquieta por una décima de segundo de más o
de menos. Esta diferencia puede observarse, especialmente, en el nivel de la voz: mientras
los sincronismos más ajustados sujetan los sonidos al movimiento de los labios, los
sincronismos más amplios toman en consideración la totalidad del cuerpo hablante, gestual
en particular.
En líneas generales, un sincronismo amplio da un efecto me- nos naturalista, más
fácilmente poético y más relajado, y un sincronismo muy rígido tensa más fuertemente el
tejido audiovisual.
Ese tejido cuyo status escénico necesitamos ahora interrogar.
4. LA ESCENA AUDIOVISUAL

I. ¿HAY UNA ESCENA SONORA?

I.1. La imagen es el marco


¿Por qué se habla en el cine de «la imagen» en singular cuando en una película hay
millares o, si se cuentan por planos, varios centenares, y cuando estas imágenes se
transforman sin cesar? Por que, aunque hubiese millones, en la película no hay, para
contenerlas, más, que un solo marco. Lo que se designa con la palabra <imagen» en el cine
es, de hecho, no el contenido, sino el continente. Es el marco.
Este marco, que puede incluso ser negro y permanecer vacío durante unos segundos,
como ocurre en numerosas películas (Le Plaisir, de Ophuls, Laura, de Preminger), o incluso
durante unos minutos en algunas experiencias extremas (L 'Homme Atlantique, de
Marguerite Duras), sigue siendo perceptible para el espectador, presente para él, como lugar
de proyección delimitado y visible, con sus cuatro lados. Un marco que se afirma así como
un continente preexistente a las imágenes, que estaba allí antes que ellas, y podrá persistir
una vez que ellas se hayan desvanecido (siendo también la ficha técnica una manera de
reafirmarlo).
Este marco preexistente no es exactamente aquel sobre el que se inclinaron en especial
Pascal Bonitzer y Jacques Aumont, confrontándolo con el de la pintura. Lo propio del cine,
por tanto, es que no hay sino un lugar de imágenes (por oposición a las instalaciones de
vídeo, a los diaporamas, a los luz-y-sonido ya otras fórmulas de multimedia, que ofrecen
varios) y que eso, y no otra cosa, es lo que hace que pueda hablarse aquí de la imagen en
singular.
Recordemos que, en los balbuceos del cinematógrafo, se intentó difuminar la dureza de los
bordes del marco con efectos de recorte o de degradados, análogos a los practicados en
fotografía. Igualmente, se hacía variar el marco con efectos de apertura y cierre del
diafragma. Estos procedimientos, sin embargo, fueron poco a poco abandonados y, aparte
de algunas búsquedas del marco variable durante ciertas obras (Max Ophuls en Lo/a
Montes), pronto se estuvo de acuerdo sobre el principio de la imagen a marco completo, que
a partir de entonces reinó en el 99% de las películas.
Del mismo modo, las pocas experiencias de cine multipantalla (el Napo/eón de Gance, el
Woodstock de Michael Wadleigh o, en rigor, el Forty deuce de Paul Morissey), no han tenido
descendencia, reforzando así la regla del marco clásico.
1.2. No hay continente sonoro de /os sonidos
¿Que sucede, en comparación, con el sonido? Pues todo lo contrario. Para él no hay ni
marco ni continente preexistente: pueden añadirse, además, tantos sonidos Como se quiera
simultáneamente, unos a otros, hasta el infinito, sin encontrar límites. Por añadidura, estos
sonidos se sitúan en diferentes niveles de realidad: entre la música de acompañamiento
convencional, por ejemplo, que es off, y el diálogo sincronizado, que es diegético. Mientras
que el marco visual sólo se sitúa casi siempre en uno de estos niveles a la vez.
En el cine, pues, no hay continente sonoro de los sonidos ni cosa análoga, para ellos, a ese
continente visual de las imágenes que es el marco.
Ahora bien, ¿qué hacen los sonidos cuando se superponen a una imagen en el cine? Se
disponen en relación con el marco visual y su contenido, quedando unos englobados en
cuanto in y síncronos, otros merodeando en la superficie y por los bordes Como fuera de
campo; y algunos otros, además, claramente situados fuera de la diégesis, en un foso de
orquesta imaginario (la música ~ off), o sobre una especie de palco, el de las voces en off.
En pocas palabras, se distribuyen los sonidos en relación con lo que se ve en una imagen,
distribución susceptible de replantearse en todo momento apenas cambie lo que se ve.
Puede decirse así que la forma clásica del cine se define como «un lugar de imágenes y de
sonidos», siendo el sonido «lo que busca su lugar» en él (Le Son au cinéma). Y eso
contrariamente a la televisión, como se verá en otro sitio.
Si puede hablarse de una escena audiovisual, hay que afirmar entonces que esta escena
está delimitada, estructurada, por los bordes del marco visual. El sonido en el cine es lo
contenido o lo incontenido de una imagen: no hay lugar de los sonidos, ni escena sonora
preexistente ya en la banda sonora; no hay, por tanto, banda sonora.
En el marco clásico del cine monopista, sin embargo, una película tan particular como
Othon, de Jean-Marie Straub y Daniele Huillet (en la cual se interpreta una tragedia romana
de Corneille en los lugares de la acción, hoy, en exteriores), mostraba, en 1969, lo que
podría ser una escena sonora, o dicho de otro modo, un continente sonoro de los sonidos, a
condición de admitir en él que los sonidos eran las voces de los actores y su texto, y el
continente el rumor urbano en el cual se grababan voces y texto. Repetidamente, en efecto,
algunos actores de esta película hablan durante mucho tiempo fuera de campo y, sin
embargo, su voz no suena como la del fuera de campo tradicional enteramente determinado
por la imagen: está «en el mismo lugar» que la de los actores que se ven, lugar definido por
el sonido ambiente.
El mismo efecto, más evasivo, aparece en una película contemporánea de la anterior, como
La Religieuse, de Jacques Rivette, en la que la reverberación alrededor de las voces
(emanada de un sonido directo, como en Straub y Huillet) desempeña para éstas el mismo
papel de revestimiento y de homogeneización, de inscripción en un lugar, representado en
Othon por la «argamasa» del tráfico urbano. El precio a pagar, en cada ocasión, es una
relativa pérdida de inteligibilidad. De manera general, ciertos efectos de «firma espacial> del
sonido, como dice el investigador americano Rick Altman, que los ha estudiado y puesto de
relieve especialmente, son susceptibles, en ciertas condiciones, de erigir en el cine el
estrado de una escena sonora.
Todo esto ocurría, al menos, hasta que llegó el sonido Dolby, lugar de bordes difuminados,
creador de una especie de superpantalla que envuelve la pantalla: el supercampo, que
consideraremos en un capítulo ulterior. Supercampo que, sin embargo, no invalida esta
estructura que hemos descrito, aunque la haga acaso temblar sobre su base.

II. IMANTACIÓN ESPACIAL DEL SONIDO POR LA IMAGEN

¿ Cuál es la pregunta espacial que nos plantea habitualmente un sonido? No es: ¿dónde
está? (ese sonido «está» en el aire que respiramos, o bien, en rigor, como percepción, en
nuestra cabeza), sino más bien: ¿de dónde viene? El problema de la localización de un
sonido, pues, la mayoría de las veces, se limita al de la localización de su fuente.
Ahora bien, en este punto, el cine monopista clásico nos propone una experiencia sensorial
extraña, puesto que el punto del que los sonidos llegan físicamente al espectador es
muchas veces distinto del punto de la superficie de la pantalla en el cual figuran los objetos
de los que estos sonidos se supone que emanan. Y de donde, sin embargo, los oye venir.
Si se trata, por ejemplo, de un ruido de pasos y el personaje que camina atraviesa la
pantalla, los sonidos de sus pasos parecerán seguir su imagen, aunque en el espacio real
de la sala sigan saliendo del mismo altavoz fijo. Si el personaje está fuera de campo, los
pasos se percibirán como fuera del campo, un fuera más mental que físico; en todo caso, no
vendrán de la pantalla.
Mucho más: si en la sesión a la que asistimos el altavoz no está situado tras la pantalla,
sino colocado en cualquier otro punto de la sala (proyección con equipo móvil) o en un lugar
al aire libre (drive-in), o incluso si los sonidos suenan en nuestra cabeza por medio de los
auriculares (sesiones de cine en avión), estos sonidos no dejarán por ello de percibirse
como emanados de la pantalla, yeso a pesar de la evidencia de nuestros sentidos que, por
simple análisis espacial, podrían establecer que vienen, en realidad, de otro lugar.
Esto quiere decir que hay en el cine una imantación espacial del sonido por la imagen. Un
sonido percibido como fuera de campo o localizado ala derecha de la pantalla lo
es pues sobre todo mentalmente, al menos si nos encontramos ante una proyección en
monopista.
El problema con las tentativas de espacialización real ensayadas en los primeros
años del sonido multipistas -en el que el sonido está realmente situado a la izquierda de la
pantalla o en su parte izquierda-, es justamente que chocaron con esta espacialización
mental. Espacialización mental que fue para el cine hablado una bendición, pues le permitió
funcionar durante cuarenta años, si no más, sin plantear problemas. Piénsese en el
rompecabezas que se habría planteado si hubiese sido necesario hacer provenir realmente
los sonidos de los puntos en los que se mostraban sus fuentes. Habría sido necesario
instalar tras las pantallas y a su alrededor verdaderas colmenas de altavoces, sin contar los
problemas de enlaces sonoros que se habrían derivado de ello.
Con el manejo actual del Dolby se ha aprendido la lección de esos ensayos de
espacialización realista y de sus efectos de bastidor (véase más adelante), y las mezclas
multipistas que se realizan son muy a menudo compromisos entre localización mental y
localización real.
Observemos, sin embargo, que el sonido proveniente de un punto distinto a la pantalla no
es «imantable» por esta última salvo si conserva cierta fijeza espacial. Si se desplaza
constantemente entre varios altavoces, será más difícil que la imagen lo absorba y
conservará una fuerza centrífuga que le permitirá resistir ala atracción visual. Incluso en el
caso clásico del altavoz único, existe sin embargo una dimensión sonora real a la que el cine
parlante recurrió en sus inicios, y que poco después abandonó: la de la profundidad, la del
sentimiento de lejanía de la fuente, detectado por el oído a partir de indicios tales como un
espectro armónico decolorado, el carácter difuminado y menos presente de las acometidas y
de las transiciones, la mezcla entre sonido directo -en sentido acústico- y sonido reflejado, la
presencia de reverberación, etc.
A ese criterio de profundidad es al que se hacía referencia en las tentativas de perspectiva
sonora reivindicadas por varias películas (y analizadas por Rick Altman). Notemos, sin
embargo, que esta perspectiva sonora no era tanto una verdadera profundidad que situase
forzosamente la fuente del sonido detrás, en relación con el plano de la pantalla, como una
distancia interpretada por el espectador en diferentes direcciones según lo que éste veía en
la pantalla y podía deducir sobre el lugar de la fuente. Dicho de otro modo, un sonido lejano
puede interpretarse, según los momentos, como situado lejos hacia la izquierda del marco,
lejos hacia la derecha, lejos hacia delante, lejos hacia atrás, etc., siempre, pues, según una
localización que sigue siendo parcialmente mental.
A esta localización mental, dictada más por lo que se ve que por lo que se oye, o más bien
por la relación entre las dos cosas, podría oponerse, pues, la espacialización absoluta del
cine multipistas.

III. LA ACUSMÁTICA
III.1. Definición

Acusmática (una antigua palabra de origen griego recuperada por Jerónimo Peignot y
teorizada por Pierre Schaeffer) significa «que se oye sin ver la causa originaria del sonido»,
o «que se hace oír sonidos sin la visión de sus causas». La radio, el disco o el teléfono, que
transmiten los sonidos sin mostrar su emisor, son por definición medios acusmáticos.
Se ha bautizado también como «música acusmática» (en este caso por parte del
compositor Francois Bayle) a la música de concierto realizada y escuchada sobre soporte de
grabación en ausencia, voluntaria y fundadora en este caso, de las causas iniciales de los
sonidos y de su visión.
¿Cómo puede llamarse lo contrario de esta escucha? Schaeffer proponía hablar de
escucha directa, pero siendo la palabra «directo» propicia a todas las ambigüedades,
preferimos hablar aquí de escucha visualizada (es decir, acompañada de la visión de la
causa/fuente).

III.2. Visualidad / Acusmática


Un sonido puede realizar en una película, desde sus primeras apariciones dos clases de
trayectos:
-o es de entrada visualizado y, seguidamente acusmatizado,
-o es acusmático para empezar y sólo después se visualiza.
El primer caso viene a ser como asociar de entrada el sonido a una imagen precisa, que
podrá reaparecer más o menos clara en la cabeza del espectador cada vez que este sonido
sea oído de nuevo como acusmático: será un sonido encarnado, marcado por una imagen,
desmitificado, archivado (como la bocina del tranvía en Un condenado a muerte se ha
escapado, de Bresson, que analizamos en Le Son au cinéma).
El segundo caso, favorito de las películas de misterio y de atmósfera, preserva durante
mucho tiempo el secreto de la causa y de su aspecto, antes de revelarla. Mantiene una
tensión, una expectación, y constituye por tanto en sí mismo un procedimiento dramatúrgico
puro, análogo a una entrada en escena anunciada y diferida (Tartufo que
regresa, en la obra de Moliere, en el tercer acto).
Es el célebre ejemplo de M en el que el realizador nos escamotea hasta el límite el aspecto
físico del asesino, cuya voz y silbido obsesivo hace oír al principio, preservando el
mayor tiempo posible, hasta su desacusmatización, el misterio de sus rasgos (véase el
ensayo de Michel Marie en la colección «Synopsys»).
Un sonido o una voz conservados como acusmáticos crean en efecto un misterio sobre el
aspecto de su fuente y sobre la misma naturaleza, propiedades o poderes de esta fuente,
aunque sólo sea por el escaso poder narrativo del sonido en cuanto a su causa. Es
bastante corriente, en las películas, que ciertos personajes con aura maléfica, importante o
impresionante, sean casi introducidos por el sonido antes de lanzarse como pasto de la
visión, desacusmatizados.
Odile Larere ha observado, por ejemplo en Confidencias, de Visconti, que los intrusos que
trastornan el acogedor universo del héroe, el viejo profesor interpretado por Burt Lancaster,
se presentan sistemáticamente por medio del sonido antes de hacerse visibles. En la
oposición visualizado/acusmático es donde especialmente se apoya esta noción
fundamental de la escritura audiovisual que es el fuera de campo.

IV. LA CUESTIÓN DEL FUERA DE CAMPO


IV .1. Fuera de campo in y off: el tricírculo
La cuestión del sonido fuera de campo domina desde hace mucho tiempo toda una parcela
de la reflexión y de la teorización sobre el sonido en el cine y ocupa un lugar central en
nuestros dos primeros libros sobre el tema. Si aparece hoy como abusivamente privilegiada,
hasta el punto de hacer olvidar otros problemas, no por ello deja de conservar un lugar
central, aunque la evolución reciente del sonido en el cine -principalmente el sonido
multipistas y el supercampo que instaura- haya modificado los datos.
En sentido estricto, el sonido fuera de campo en el cine es el sonido acusmático en relación
con lo que se muestra en el plano, es decir, cuya fuente es invisible en un momento dado,
temporal o definitivamente. Se llama, en cambio, sonido in a aquel cuya fuente aparece en
la imagen y pertenece a la realidad que ésta evoca.
En tercer lugar, proponemos llamar específicamente sonido off a aquel cuya fuente
supuesta es, no sólo ausente de la imagen, sino también no diegética, es decir, situada en
un tiempo y un lugar ajenos a la situación directamente evocada: caso, muy extendido, de
las voces de comentario o de narración, llamadas en inglés voice-over y, por supuesto, de la
música orquestal.

IV .2. ¿Las excepciones destruyen la regla?


En Le Son au cinéma, proponíamos presentar estos tres conceptos, in/fuera de campo/ off,
como las tres zonas de un solo círculo, cada una de las cuales se comunica con las otras
dos. Este «tricírculo» es el que aquí reproducimos.
Estos últimos años, la distinción in/fuera de campo/off, que procede de un análisis sencillo,
ha sido a menudo denunciada como superada y reductora, y se ha empezado a criticar,
cada vez más directamente, en nombre de las excepciones y de los casos particulares que
parece no tomar en cuenta.
Por ejemplo, ¿dónde hay que situar los sonidos (generalmente las voces) emanados de
aparatos eléctricos situados en la acción, y que una imagen puede implicar o hacer
aparecer: aparatos telefónicos, altavoces de radio o de sonorización?

Zonas acusmáticas 1. Frontera in / f. de c.

Fuera de Campo off 2


2. Frontera in/off 3. Frontera f.
in
de c. / off
1

Zona Visualizada

¿Qué hacer, además, con el caso en que el personaje presente en la escena habla
de espaldas a nosotros, de modo que, en sentido propio, no le vemos hablar? ¿Es su voz
acusmática (fuera de campo)? ¿y qué decir de las voces llamadas «interiores» de un
personaje visible en la imagen: voz de su conciencia, voces de sus recuerdos o de las
escenas que fantasea?.
¿Y qué hay, además, del caso particular de Mira quién habla, de Amy Heckerling,
donde una voz de adulto acompaña las expresiones faciales de un bebé, y explicita lo que
pretende decir antes de tener para ello medios físicos e intelectuales? Esta voz está, en
efecto, ligada al presente de la acción, pero no es visualizable y, por tanto, no parece
afectada por estas distinciones, dado su enlace con la imagen por medio de una
sincronización vaga y amplia.
Finalmente, ¿dónde se colocarán los sonidos de ambiente global tales como los
cantos de pájaros y el ruido del viento, oídos por ejemplo en los exteriores en plena
naturaleza y que sería ridículo caracterizar como fuera de campo, bajo pretexto de que no se
«ve» a los pájaros piar o al viento soplar?
Estas excepciones pueden parecer turbadoras. Para nosotros, sin embargo, no invalidan cl
interés de una distinción in/fuera de campo/off, y de una divergencia fundamental
acusmático/visualizado.
IV .3. Un punto de vista topológico y espacial
En efecto, quienes pretextando estas excepciones, consideran estas categorías como
desprovistas de interés desechan una distinción imprescindible simplemente por la razón de
que no es absoluta. Consideran las cosas según una lógica binaria de todo o nada, mientras
que estas distinciones no tienen sentido sino desde un punto de vista geográfico, topológico
y espacial, como zonas entre las cuales existen muchos matices y regiones ambiguas...
Desde luego, necesitamos completar nuestra tipología del sonido en el cine y añadir nuevas
categorías que, por otra parte, no pretendan agotar todos los casos, pero permitan
reconocer y aislar nuevas regiones.

IV .4. El sonido ambiente (sonido-territorio)


Se llamará sonido ambiente al sonido ambiental envolvente que rodea una escena y habita
su espacio, sin que provoque la pregunta obsesiva de la localización y visualización de su
fuente: los pájaros que cantan o las campanas que repican. Puede llamárseles también
sonidos-territorio, porque sirven para marcar un lugar, un espacio particular, con su
presencia continua y extendida por todas partes.

IV .5. El sonido interno


Se llamará sonido interno al que, situado en el presente de la acción, corresponde al interior
tanto físico como mental de un personaje: ya sean sus sonidos fisiológicos de respiración,
de jadeos y de latidos del corazón (que podrían bautizarse como sonidos internos-
objetivos), o sus voces mentales, sus recuerdos, etc. (que llamaremos internos
subjetivos o internos-mentales).
La voz ya citada de Bruce Willis en Mira quién habla es un caso interesante dc voz interna
parcialmente enlazada a una exteriorización gestual. Se establece como no oída por los
demás y refiere lo que puede pensar el niño con la voz del adulto que él será, asociada al
mismo tiempo a gestos que representan el código y los medios físicos de que dispone
ahora.

IV .6. El sonido “on the air”


Llamaremos sonidos en las ondas (on the air) a los sonidos presentes en una escena, pero
supuestamente retransmitidos eléctricamente, por radio, teléfono, amplificación, etc. y que
escapan, pues, a las leyes mecánicas llamadas «naturales» de propagación del sonido.
Cada vez más empleados, estos sonidos de televisión, de autorradio o de interfono
adquieren en las películas en las que se utilizan un status particular autónomo. Se dan a oír
al espectador, sea en pleno marco, claros y nítidos, como si el altavoz de la película
estuviese directamente conectado a la radio, al teléfono o al tocadiscos evocado en la
acción; sea, en otros momentos, localizados en el decorado por rasgos acústicos que
producen un efecto de distanciamiento, de reverberación y de coloración por los altavoces,
etc., con una infinidad de degradados entre estos dos extremos. Estos sonidos on the air,
situados en principio en el tiempo real de la escena, atraviesan, pues, libremente, las
barreras espaciales.
Caso particular de sonido on the air es el de la música retransmitida o grabada. El sonido de
la música on the air atravesará más o menos las zonas in/off/fuera de campo, y se situará
aproximadamente, para el espectador, como música de pantalla o música de foso según, en
efecto, el peso particular otorgado por la realización (mezcla, ajuste de nivel, filtrado,
condiciones de grabación de la música): ya sea en la fuente inicial del sonido (la realidad de
los instrumentos que suenan o de las voces que cantan), o ya sea, por el contrario, en su
fuente terminal (el altavoz presente en la acción que se deja sentir materialmente por medio
de filtrajes, ruidos parásitos, resonancias, etc.). Las road-movies, tales como Rainman, de
Barry Levinson, juegan sin cesar con esta oscilación.
Pero ya en 1975, American Graffiti, de George Lucas, con ayuda del especialista en sonido
Walter Murch, exploraba todo el abanico de las posibilidades entre estos dos casos
extremos, a partir de una situación muy sencilla: los personajes se desplazan en coche en un
círculo geográfico limitado y sintonizan la misma emisora radiofónica de rock.
El mismo problema se encuentra en los diálogos presentados en la diégesis en forma de
grabación: ¿nos remiten al momento de su producción o al momento de su escucha?
Imaginemos una escena cinematográfica en la que un hombre escucha una entrevista en el
magnetófono: o bien la calidad técnica directa, inmediata, presente, otorgada al sonido
escuchado intenta devolvernos ala circunstancia de la toma de sonido; o bien el «color»
particular del material sobre el que se oye el sonido y la acústica del lugar de audición se
subrayan intensamente trasladándonos al momento en que se oye la grabación. En una
secuencia de El reportero, en la que Jack Nicholson escucha la grabación de una
conversación que ha mantenido con un conocido, Antonioni nos hace bascular de una
posición a otra e introduce así un flash-back. La entrevista escuchada por Nicholson se
actualiza e introduce la escena en la que tuvo lugar.

Fuera de Campo
e

a t

i
off
INTERNO

in

Nuestro tricírculo se complica, pero también se enriquece continuando la ilustración de las


diferentes dimensiones y oposiciones puestas en juego por las excepciones mismas que
introduce en él:
-la oposición acusmático/visualizado.
-la oposición objetivo/subjetivo o real/imaginado
-la diferencia pasado/presente/futuro.
Lo importante es pensar todo esto como zonas enlazadas las unas con las otras, cosa que
expresaría mejor aún un modelo topológico menos tosco y desplegado en más dimensiones.
Eso nos lleva también a completar nuestra reflexión sobre la cuestión de la fuente, que
condiciona tales distinciones: por una parte, recordando que la noción de fuente del sonido
debe relativizarse y desmultiplicarse, por ser la fuente del sonido, como hemos dicho, un
fenómeno con varias fases; y, por otra parte, que la realización, la concepción misma de la
película y su guión, son susceptibles de poner en mayor o menor grado el acento en una de
estas fases.

IV. 7. Lugar del sonido y lugar de la fuente


Sonido y fuente del sonido son, en efecto, desde el punto de vista espacial, dos
fenómenos distintos. En una película puede ponerse el acento en uno o en el otro, y la
cuestión del campo y del fuera de campo se plantea entonces de manera diferente según lo
que se designa al espectador como situado en la imagen o fuera de ella: ¿el sonido o su
causa? Dado que estas dos cuestiones, muy distintas, se confunden casi siempre en una
sola, pueden producirse malentendidos. Pero, ¿no está también inscrita esta confusión en el
corazón de nuestra experiencia misma, como un turbador foco de problemas?
Por ejemplo, el ruido de un tacón que golpea el suelo en una habitación muy reverberante
tiene una fuente muy puntual, pero en cuanto sonido, como aglomerado de
diversos reflejos sobre diferentes paredes, puede llenar tanto volumen como contenga la
habitación en la que resuena.
Mientras que la fuente de un sonido puede, en efecto, localizarse aunque no siempre lo sea,
el sonido en sí mismo es por definición un fenómeno que tiende a extenderse, como un gas,
a todo el espacio disponible.
Ahora bien, en el caso de los sonidos ambientales, que son muchas veces producto de una
multiplicidad de fuentes puntuales (arroyo, cantos de pájaros), lo importante es el espacio
habituado y delimitado por el sonido, más que su origen multipuntual. El mismo caso nos
presentan las películas que ponen en escena un concierto: por el desglose y la realización
técnica del sonido y de la imagen, puede ponerse el acento, sea sobre la fuente material y
aislada del sonido, el instrumento, el cantante; sea sobre el sonido mismo como poblador del
lugar de escucha, separado entonces de su fuente, y considerado independientemente de
ella.
De manera general, cuanto más reverbera el sonido, más expresivo resulta con respecto al
lugar que lo contiene. Cuanto más «seco», más susceptible es de remitir a los límites
materiales de su fuente, representando la voz aquí un caso particular, puesto que, por el
contrario, cuando se la priva de toda reverberación y se oye muy de cerca, es cuando,
cinematográficamente, es capaz de ser la voz que el espectador interioriza como suya, y la
que, al mismo tiempo, toma totalmente posesión del espacio diegético: completamente
interna e invadiendo a la vez todo el universo. Es lo que hemos llamado la Voz- Yo, objeto
de un capítulo particular de La Voix au cinéma. La voz debe este status particular, por
supuesto, a que es por excelencia el sonido que nos llena proviniendo de nosotros mismos.
Pero en este juego del campo y del fuera de campo, la música de acompañamiento
representa también una forma de excepción, confirmadora de la regla general.

V. LA EXCEPCIÓN DE LA MÚSICA
V .1. Música de foso y música de pantalla
Llamaremos música de foso a la que acompaña a la imagen desde una posición off, fuera
del lugar y del tiempo de la acción. Este término hace referencia al foso de la orquesta de la
ópera clásica.
Llamaremos música de pantalla, por el contrario, a la que emana de una fuente situada
directa o indirectamente en el lugar y el tiempo de la acción, aunque esta fuente sea una
radio o un instrumentista fuera de campo.
Todo esto, que hemos desarrollado en los capítulos de Le Son au cinéma dedicados a la
música, corresponde a una distinción observada desde hace mucho tiempo, pero bautizada
hasta hoy con nombres diversos: algunos hablan de no diegética para la primera y
de diegética para la segunda; de música «explicativa» para la primera y «actual» para la
segunda; de música subjetiva y objetiva, etc. Nosotros preferimos, por nuestra parte, recurrir
a denominaciones que, sin prejuzgar la posición subjetiva de esta música en cuanto a la
situación mostrada, consideran simplemente el lugar desde donde se emite. Por otra parte,
una música inscrita en la acción (como en Abschied, de Siodmak; el pianista vecino de los
protagonistas cuya música acompaña y puntúa sus estados emocionales) puede, en efecto,
ser tan «explicativa» como una música en off. La ventana indiscreta, de Hitchcock, es su
demostración permanente.
A partir de ahí, los casos mixtos o ambiguos son fácilmente localizables y delimitados: -caso
en que la música de pantalla encaja en una música de foso de orquestación más amplia
(alguien toca el piano en la acción y la orquesta de foso lo acompaña), como en las
comedias musicales o en Un rey para cuatro reinas, de Raoul Walsh;
-caso en que la música empieza como música de pantalla y prosigue como música de foso,
alejándose de la acción o, inversamente, cuando, por el contrario, una música de foso que
suena con amplitud queda reabsorbida en una música de pantalla emitida por un
instrumento localizado: por ejemplo, en las películas antiguas en el momento de transición
entre los títulos de crédito y el principio de la acción.
Sin contar los ejemplos, numerosos en las películas situadas en la época actual, en
los que la música, situada on the air, circula libremente entre las dos.

V .2. La música como plataforma espacio-temporal


Toda música que interviene en una película (pero más fácilmente las músicas de foso) es
susceptible de funcionar en ella como una plataforma espacio-temporal; esto quiere decir
que la posición particular de la música es la de no estar sujeta a barreras de tiempo y de
espacio, contrariamente a los demás elementos visuales y sonoros, que deben situarse en
relación con la realidad diegética y con una noción de tiempo lineal y cronológico.
La música en el cine es al mismo tiempo el pasaporte por excelencia, capaz de comunicar
instantáneamente con los demás elementos de la acción concreta (por ejemplo, acompañar
desde el off a un personaje que habla en el in) y de bascular instantáneamente del foso a la
pantalla, sin replantear por ello la realidad diegética o llenarla de irrealidad, como haría una
voz en off que interviniese en la acción. Ningún otro elemento sonoro de la película puede
disputarle este privilegio. Fuera de tiempo y fuera de espacio, la música comunica con todos
los tiempos y todos los espacios de la película, pero los deja existir separada y
distintamente.
Por ejemplo, cuando los personajes están desplazándose, la música puede ayudarles a
franquear instantáneamente grandes distancias y largos períodos de tiempo. Es un caso
de figura muy frecuente desde el ¡Aleluya! de Vidor (1930), donde se entona una canción
cuando los personajes están aún a la orilla de un río; a la segunda estrofa ya están en la
barcaza, ya la tercera han alcanzado la otra orilla. Se habrá reconocido aquí la fórmula del
clip, que sirviéndose de una base musical que reina sobre el conjunto -y con la única
limitación de sembrar aquí y allá unos puntos de sincronización con la intención de casar la
imagen y la música de manera flexible-, permite a la imagen pasearse a su gusto por el
tiempo y el espacio. En este caso límite ya no hay, por decirlo así, escena audiovisual
anclada en un tiempo y un espacio reales y coherentes.
En Vidor, la música daba a los personajes botas de siete leguas, y servía así para
contraer espacio y tiempo. Inversamente también permite dilatarlos, y en las escenas de
tensión, por ejemplo, es la que hace aceptar la convención de una duración cristalizada,
eternizada por el montaje.
La música es, en resumen, un flexibilizador del espacio y del tiempo. En los largos duelos
de las películas de Sergio Leone, en los que los personajes no hacen sino permanecer
frente a frente, la música de Ennio Morricone resulta esencial para hacer admitir tal
inmovilización del tiempo. Es cierto que Leone intentó igualmente, en especial al principio de
Hasta que llegó su hora, crear esta dilatación del tiempo prescindiendo de música y
sirviéndose únicamente, en la banda sonora, del periódico chirrido de una veleta o de una
noria. Sólo que aquí, la situación del guión -una larga espera inactiva- se eligió para justificar
la inmovilidad de los personajes. No es menos cierto que el realizador ya había inaugurado
esta fórmula con referencia a la ópera, y utilizando abiertamente la presencia de la música.

VI. FUERA DE CAMPO RELATIVO y FUERA DE CAMPO ABSOLUTO


VI.l. El fuera de campo sólo es una relación
Cuando se dice sonido fuera de campo, esta expresión misma induce a creer que se trata
de una cualidad intrínseca del sonido mismo. Sin embargo, basta con cerrar los ojos ante la
película o con apartar la mirada de la pantalla, para experimentar una evidencia: sin la
visión, los sonidos fuera de campo reaparecen tan presentes, tan definidos -a veces incluso
más- en el plano acústico, como los sonidos in. Nada permite ya, en todo caso, distinguirlos.
Acusmatizado y reducido aun conjunto de sonidos que constituyen ya, en este caso,
una banda sonora digna de este nombre, la película cambia totalmente de aspecto. Es el
ejemplo, antes citado de ciertas escenas de Las vacaciones de Monsieur Hulot que,
escuchadas sin imagen, revelan otro rostro.
El fuera de campo del sonido, en el caso del cine monopista es, pues, enteramente
producto de la visión combinada con la audición. No es sino una relación entre lo que se ve
y lo que se oye, y no existe sino en esta relación; exige, pues, la presencia simultánea de los
dos elementos.
Sin la imagen, nada es ya el sonido de numerosas películas prestigiosas de antaño. Las
voces mágicas que nos fascinan, en especial, se encogen del todo o se vuelven prosaicas.
La voz de la madre de Norman en Psicosis, la voz del doctor Mabuse en El testamento del
doctor Mabuse, o la de Marguerite Duras en L 'Homme Atlantique ya no son gran cosa
cuando dejan de referirse a una pantalla en la que encuentran el vacío de su presencia.

VI.2. Efecto de bastidores y fuera de campo-cubo de basura (en el cine multipistas)


Característico de la espacialización real y de los primeros ensayos de sonido multipistas en
el cine, y más bien evitado después, el efecto de bastidores se produce cuando un sonido
ligado a una causa susceptible de aparecer en el campo o que acaba de salir de él,
permanece aún en uno de los altavoces laterales situados fuera de la pantalla: por ejemplo
los pasos de un personaje que se acerca o se aleja, el motor de un coche que acaba de
pasar fuera de campo o va a aparecer, o la voz de uno de los protagonistas. Tenemos
entonces el sentimiento, turbador en relación con nuestros hábitos de espectador, de que se
nos quiere hacer creer que la escena audiovisual se prolonga realmente por la sala, fuera
del marco de la pantalla, y que, por encima del letrero «salida de emergencia» o de la puerta
de los aseos, están los personajes o los vehículos que preparan su entrada o culminan su
salida.
A veces, este efecto de bastidores no es imputable a la realización de la película y a su
mezcla, sino que se crea por completo mediante la disparatada disposición de los altavoces
en la sala, una disposición de la que en nada son responsables los autores de la película.
Otras veces, sí se debe a una tentativa de los ingenieros de sonido o del realizador
para explotar los efectos del fuera de campo absoluto, posibles ya por el multipistas. Es
evidente que este procedimiento ha sido cada vez más evitado después, es decir, que los
efectos sonoros de entrada y de salida del campo se efectúan ahora de manera más
discreta o rápida, o se ahogan oportunamente en un relleno (numerosos ruidos de ambiente,
música) que intenta no revelar el bastidor sonoro.
Ciertamente el efecto del bastidor creaba una contrariedad al denunciar las convenciones
del découpage cinematográfico y plantear embarazosos problemas de encadenamiento.
Pero quizá se habría admitido si se hubiese sistematizado, provocando un reajuste (parcial,
no nos engañemos) de estas convenciones, igual que el supercampo del
cine multipistas ha sabido establecer un compromiso con el découpage tradicional. Quizás
haya sido, pues, un error renunciar a él tan pronto.

El fuera de campo cubo de basura es un caso particular de fuera de campo pasivo (véase
más adelante) ligado al sonido multipistas, y que se crea cuando los altavoces situados
fuera de los límites del campo cinematográfico recogen, por decirlo así, ruidos (de silbidos,
de caída, de explosión, de estruendo) producto de una catástrofe o de una caída que tiene
lugar en el centro de la imagen. Las películas de acción utilizan a menudo este efecto,
especie de concreción sonora fugitiva, a veces muy poética y algunas veces voluntariamente
burlesca, de los objetos representados, que empiezan a existir casi físicamente para el
espectador de cine en el momento mismo en que mueren. Llena de tales efectos está una
película de acción moderna como La jungla de cristal de John McTiernan, festival del vidrio
roto y la deflagración, localizado en un rascacielos en el que un hombre combate contra
unos terroristas.

VI.3. Fuera de campo activo y fuera de campo pasivo


Se llamará fuera de campo activo a aquel en el cual el sonido acusmático plantee preguntas
(¿Qué es? ¿Qué sucede?) que reclamen respuesta en el campo e inciten a la mirada para
que vea en él. El sonido crea entonces una atención y una curiosidad que empujan la
película hacia adelante y mantienen la anticipación del espectador (<Me gustaría mucho ver
la cara que pone cuando el otro le dice eso»). El fuera de campo activo está esencialmente
constituido por sonidos cuya fuente es puntual o, dicho de otro modo, corresponde a objetos
cuya visión puede ser localizada. Es muy utilizado en el montaje sonidoI imagen tradicional,
introduciendo los objetos y los personajes por medio del sonido y mostrándolos luego
(encabalgamiento). Algunas películas como Psicosis se basan enteramente en la curiosidad
creada por el fuera de campo activo: ¿cómo es esa madre a la que oímos?
Se llamará fuera de campo pasivo, por el contrario, a aquel en el cual el sonido cree un
ambiente que envuelva la imagen y la estabilice, sin suscitar en modo alguno el deseo de ir
a mirar a otra parte o de anticipar la visión de su fuente y de cambiar , pues, de punto de
vista. El fuera de campo pasivo no contribuye a la dinámica del montaje y del découpage,
sino por oposición, puesto que sitúa para el oído un lugar estable (el conjunto de un rumor
urbano), lo que, de repente, permite al découpage volar libremente por el decorado,
multiplicar los planos cercanos, etc., sin que el espectador se quede espacialmente
desamparado. Este fuera de campo pasivo está esencialmente constituido por sonidos
territorio y por elementos de decorado sonoro.
El sonido multipistas (Dolby) ha traído consigo de modo natural el desarrollo de un fuera de
campo pasivo en detrimento del fuera de campo activo. ¿Por qué? Acaso porque este último
implica sobre todo fuentes puntuales (un cuerpo humano, un objeto) y con el multipistas, la
localización real y no ya mental de los sonidos fuera de campo plantea un verdadero
problema: el del efecto de bastidores demasiado realista, evocado más arriba. Si quiere
evitarse este último, no está muy indicado densificar durante mucho tiempo un sonido fuera
de campo, sugiriendo un enigma y pidiendo su desacusmatización, pues, muy lógicamente,
este sonido debería estar situado en fuera de campo de la pantalla. La entrada de Roy Batty,
el malo, el adversario, en Blade Runner, de Ridley Scott, se habría plasmado por medio del
sonido -de su voz o de sus pasos- si la película se hubiera realizado en mono. De hecho, en
esta película, el personaje está casi siempre presente en la imagen al mismo tiempo que su
voz. Se está como en un presente perpetuo.
En el cine clásico monopista, por el contrario, es en efecto desde el centro mismo de la
imagen, en el seno de esta imagen misma, donde el sonido fuera de campo reclama su
resolución y puede así ser llamado activo.
Pero ya La ventana indiscreta incluía muchos fuera de campo pasivos: rumores urbanos,
del patio vecinal y de la radio, que, muy reverberados, evocaban al oído el marco global de
la escena sin provocar preguntas ni reclamar la visualización de sus fuentes (véase el
análisis de esta película en el capítulo de La toile trouée titulado « Une petite pointe de
lumiere rouge»).

VII. LA EXTENSIÓN
VII.l. Modulación del campo y del fuera de campo visual por el sonido Recordemos, en
el caso de Bergman (en Persona), los planos fijos, análogos a una fotografía, del parque, de
un muro de hospital y de un montón de nieve sucia. Sobre estos planos oíamos campanas
de iglesia sin sonido humano alguno, lo que creaba la impresión de una pequeña ciudad
dormida.
Eliminemos el sonido que Bergman ha utilizado y reemplacémoslo por cualquier otra cosa:
por ejemplo, por el rumor del mar. Vemos el mismo montón de nieve, las mismas verjas,
pero el fuera de campo adquiere un olor a yodo: es marino. Quitemos el sonido marino y
pongamos una multitud de voces que se cruzan y ruidos de pasos: el fuera de campo se
convierte en una calle animada.
Nada, tampoco, nos impide empezar, sobre estas imágenes por un sonido muy cercano
(pasos en la nieve y nada más), e introducir luego otros sonidos, indicios de un espacio más
amplio (sirenas de automóviles), y así sucesivamente: alguien se acerca y pasa, la sirena se
aleja, unas campanas a lo lejos empiezan a repicar. Sobre la misma imagen fija prolongada
puede así dilatarse hasta el infinito el fuera de campo imaginado y
suscitado por el sonido. Pero también, en sentido inverso, estrecharlo; pero, en ese caso,
conservaremos una memoria del amplio espacio evocado al principio.
El sonido es, pues, susceptible de crear un fuera de campo de extensión variable. VII.2.
Las variaciones de la extensión
Se llamará extensión del ambiente sonoro al espacio concreto más o menos amplio y
abierto que los sonidos evocan y hacen sentir alrededor del campo, y también en el interior
de ese campo, alrededor de los personajes.
Podría hablarse de extensión nula cuando el universo sonoro se limita a los ruidos que oye
un personaje dado y sólo él, y no implica a ningún otro (una voz que él oye en sí mismo). En
el otro extremo, de extensión amplia, cuando, por ejemplo, para una escena que transcurre
en una habitación, oímos no sólo los ruidos de la habitación (incluidos los que se producen
fuera de campo), sino también los sonidos del rellano, la circulación de la calle próxima, una
sirena lejana, etc.
La extensión ambiental no tiene límites reales, sino los del universo, a poco que se
encuentren sonidos capaces de dilatar hasta el máximo la percepción del espacio que
envuelve la acción. Naturalmente, lo interesante en el cine, no son sólo las extensiones fijas,
que permanecen iguales de un extremo a otro de una escena, incluso de una película, sino
también los contrastes y variaciones de extensión de una escena a otra, o en el interior de
una misma secuencia.
A la variación de extensión es a lo que, sin emplear esta palabra, alude el sound designer
Walter Murch cuando evoca su práctica de montador sonoro en películas como La
conversación o Apoca/ypse now, de Coppola.
El sonido Dolby Stereo, al multiplicar las posibilidades de acumular los sonidos o de
desplegarlos en espacios concéntricos amplios, favorece el juego de la extensión. Hace ya
treinta y cinco años, una película como La ventana indiscreta -donde todo se ve desde (y en)
un piso de Greenwich Village, en Nueva York, que da a un patio de vecinos- utilizaba
magistralmente variaciones de extensión para, según los momentos, hacer resonar la
extensión de la ciudad o del puerto alrededor de este patio del que no se sale o, por el
contrario, suprimiendo los ruidos de la calle, concentrar al espectador en el piso mismo,
convertido entonces, para los dúos amorosos de Grace Kelly y Jimmy Stewart, en un
escenario teatral separado de su marco ambiental. Muy al final de la película, la extensión se
encoge y se concentra, como un proyector de teatro que se limitara a una «persecución»,
sobre un punto único: los pasos del asesino en la escalera que Stewart oye acercase...
Parecido efecto de encogimiento de la extensión espacial se utiliza en la escena final, ya
citada, de Hijos de un dios menor, donde, a medida que los dos amantes separados se
reúnen al amparo de la noche, se percibe cada vez menos, y luego nada en absoluto, el
ambiente de un baile que continúa a unos pasos de allí.
Naturalmente, las variaciones de extensión, que pueden también producirse por medio de
contrastes súbitos de una escena a otra, se ejecutan generalmente de manera que no sean
percibidas por el espectador como una manipulación técnica. Y, cuando se hacen
abiertamente, casi siempre quedan absorbidos en un efecto emocional, contrariamente a los
movimientos visuales de reencuadre, cuya designación como procedimientos técnicos y
codificados es ampliamente tolerada.
Algunas películas adoptan, en toda su longitud, desde el punto de vista de la extensión, una
posición previa fija. En M, de Lang, la extensión es en general muy limitada: sólo oímos lo
que dicen los personajes presentes en el decorado, nunca prácticamente ruidos ambientales
exteriores al marco de la escena. Inversamente, algunas películas modernas utilizan
siempre una extensión amplia: ruidos del bosque y rumores de la ciudad no cesan de
recordar, alrededor de los personajes y del marco, la presencia de un amplio contexto
(Blade Runner).
Lo más delicado, en las películas en Dolby Stereo, es, por otra parte, conseguir concentrar
la expresión en un sonido, un punto en el espacio, lo que obliga a silenciar varios altavoces.
El efecto final de La ventana indiscreta sería más difícil con el sonido multipistas. La
variación de extensión que llega hasta el silencio absoluto se utiliza naturalmente para
efectos de sonido subjetivo: la supresión de los sonidos ambientales sirve entonces para
evocar la idea de que se entra en la subjetividad de un personaje absorbido por su historia
personal. Por ejemplo, en la escena del infarto del protagonista de Que empiece el
espectáculo, de Bob Fosse.

VIII. EL PUNTO DE ESCUCHA


VIII.I. Punto de escucha en sentido espacial y en sentido subjetivo La noción de punto
de escucha es eminentemente delicada y ambigua. Ha sido ya abordada por varios
investigadores (en especial por Francois Jost), y nosotros mismos le hemos dedicado, en Le
Son au cinéma, un capítulo que, a decir verdad, planteaba más preguntas que respuestas
ofrecía. Resultaría útil volver aquí a ello con mayor precisión. Observemos ante todo que el
concepto de punto de escucha ha sido calcado sobre el de punto de vista. Ahora bien, punto
de vista en el cine significa dos cosas diferentes, enlazadas a menudo pero no siempre:
-desde dónde veo, yo espectador (desde qué punto del espacio se considera la escena,
desde arriba, desde abajo, desde el techo, desde el interior de un frigorífico, etc.). Es la
acepción estrictamente espacial de la palabra;
-qué personaje, en la acción, se supone que ve lo que yo veo; es la acepción subjetiva. En
la mayor parte de los planos de una película corriente, el «punto de vista» de la cámara no
es de un personaje particular. Lo que no quiere decir que sea necesariamente arbitrario:
puede obedecer a ciertas limitaciones y leyes específicas. Por ejemplo, la cámara nunca se
colocará en un lugar en el que no podría encontrarse el ojo humano de un personaje normal
(en el techo, en un armario, etc.); o bien no filma sino según ciertos ejes privilegiados que
excluyen los demás (en Después del ensayo, de Bergman, que sucede en un escenario
teatral, exclusión del cuarto lado que es el de la sala, de las filas de butacas). La noción de
punto de vista, en este primer sentido espacial, descansa en la posibilidad de deducir con
mayor o menor precisión el lugar de un «ojo» a partir de la composición de la imagen y de su
perspectiva.
Recordemos también que el punto de vista, en sentido subjetivo, puede ser un puro efecto
de montaje. Si yo encadeno el plano de un personaje asomado a su ventana con la visión de
una escena exterior, hay muchas probabilidades de que el segundo sea percibido, sin más
indicaciones, como el punto de vista del personaje, a condición, sin embargo, de que las
informaciones del plano B no contradigan las del plano A.
Examinemos ahora, por comparación, la noción de punto de escucha. También puede tener
dos sentidos que están ligados pero no necesariamente:
-un sentido espacial: ¿desde dónde oigo? , ¿desde qué punto del espacio representado en
la pantalla o en el sonido?
-un sentido subjetivo: ¿qué personaje, en un momento dado de la acción, se supone que
oye lo que yo mismo oigo?

VIII.2. Dificultades de definir criterios acústicos para un punto de escucha En el primer


sentido, se observará ante todo que la naturaleza específica de lo auditivo no permite en la
mayor parte de los casos, frente a un sonido o a un conjunto de sonidos, deducir un lugar de
escucha espacialmente privilegiado, y eso en razón de la naturaleza omnidireccional del
sonido (que se propaga en diversas direcciones) y de la escucha (que capta los sonidos
circularmente), así como de diferentes fenómenos de reflexión.
Imaginemos un violinista que está tocando en el centro de un gran salón en forma de
rotonda, y supongamos a los espectadores agrupados en diferentes lugares junto a la pared.
La mayor parte de los oyentes, situados en puntos diametralmente opuestos del salón, oirán
grosso modo el mismo sonido, salvo mínimas diferencias debidas a la reverberación.
Diferencias ligadas a la acústica del lugar, pero que no por ello permitirán localizar puntos de
escucha particulares. En cambio, cualquier visión del violinista situará inmediatamente el eje
desde el que se le mira.
Muchas veces, pues, no puede hablarse de punto de escucha en el sentido de posición
precisa en el espacio, sino más bien de lugar de escucha, o incluso área de escucha.

VIII.3. Es la imagen la que crea el punto de escucha (subjetivo)


En el segundo sentido, subjetivo, dado a la expresión «punto de escucha», se encuentra el
mismo fenómeno que para la vista: es, desde luego, la representación visual en primer plano
de un personaje la que, al asociarse simultáneamente (y no, como para la imagen,
sucesivamente) a la audición de un sonido, sitúa este sonido como oído por el
personaje mostrado.
El ejemplo clásico de contrapunto audiovisual que cita el manifiesto de Eisenstein (la
imagen de un hombre que acecha, y el ruido de botas de un personaje fuera de campo)
deriva de este sentido, hoy banalizado. La cuestión no es, pues, en este tipo de casos, qué
características de distancia, de color y de reverberación en el nivel del sonido nos permiten
inferir que ese sonido es oído por una persona; pues es la imagen la que crea íntegramente
el punto de escucha, mereciendo en este caso el nombre de punto.
Un caso particular de punto de escucha es el definido por los sonidos de reducido alcance,
supuestamente de tal naturaleza que hay que estar muy cerca para oírlos. A partir de la
audición de estos sonidos, o de indicios sonoros de proximidad (respiración en la voz), el
espectador puede ya situar el punto de escucha como el supuesto de un personaje que él ve
en escena, a condición, desde luego, de que la imagen, el découpage visual y la
interpretación del actor, le confirmen las suposiciones que pueda formular a este propósito.
El ejemplo más frecuente es el de las conversaciones telefónicas: cuando el espectador oye
la voz del interlocutor de manera próxima y clara, con su filtraje característico, puede situar
el punto de escucha como el del personaje que recibe la llamada. A menos que se esté en la
situación on the air, que desconecta el sonido de su punto de origen o de su punto de
llegada, y convierte pues, en no pertinente la noción de punto de escucha.

VIII.4. Voz de frente y voz de espaldas


En ciertos casos particulares, es posible sin embargo atribuir una dirección a la escucha.
Los agudos de un sonido, en efecto se propagan de manera más direccional que los
graves y, cuando alguien nos habla volviéndonos la espalda, percibimos menos los
armónicos agudos de su voz, la cual nos parece menos presente. Puede entonces hablarse
de una diferencia audible entre la voz de frente y la voz de espaldas.
En algunas películas con sonido directo, oímos variaciones de color de la voz, debidas a
que, más o menos fugitivamente, el actor ha vuelto la espalda al micro, que está, por lo
general, por encima de su cabeza. Estas fluctuaciones de color contribuyen a dar al sonido
directo su vida propia, y funcionan también como «indicios materializadores» (véase el
capítulo 5).
Observemos no obstante que:
-nada impide simular o reconstruir tales variaciones en la post sincronización, por medio de
desplazamientos del actor o del micro (por ejemplo: en la de El hombre herido, de Patrice
Chéreau);
-inversamente, puede disponerse el micro en el rodaje para seguir constantemente al actor
«de frente», en especial cuando se trata de un micro de corbata que transporta el actor
mismo, cerca de su garganta.
Si el cine emplea mayoritariamente, desde luego, la voz de frente, con todos los agudos
posibles que le permite la técnica, es con una finalidad evidente: estos agudos son
esenciales para la inteligibilidad.
Sin embargo, cuando el espectador oye una voz de espaldas, no deduce de ella
automáticamente el punto de escucha del plano: por una parte, porque en la mayor parte de
los casos este efecto es fugitivo y no es lo suficientemente estable y pronunciado; y, por otra
parte, porque el punto de escucha, para el sonido, no está asociado a la representación de
un micro.

VIII.5. Escotomización del micro-oído


Esta importante cuestión de la escotomización del papel del micro no es por otra parte
válida sólo para la voz, sino también, más generalmente, para todos los sonidos de una
película; y no sólo para el cine, sino igualmente para la mayor parte de las creaciones
radiofónicas, musicales y audiovisuales, realizadas a partir de la grabación sonora.
Mientras que la cámara, en efecto, aunque excluida del campo visual, no por ello deja de ser
un personaje activo de las películas, personaje del que es consciente el espectador, el micro;
por el contrato, debe quedar excluido, no sólo del campo visual y sonoro (ruidos de micro,
etc.), sino también de la representación mental del espectador. Queda excluido de ella,
desde luego, porque en las películas, incluidas las rodadas con sonido directo, todo se ha
hecho con este objeto. Y eso siempre con esa óptica naturalista señalada más arriba, que
sigue ligada al sonido, cuando la óptica de la imagen se ha liberado de ella desde hace
mucho tiempo, a pesar de las teorías predominantes en los años 60 y 70 sobre la
«transparencia», preconizada o discutida, de la escenificación. Pero la concepción
naturalista del sonido, por su parte, sigue impregnando de tal modo la experiencia y el
discurso que ha pasado desapercibida para los que la situaron y criticaron en el nivel de la
imagen.
Podrían verse las razones de tal diferencia de status entre imagen y sonido en diferentes
problemas técnicos, estéticos, fisiológicos e ideológicos, preguntándose cuáles sirven de
coartada o de cobertura a los otros. Alegando, por ejemplo, el hecho de que las orejas no
están dispuestas en sentido direccional como los ojos. O bien la posibilidad técnica,
desconocida por la imagen pero utilizada por el sonido desde los principios del sonoro, de
«mezclar> grabaciones realizadas simultáneamente por varios micros colocados en puntos
diferentes: ¿a qué se reduce entonces el micro-oído?
Sin embargo, quizá la cuestión no resida ahí. Pues, después de todo, tampoco la cámara
tiene mucho que ver con nuestros ojos, aunque sólo sea por su condición monocular, y eso
no le ha impedido convertirse en la representante de la mirada. El problema se sitúa, pues,
en las mentalidades: arrancar la reflexión sobre el sonido -y su explotación tanto técnica
como estética- de su rutina naturalista es cosa de varios decenios. Una búsqueda y una
preocupación que están en el corazón de toda nuestra tarea.
5. LO REAL Y LO EXPRESADO

I. LA ILUSIÓN UNITARIA
Esta concepción, muy extendida, evocada en el capítulo precedente y que puede llamarse
naturalista, postula así desde el inicio una armonía «natural» entre los sonidos y las
imágenes, le resulta extraño no encontrarla en el cine y atribuye esto a una falsificación
técnica en la realización. Podría pensarse que, limitándose a captar tal cual los sonidos del
rodaje, sin modificar nada en ellos, podría conseguirse esta unidad.
Ese, desde luego, es pocas veces el caso en la realidad: incluso allí donde se trata de un
supuesto sonido directo, los sonidos registrados en el rodaje se enriquecen casi siempre a
posteriori con otros sonidos, de ruidos o de ambiente, que se les añaden. Pero también hay
ruidos que se eliminan en el rodaje por la colocación y la direccionalidad del micro, las
precauciones de insonorización, etc. En resumen, como si fuera un alimento industrial, el
sonido del rodaje se ve la mayoría de las veces, privado de ciertas sustancias o enriquecido
con otras. Un inmenso grito ecológico se eleva entonces: dadnos un sonido completo y sin
aditivos!
Algunos, muy pocos, han intentado hacerlo, como los Straub en Trop tôt trop tard, que ya
hemos descrito en Le Son au cinéma. Y el efecto es totalmente insólito. ¿Por falta de
costumbre del espectador? Ciertamente. Pero también porque la realidad es una cosa y otra
su transposición en dos dimensiones audiovisuales (una imagen plana y un sonido
generalmente monopista), la cual es una reducción sensorial radical; lo raro sería que
funcionase sin más. Se tiende, en efecto, a olvidar que, por refinado que sea el cuadro
audiovisual que el cine nos ofrece de lo real, sigue siendo en relación a éste último, en el
estricto plano de la reproducción, lo que una representación dibujada del ser humano con
unos círculos para la cabeza y unos palotes para las extremidades es a un dibujo anatómico
de Alberto Durero. No hay realmente razón alguna para que las relaciones audiovisuales así
reproducidas aparezcan iguales que en la realidad, y en especial, para que los sonidos
originales parezcan verdaderos.
Puede incluso considerarse que todas las convenciones de reproducción, de ruidos, etc. ,
que vamos a examinar más tarde, son acondicionadores que toman en cuenta la
transposición audiovisual para intentar conservar en el marco de ésta cierta apariencia de
realismo y de verdad.
Lo cual no quiere decir que sea inútil perseguir una más perfecta simulación. Muy al
contrario, deben tomarse en serio experiencias como las de Douglas Trumbull con su
Showscan, que no 1. sólo emplea una película de muy alta definición -el antiguo y excelente
70 mm-, sino que además mejora considerablemente la gama-tiempo en la imagen (60

También podría gustarte