Resonancias vol. 25, n° 49, julio-noviembre 2021, pp. 159-163.
DOI: https://doi.org/10.7764/res.2021.49.9
Muy lejos de las voces metálicas de los antiguos sintetizadores robots que lograban extrañarnos de la cotidianidad para ponernos de un salto en el futuro, hoy la investigación sobre voz artificial se juega en la capacidad de reproducir lo más fielmente una voz humana real. Que la máquina hable y gesticule es el punto de inflexión que conduce a la consumación del humanismo artificial: la voz se constituye así en una nueva prueba de Turing.
Por medio de la voz artificial se busca generar entornos confiables, ambientes familiares y eficientes que colaboran en la maximización de una experiencia inmersiva con la máquina. Hacernos sentir su naturalidad, su cercanía, su necesidad. Las aplicaciones de voz de nuestros laptops, los pequeños vigilantes de nuestro hogar como Alexa, o los garantes de seguridad como las voces de los ascensores o las extensiones de esta confiabilidad en las voces automatizadas de los servicios al cliente. El hecho, es que la voz artificial hace mucho invadió nuestra vida cotidiana, sustituyendo en algunos casos funciones laborales antes hechas por personas, bajo la lógica de mayor eficiencia menor costo.
Desde este lugar el objetivo de la voz sintética es la búsqueda de su humanización, pero al igual que las teorías de la Inteligencia Artificial (IA), el modelo se convertirá pronto en la copia inestable e imperfecta. Quiero decir, que ya antes de la artificialización de la voz constatamos un proceso de estandarización que busca homogenizar las cualidades sensoriales y vocales que le otorgan su singularidad: el modo en que hablan los reporteros de televisión, que persiguen una suerte de tono neutro, sin afectividad definida, pero que termina por igualar las alturas, los ritmos y las texturas vocales; o el caso de los locutores de tiendas de retail que cantan ofertas, pero parece que fuese siempre el mismo locutor, en fin, las voces de comerciales de banco o financieras en que los modos de fijar la atención, de producir persuasión están fuertemente homogenizados. Por otro lado, la globalización de los productos televisivos se enfoca en borrar las diferencias de acento regionales y nacionales, e incluso en alisar las diferencias de clase en los doblajes o suplantar las voces originales por doblajes. Cada vez más, las voces se de-sitúan de su territorialidad en pos de una idea de neutralidad cultural. El punto, entonces, es que los fenómenos de maquinización de la voz vienen a cumplir ese ideario de la IA en la que la copia se constituye en el modelo y, por tanto, exacerba su simulacro de humanidad: intenta ser más humana que lo humano.
Pensemos en la voz. Qué es lo que juega en ella. Quizá lo primero que asociamos fuertemente a la voz es la producción de una identidad y con ello digo también a la identidad de una especie. Según Mladen Dolar (2007), la voz puede entenderse desde tres niveles: como vehículo del significado, como fuente de admiración estética y finalmente como el “objeto” voz. En esta última, Dolar cita a Lacan, para quien la voz es un “objeto a”.
La voz es como la mirada, el síntoma del otro o de la otredad, aquello con lo que nunca puedo coincidir, pero en lo que me reconozco desde un extrañamiento, es decir, la escisión fundante del sujeto. Así como nunca puedo mirar mi mirada o mirar mirándome, no puedo escuchar mi voz como suena para el otro (de ahí que me extrañe escucharme desde una grabación). La voz no coincide plenamente con mi cuerpo –dice Zizek–, siempre hay un misterioso desajuste, como si mi voz no fuese mía, como si la experiencia de la voz fuese el lugar de otro. Reconocemos al otro desde la voz porque esta nos remite siempre a la exterioridad desde donde nos constituimos nosotros mismos, y por ello, reconocemos al otro reconociéndonos a nosotros mismos a la vez. De ahí que nos perturbe tanto la voz del diferente, porque no logramos reconocernos en ella, nos abisma de nuestra propia integridad supuesta. No es raro que nos empeñemos en hacer familiar la voz. Que busquemos la compañía de la voz familiar. No es raro que hagamos mofa de la voz del distinto, que sea objeto de chistes, no es raro que una de las formas de clasismo y de racismo más cotidiana sea el desprecio por la voz del otro.
La voz es un excedente, un suplemento, pero también un resto resonante: el fantasma del trauma. De hecho, es habitual en el teatro que la imagen de la voz interior se corporice en la figura del fantasma. Ejemplo paradigmático es el fantasma del padre en Hamlet, la voz interior que nunca logra internalizarse plenamente y se presencia como una exterioridad, incluso en la necesidad de tener que escenificar y escuchar por la voz de los actores la muerte del propio padre. La voz es pues, el fantasma del padre y, al mismo tiempo, el dónde se asienta la posibilidad transgresora de la ley; cabe pensar en este sentido la fascinación por la voz del castrato (Quignard 2005).
La voz es el recuerdo de las otras voces, es el lazo que me remite constantemente al afuera. El modo en que hemos sido moldeados desde fuera, nuestro inconsciente es la resonancia de voces antiguas, pero nunca nuestras. La voz nos saca, la voz se proyecta, en la voz experimentamos el éxtasis sobre el que se funda paradójicamente nuestra seguridad y estabilidad:
“La voz adquiere una autonomía espectral, –escribe Zizeck– nunca termina de pertenecer del todo al cuerpo que vemos, de modo que incluso cuando vemos hablar a una persona en vivo, siempre hay un mínimo de ventrilocuismo en juego: es como si la propia voz del hablante lo vaciara y de algún modo hablara ‘por sí misma’, a través de él. En otras palabras, su relación es mediada por una imposibilidad: en última instancia, oímos cosas porque no podemos ver todo” (Dolar 2007, 12).
Todo eso, y sin embargo…
Lo que resulta sorprendente constatar es que fue el uso de aparatos tecnológicos la primera forma en la que la voz cobró total independencia del cuerpo: el uso del teléfono y posteriormente de la radio (voces acusmáticas llenas de aura dirá Dolar). Pero los aparatos no fueron la causa de la separación, sino más bien amplificaron el síntoma, haciendo patente esta situación de desajuste permanente entre el cuerpo y su voz. Tal vez, de ahí la seducción de la radio, pero también su siniestro misterio, que obligó prontamente a volver a colocar la vista como el sentido de la verdad, de la integridad y la forma.
En este sentido, la maquinización de la voz no resulta una experiencia del todo asombrosa. Lo que nos extraña es experimentar la escisión, el darnos cuenta de que esa voz no tiene un cuerpo, no pertenece a un cuerpo y no es asociable a uno. Las voces artificiales trabajan así desde una lógica proyectiva del deseo. Nos invitan a imaginarles sus cuerpos, y por ello reafirman los sesgos de identidad cultural y de género que esperamos. Las voces femeninas asociadas a la cercanía y al cuidado, las voces masculinas al trabajo. Por otro lado, la maquinización de la voz cumple el deseo de la homogeneización de la que antes hablábamos.
El problema entonces no es la voz. El problema es la escucha.
Para Barthes (1986), en el momento que entiendo el inconsciente como lenguaje, el inconsciente se entiende como algo para ser escuchado. Por ello, al mismo tiempo, el inconsciente es una voz. Voz entonces es inseparable de la escucha. No hay diferencia entre escucha-voz, la escucha habla tanto como la voz escucha (es escucha del otro). La voz-escucha no tiene que ver con el sentido sino con la significancia, es decir con ese nivel obtuso del signo que funciona como un suplemento, como un excedente, lo que Barthes denomina significancia (1986, 252), es decir, ni sentido, ni significado, la voz es ese exceso incontrolable que se resiste a la articulación del signo, y sin embargo, material.
La voz es la presencia del otro, a partir de lo cual me constituyo yo. La voz siempre remite al otro, a la otredad en la escucha. Por ello, aun cuando la voz de la conciencia está en mí, es vivida como un afuera. Voz es el cuerpo de la voz, el cuerpo en voz, un modo en que sucede el cuerpo, el modo tal vez en que sucede el cuerpo para otro en la escucha.[1]
Escuchar es un verbo transitivo, pero no en un sentido gramatical, sino en el sentido de que obliga a la actividad tanto del que escucha como de lo escuchado. No hay binariedad sujeto-objeto. La escucha es también una forma de tacto y contacto, de flujo recíproco continuo, en el que el cuerpo sucede como una interface de entrelazamiento, una membrana de conexión, antes que un sistema cerrado. Por lo mismo la escucha implica hacer presente la espacialidad, requiere de materialidad concreta para poder suceder y obliga a la cercanía. A diferencia del poder de la mirada, que administra la distancia y desde ahí declara la objetualidad del mundo y su posibilidad de ser cognoscible, la escucha en la cercanía obligada mantiene siempre una dimensión de indiscernibilidad, de misterio, no genera certidumbres, sino que provoca relaciones, la necesidad de que el otro complete el sentido. Esto en relación con la voz, cuando ella es acusmática, pero en relación con el sonido de la voz siempre; como dice Barthes, la voz es ante todo una significancia, algo diferente al lenguaje. Este carácter táctil de la escucha la hace de alguna forma algo más cercana a la afectividad, pone en crisis la frontera entre lo íntimo y lo público.
La pregunta no es qué es una voz artificial, sino qué hace con nosotros, qué modifica, qué efecto tiene en nuestra experiencia de la escucha. Y en esta misma línea, qué tipo de presencia constituye, cómo altera nuestros modos automatizados de presencia. Y esto no es solo una cuestión de la voz sintética, sino en general del uso de cyborgs y cuerpos virtuales, en el teatro y la performance.
A qué nos invita, entonces, una voz artificial: a pensar la alteridad en tanto tal. La experiencia ante la voz autómata o artificial, nos provoca un efecto de suspensión temporal del sentido, de abismo transitorio, en el que no logramos identificar ni clasificar el percepto, haciéndonos patente la pregunta por la alteridad, por la condición indomable de la alteridad y manteniendo abierta la pregunta y asumiendo el “no-entender” como una condición del pensamiento y por cierto del arte.
Un caso de este extrañamiento se encuentra en Uncanny Valley, puesta en escena del colectivo alemán Rimini Protokoll.[2] En ella un robot construido a imagen y semejanza del escritor Thomas Melle da un monólogo acerca de su condición de bipolaridad, de la idea de humanidad y su relación con las máquinas. Aunque en este caso la voz que utiliza el robot es la del propio escritor, el efecto cuando vemos la obra es que ella también es sintética. La pregunta de Uncanny Valley apunta al centro de esta cuestión pues cuestiona cuál es el lugar de extrañeza, la frontera a partir de la cual señalamos la humanidad o artificialidad de un cuerpo o de una voz. Al fin, concluimos que la humanidad o la maquinalidad no es un atributo esencial, es más bien una cuestión de percepción y expectativas del deseo (incluso bajo la idea prometeica de la perfección).
Un efecto de alteridad y de extrañamiento semejante es el que produce la abstracción vocal de Sequenza III de Luciano Berio.[3] En este caso, el recurso es la desarticulación de la lengua que permite hacer aparecer la voz en su puro acontecer material, incluso fisiológico. Liberada de su función dominante, más que un cuerpo, lo que se expone aquí es el aparato fónico como tal, como la mediación artefactual que conforma nuestra percepción de los sonidos llamados humanos. La cuerda vocal en su condición de instrumento vibratorio, antes que de sentido o de representación. Es paradójica que esta exposición del aparato genere un efecto de animalización. De alguna manera la escucha de la obra nos hace retornar a una experiencia pre-humana de la voz: al gemido, al gruñido o al grito original, en los que, sin embargo, resuena fantasmal un resto humano. Así entonces, entendemos que la máquina, el animal y lo humano son devenires que permanentemente estamos cruzando. No hay en este sentido una perspectiva post humana, lo que hay es una perspectiva posthumanista,[4] que no es lo mismo.
Barthes, Roland. 1986. “El grano de la voz”. En Lo obvio y lo obtuso. Imágenes, gestos, voces, 262-271. Barcelona: Paidós.
Dolar, Mladen. 2007. Una voz y nada más. Buenos Aires: Manantial.
Domínguez Ruiz, Ana Lidia M. 2019. “El oído: un sentido, múltiples escuchas. Presentación del dosier Modos de escucha”. El Oído Pensante 7 (2). Recuperado a partir de http://revistascientificas.filo.uba.ar/index.php/oidopensante/article/view/7562
García Castilla, José David. 2019. “Conocimientos en resonancia: hacia una epistemología de la escucha”. El Oído Pensante 7 (2). Recuperado a partir de http://revistascientificas.filo.uba.ar/index.php/oidopensante/article/view/7564
Heidegger, Martin. 1987. De camino al habla. Madrid: El Serbal.
Lacan, Jacques. 2006. El seminario. Libro 10: “La angustia”. Buenos Aires: Paidós.
Miller, Jacques-Alain. 1997. “Jacques Lacan y la voz”. En La voz, Colección orientación lacaniana-Serie testimonios y conferencias, número 2, 9-22. Buenos Aires: EOL.
Nancy, Jean-Luc. 2007. A la escucha. Buenos Aires: Amorrortu.
Quignard, Pascal. 2005. La lección de música. Madrid: Funambulista.
Zizek, Slavoj. 1997. “La voz en la diferencia sexual”. En La voz, Colección orientación lacaniana-Serie testimonios y conferencias, número 2, 47-50. Buenos Aires: EOL.
[1] La cuestión de la voz y el otro, de la voz como constitutiva del sujeto encuentra en los escritos de Lacan (2006) un punto de despegue. Si bien, nunca sistematizó una teoría específica de la voz, realiza varias menciones sobre ella a lo largo de sus cursos, entre los cuales destaca especialmente lo desarrollado en el Seminario 10. Sobre la angustia. Lacan ha sido el punto de partida de reflexiones posteriores de investigadores como Jacques-Alain Miller (1997) o Slavoj Zizek (1997) o el nombrado Mladen Dolar (2007). A partir de este vínculo entre voz y otredad es que se articula también una reflexión sobre la escucha. Sobre el punto existe un amplio debate que va desde discusiones ontológicas abiertas principalmente por Heidegger (1987) y que hallan una resonancia en el emblemático texto de Nancy (2007). En ambos la escucha es propuesta como un modo del pensamiento y de estar en el mundo. De esta y otras reflexiones deriva, a su vez, una interesante línea de investigación que busca instalar a la Escucha como una alternativa epistémica al paradigma oculocentrista que ha dominado el modo del conocimiento en Occidente. En esta línea son relevantes las investigaciones antropológicas sobre la noción de paisaje sonoro. Un ejemplo de aquellas discusiones las encontramos en el reciente dossier de la Revista El Oído Pensante “Modos de Escucha” (2019) dirigido por Ana Lidia Domínguez y, especialmente, el artículo de Jorge David García (2019).
[2] Uncanny Valley - English documentation, Rimini Protokoll https://vimeo.com/339074946 Acceso: 13 de agosto de 2020.
[3] Berio, Luciano. Sequenza III https://www.youtube.com/watch?v=DGovCafPQAE Acceso: 13 de agosto de 2020.
[4] El cuestionamiento de las llamadas tendencias posthumanas no es a la condición de especie, como si pudiéramos negar completamente nuestro condicionamiento biológico. Es en contra de una perspectiva de ese concepto de humanidad, que es el humanismo moderno, que establece determinadas definiciones y lugares de lo humano en relación al mundo (por de pronto, se supone superior). Esto es el humanismo, que es diferente de la humanidad.
Barría Jara, Mauricio. 2021. "Voces máquina o voces otras. Notas para abrir una reflexión". Resonancias 25 (49): 159-163.