¿Cuál es el trato con esta tontería "Laurel Vs. Yanny"? Le pedimos a un experto que explique

Getty
  • A principios de esta semana, un clip de audio de un robot que parecía decir que "Yanny" o "Laurel" se volvió viral, con personas divididas en partes iguales entre los dos campos
  • Para explicar esta división, le pedimos a un profesor de la Universidad de Nueva York Langone que nos explicara cómo dos personas podían escuchar dos cosas totalmente diferentes.
  • La respuesta está en cómo tu cerebro interpreta varias frecuencias.

    Fue el clip de cuatro segundos escuchado alrededor del mundo.

    El martes, la bloguera Cloe Feldman tuiteó un clip de audio junto con una pregunta: "¡¿Qué escuchas ?! Yanny o Laurel".

    ¡¿Qué escuchas?! Yanny o Laurel pic.twitter.com/jvHhCbMc8I

    - Cloe Feldman (@CloeCouture) 15 de mayo de 2018

    Al igual que lo hizo el infame vestido en 2015, que era claramente blanco y dorado, por cierto, el clip de audio de Yanny vs. Laurel desgarró Internet. Algunas personas escucharon muy claramente "Yanny", mientras que otras saben por cierto Que la voz robótica decía "Laurel".

    Entonces, ¿cuál es la explicación de la división? Para averiguarlo, nos comunicamos con el Dr. Mario Svirsky, Profesor de Ciencias de la Audición en el Departamento de Otorrinolaringología y Profesor de Neurociencia y Fisiología en NYU Langone Health.

    Resulta que ambas interpretaciones del clip de audio son válidas: solo depende de a qué componentes del sonido se adhiere el cerebro.

    Para explicar el enigma Yanny / Laurel, Svirsky señala la ilusión visual conocida como el jarrón de Rubin: "¿Es un jarrón o son dos caras que se miran?" pregunta por email.

    La respuesta: "en realidad, no es ninguna de esas cosas. Es un montón de puntos en una pantalla", dice.

    Wikimedia Commons

    El jarrón de Rubin es una imagen bidimensional y no un objeto real, por lo que tu cerebro intenta generar "explicaciones" para lo que estás viendo. "La imagen es ambigua, por lo que ambas explicaciones (jarrón y caras) son posibles", explica Svirksy. "Lo mismo puede suceder con los sonidos del habla".

    Introduzca: Yanny y Laurel.

    Svirksy capturó el primer sonido del discurso en el clip divisivo, la parte en la que los oyentes escuchan un sonido "Y" o "L". La imagen de abajo es un "espectro de frecuencias", que muestra la energía en diferentes frecuencias para esa pequeña pieza de audio:

    DR. MARIO SVIRSKY

    Mire esos dos picos grandes en las marcas de 250 Hz y 2,800 Hz. Según Svirsky, si tu cerebro ignora las cosas entre y solamente se enfoca en esos dos picos, es posible que escuche una "Y" para Yanny.

    "Por otro lado, si su cerebro prefiere asignar más peso a otros detalles del espectro, como el pico a 800 Hz o los dos valles, conocidos como 'antiresonancias', entre 1500 Hz y 2500 Hz, entonces tiene más sentido. Para interpretar este sonido como una 'L' ", explica.

    ¿La conclusión?

    Al igual que el jarrón de Rubin, el clip de audio de Yanny / Laurel de cuatro segundos es ambiguo. En un esfuerzo por asignar una "explicación" a lo que estás escuchando, tu cerebro se aferra a ciertos picos o valles de su propia elección, y eso determina si escuchas a Yanny o Laurel.

    "Nuestros cerebros son computadoras increíbles que pueden dar sentido a la ambigüedad utilizando algoritmos que son mucho más poderosos que los mejores sistemas de reconocimiento de voz automático", dice Svirsky. "El problema es que con una pequeña parte del discurso, esos algoritmos pueden desviarte, ya que probablemente estén optimizados para la comunicación del mundo real".

    "Nuestros cerebros son computadoras increíbles".

    En su opinión, "si nos proporcionaran una oración completa en lugar de una sola palabra, la ambigüedad podría desaparecer", porque podríamos hacer estimaciones más precisas de lo que estamos escuchando.

    Desafortunadamente, todo lo que tenemos son cuatro segundos. Entonces acordemos que es Laurel, ¿vale?