domingo, 6 de octubre de 2024

9. Medición de características

 Tabla de contenidos

1. Software de medición / Respuesta al Impulso

1.1. Room EQ Wizard - REW

1.2. Plug-in Aurora para Audacity o Adobe Audition

1.3. Uso de SMAART

2. Medición de Intensidad Sonora - Sonómetro

2.1. Ejercicios sobre sonómetro

1. Software de medición / Respuesta al Impulso

La medición de los parámetros acústicos típicos (TR60, EDT, C80, y otros) puede ser realizada a partir de tener disponible la respuesta al impulso de un recinto. Varios programas calculan los parámetros (incluso por banda de frecuencia) si cargamos el audio registrado como respuesta a un impulso en una sala.

La respuesta al impulso mediante una señal impulsiva (un golpe, un petardo, la explosión de un globo) puede obtenerse con cualquier tipo de registro de audio. Simplemente se genera el impulso y se lo graba. 

Existen programas que permiten obtener la respuesta al impulso mediante otras técnicas que permiten mejorar la relación señal ruido del registro obtenido, las más típicas son el barrido logarítmico (propuesto por Farina hace unos 20 años) y la técnica MLS (esa especie de ruido digital propuesto por Schoeder hace unos 50 años).

Entre los programas que generan un barrido logarítmico podemos mencionar un software gratuito muy utilizado (REW, por Room EQ Wizard, que significa algo así como "asistente de ecualización de recintos"), y un plug-in gratuito de nombre Aurora (desarrollado por Farina) que puede agregarse al soft Audacity, que también es gratuito.


Bases de datos de respuestas al impulso

En Internet pueden hallarse muchas bases de datos de respuestas al impulso de salas comunes, salas de concierto, o de otros tipos variados.

Dejamos aquí algunos links para explorar. Con la descripción de los programas que siguen es posible analizar la información de cada una de ellas.

Aachen Impulse Response Database

Esta base de datos contiene respuestas al impulso que fueron medidas en una gran variedad de recintos diferentes.

Otras alternativas con bases de datos:

Room Impulse Response Data Set - University of London

Speech@FIT Reverb Database - BRNO University of Technology

Links a datasets de la IEEE Signal Processing Society

Open Speech and Language Resources  (Este último tiene variedad de recursos, entre los cuales hay grabaciones de palabras en español y en particular con acento argentino: SLR61 Argentinian Spanish speech data set.)

El siguiente parece caído en este momento: http://www.eng.biu.ac.il/gannot/downloads/

También es posible encontrar bases de datos con impulsos para otros usos como audio 3D en el que se colectan respuestas al impulso recibidas por ambos oídos (se conocen como hrtf o funciones de transferencia de la cabeza)

Spatial Audio for Domestic Interactive Entertainment

CIPIC hrtf database - Center for Image Processing and Integrated Computing at the University of California

LISTEN HRTF DATABASE - IRCAM

O también respuestas al impulso de grabaciones realizadas de amplificadores de guitarra, por ejemplo.

Free Guitar Cabinet Impulse Responses

1.1. Room EQ Wizard - REW

Ya hicimos algún tipo de ejemplo con el REW en clases anteriores porque tiene una parte que realiza cálculos para estimar los modos en recintos rectangulares y con ellos la curva de respuesta en frecuencia. Lo que comentaremos ahora es el modo en que se utiliza su parte de medición. Lo ideal para hacer la medición es contar con alguna placa de audio (más allá de la que viene incluida en las computadoras) y un micrófono de medición. Sin embargo, pueden obtenerse resultados aproximados sin tener ninguna de estas cosas. Un micrófono de medición de bajo costo es el Behringer ECM8000, pero a falta de este cualquier micrófono puede servir. Los micrófonos de medición tienen una respuesta extremadamente plana. No son recomendables para grabar música ya que la respuesta espectral no plana de muchos micrófonos de estudio puede ser considerada una característica deseable en cuanto el color que le agregan al sonido. Una placa externa permitirá obtener una mejor grabación, con menor ruido. Pero en realidad hay otra característica más interesante. El REW permite hacer una calibración de la placa, colocando un cable directo entre su salida y su entrada. La computadora envía una señal a la salida, que en vez de ir hacia un parlante se conecta directamente a la entrada de micrófono de la propia placa. De esta manera el REW puede medir la "respuesta al impulso" de la propia placa de audio y compensar sus variaciones en frecuencia. Si no se dispone de placa de audio, puede usarse la propia de la computadora, pero ya no se tendrá la opción de compensar sus propias variaciones.

https://www.roomeqwizard.com/

REW permite además realizar una calibración externa de los niveles que registra. Para esto sugiere utilizar un sonómetro o medidor de nivel sonoro (llamado en forma menos profesional "decibelímetro"). Si no se dispone de un sonómetro, puede reemplazarse utilizando alguna aplicación de celular que mida (o "estime", en realidad) el nivel SPL.

En el video que está a continuación se muestran los pasos. Para calibrar el nivel hay que seleccionar SPL Measurement. El programa emite un nivel de ruido constante y nos pide que coloquemos un sonómetro junto al micrófono y vayamos cambiando el valor de un número de compensación interna hasta lograr que la medición del REW se parezca razonablemente a la del sonómetro. Lo de razonablemente es por dos motivos. Por una parte, porque es muy difícil lograr que se mantenga una medición con un valor constante y preciso. Pero por otra parte, no es demasiado crítico tener un nivel exacto para obtener ninguno de los parámetros. El propio REW, sugiere que se intente igualar los valores pero indica que una diferencia de 6 dB hacia arriba o abajo sería aceptable.

La calibración de la placa requiere de un cable adicional para tomar la salida de la placa y reingresarla en la misma placa en forma directa. El siguiente video muestra el proceso. Si no se puede calibrar la placa, simplemente puede saltearse este paso (a sabiendas de que se puede agregar un error de medición debido a alinealidades de la placa, pero que no serían para nada comparables con lo que se obtendrá de la propia sala).


>


Para medir la respuesta al impulso REW tiene opciones de generación de barrido logarítmico (duración, rango de frecuencias). En general la duración del barrido tiene que ser mayor que la respuesta al impulso que se pretende obtener. Si se va a medir un recinto pequeño donde uno puede estimar que su RT60 no será mayor que 1 segundo, este tiempo podrá alcanzar. Si, en cambio, se mide el impulso en un templo o cualquier lugar muy reverberante, el tiempo del barrido puede llegar a ser mucho mayor (10 segundos o más). Frente a la duda se puede hacer de mayor duración, ya que no empeora los resultados sino solamente la cantidad de datos a procesar y el tiempo total de cálculo. Cuando se mide la respuesta en frecuencia de un amplificador, por ejemplo, el tiempo del barrido puede ser menor que un segundo. Ese barrido logarítmico es emitido al aire y registrado por el micrófono. La señal grabada se procesa (haciendo la convolución de lo grabado con un barrido logarítmico en sentido inverso que genera matemáticamente el propio REW). Con este proceso reconstruye la respuesta al impulso. Analizando la respuesta al impulso obtiene los valores y gráficos correspondientes a varios parámetros. El video siguiente muestra este proceso.


El siguiente video puede aportar información interesante (está en inglés, pero los subtítulos con traducción automática pueden servir

Ejemplos de resultados obtenidos mediante el análisis de respuestas al impulso de REW

La siguiente es la función de transferencia de una habitación en mi casa (filtrada a 1/6 de octava). El filtro se elige en el menú superior en Graph.

Si se selecciona Filtered IR, se podrán ver los parámetros (EDT, C80, pero además T20 y T30 que son semejantes al ITD pero considerando caídas de 20 y 30 dB y ajustándolas luego para hacerlas comparables con el T60

Si se selecciona RT60 se obtendrá el tiempo de reverberación por banda de frecuencia


1.2. Plug-in Aurora para Audacity o Adobe Audition

Farina desarrolló plug-ins para Audacity y para Adobe Audition que permiten obtener las señales de barrido logarítmico para ser emitidas al aire y registrar la respuesta al barrido. Luego este registro se convoluciona con un barrido en sentido inverso (en el plugin de Farina esto no es automático, sino que el usuario tiene que pedir que se convolucionen ambas señales). Por último, con la respuesta al impulso obtenida se calculan los parámetros. El siguiente video muestra el proceso.

http://pcfarina.eng.unipr.it/Aurora_XP/index.htm


El hecho de que Aurora no calcule en forma automática la convolución, sino que sea un proceso aparte, es en realidad una desventaja para quien no está muy familiarizado con estos temas, pero agrega versatilidad ya que uno puede convolucionar otras cosas. Esto es, en el REW no es posible convolucionar una respuesta al impulso con un audio para obtener una auralización dentro del mismo software, pero con el plug-in de Farina esto si es posible.


Ejemplos de resultados obtenidos mediante el análisis de respuestas al impulso de Aurora


Tanto Audacity con Aurora, como REW permiten obtener mediciones de respuestas al impulso que uno puede haber obtenido previamente o conseguirlas en Internet. Existen bases de datos de respuestas al impulso. Por ejemplo, las de mediciones en distintos puntos de una sala o las de mediciones binaurales de sonido 3D. Estas últimas consisten en pares de respuestas en frecuencia para cada oído, considerando las distintas ubicaciones posibles de una fuente sonora en todo el entorno de los oídos de una persona o de un sistema de grabación binaural (maniquí con micrófonos calibrados). Vimos ya que la transformada de la respuesta al impulso se denomina función de transferencia. Esto viene al caso porque estas bases de datos de sonidos 3D suelen ser mencionadas como bases de datos de HRTF (Head Related Transfer Function) por función de transferencia relacionada con la cabeza.


1.3. Uso de SMAART

SMAART es un software que mide la respuesta al impulso utilizando doble canal. La computadora genera una señal de referencia (ruido rosa por ejemplo) que se envía a un canal de entrada de la placa de audio. Esta señal se copia en ambas salidas L y R. Una de las salidas va efectivamente a un parlante y la señal recorre la sala hasta un micrófono que se conecta a una entrada de la placa. La otra salida se reconecta a un segundo canal de entrada disponible en la placa y esta información también regresa dicha información a la computadora. De esta manera el software dispone del ruido sin modificar (atravesando todas las etapas del audio de la placa) y de una versión modificada por el ambiente. Del trabajo matemático entre estas dos señales el software calcula la función de transferencia (y/o la respuesta al impulso). Se usa normalmente en alineación de sistemas (para ajustes de fase). Si bien no podríamos asegurar la situación actual, en versiones previas muestra la función de transferencia pero no lo entrega como archivo de audio al usuario, de modo que es para obtener información pero no para convolucionar con ninguna otra cosa, ni permite analizar esa respuesta al impulso con otros programas.

El siguiente video es ilustrativo al respecto, pero tiene además una consideración interesante.  Quien está realizando el video pretende comparar las respuestas de dos micrófonos de medición. Lo hace siguiendo la siguiente lógica. Ambos micrófonos se ofrecen como razonablemente planos en respuesta en frecuencia. Se dispone de la respuesta en frecuencia informada por el fabricante del parlante utilizado. Si ambos midieran plano y el fabricante de parlantes tuviera mediciones precisas, entonces al medir la función de transferencia del sistema que está montando se obtendría la misma curva en ambos micrófonos y además debería ser muy semejante a la que corresponde al parlante. Sin embargo, el autor del video olvida una consideración importante. Se olvida de las contribuciones de la sala. Es altamente probable que la sala sea mucho más variable que las respuestas de los micrófonos, por lo cual eso altera la medición. Uno podría preguntarse cuánto. En el video podrán ver que encuentra diferencias importantes en 14 kHz. El tema es que una frecuencia de 14 kHz se corresponde con una longitud de onda de unos 2,5 cm, y por lo tanto una variación en la posición de las cápsulas del micrófono si bien es muy pequeña puede ser comparable con esto. Quizás el autor haya hecho pruebas intercambiando los micrófonos, pero al no tener compensación de la respuesta de la sala la conclusión general es difícil de mantener. De todas maneras ver el video resulta muy instructivo.



2. Medición de Intensidad Sonora - Sonómetro

El medidor de intensidad sonora se utiliza para medir el nivel SPL de sonidos. Consta de un micrófono calibrado, una red de compensación (filtros A, B, C ó D) y un display de lectura de los valores en decibeles.

La figura siguiente muestra las redes de compensación A y C (tambien llamadas filtros de pesada o filtros ponderados, como traducciones posibles del término "weigthing network")


Comenzaremos indicando las funciones del sonómetro TES 1350A :

RANGE:

Lo - Permite medir niveles entre 35 dB y 100 dB (si el nivel sonoro supera los 100 dB aparece la indicación OVER en el display).

Hi - Permite medir niveles entre 65 y 130 dB (si el nivel sonoro sale de este rango por arriba o por debajo se enciende la indicación OVER).

NOTA: Hay sonómetros que pueden autoescalarse automáticamente. Este modelo en particular (de bajo costo) requiere la elección manual de la escala de medición.

RESPONSE:

S   - (Slow) - Indica respuesta lenta del sonómetro

F   - (Fast)  - Indica respuesta rápida del sonómetro

Max Hold  - Indica que el sonómetro se quedará fijo en el valor máximo que capte. Si se desea volver a medir un nuevo máximo sin cambiar de posición la llave se presiona RESET.

Este parámetro indica cuánto tiempo (breve, pero tiempo al fin) analiza el sonómentro antes de presentar un resultado en pantalla. Si tuviese un batido, por ejemplo y utilizo Fast, el valor numérico estará cambiando permanentemente. Al colocar Slow promedio durante un poco más de tiempo y permite ver un valor menos cambiante en pantalla.

FUNCT:

A   - Utiliza el filtro de compensación normalizado tipo A.

C   - Utiliza el filtro de compensación normalizado tipo C.

Cal 94 dB - Se utiliza para calibrar la lectura del sonómetro (sirve para corregir la parte electrónica del instrumento pero no calibra el micrófono). En esta posición el micrófono queda desconectado y se conecta una tensión fija equivalente a la que entregaría el micrófono al recibir 94 dB. Cualquier variación provocada en el circuito (por cambios de temperatura, por ejemplo) puede corregirse de esta forma utilizando un destornillador.

NOTA: No se trata de una calibración real en el sentido acústico, sino una calibración interna. Debido a variaciones (por ejemplo de la temperatura) los niveles de tensión internos del sonómetro podrían cambiar. Esta calibración permite hacer este ajuste interno. Hacemos la aclaración porque una verdadera calibración requiere utilizar un dispositivo especial (calibrador) que se coloca en el tubo del micrófono y que asegura entregar un nivel de presión sonora asegurado.

UTILIZACIÓN DEL SONOMETRO

Al utilizar este sonómetro con sonidos almacenados en computadora (para poder repetir las mediciones con exactitud), con las llaves en la posición Max Hold, Hi y con el filtro A, se obtuvieron los siguientes valores:

Notar que el sonido del golpe si bien tiene mayor amplitud que los otros no logra que el sonómetro indique mayor nivel. Esto se debe a su corta duración.


¿Depende el nivel sonoro de la duración del sonido?

Separemos esta pregunta en dos partes: la primera referida a si el nivel detectado en el sonómetro depende de la duración, la segunda orientada a discutir si la sensación auditiva relacionada con el nivel sonoro depende de la duración del sonido.

Experiencia realizada

Se generó en una computadora "ruido blanco" y se midió nivel sonoro en la posición MAX HOLD. Para determinar la dependencia con el ruido se hicieron varias mediciones de ruido de diferentes duraciones (comenzando con 100 mseg y aumentando de a 100 mseg).

Se nota que para sonidos cortos (menores a 2 seg) el valor máximo captado depende de la extensión temporal, pero una vez que el sonido alcanza cierta duración ya no varía el nivel detectado por el sonómetro.

La siguiente curva fue obtenida al medir el nivel máximo alcanzado en función de la duración del ruido utilizado:


Si bien es difícil realizar mediciones precisas de la sensación percibida es importante decir que el sentido de la audición tambien necesita un tiempo mínimo para alcanzar la máxima sensación. Esto es, sonidos cortos (algunas décimas de segundo) parecen tener menos volumen que sonidos algo mayores, pero una vez alcanzada una duración determinada, la sensación de volumen solo estará relacionada con la amplitud de la señal.

CURVAS DE IGUAL SONORIDAD (FLETCHER - MUNSON)

El ser humano puede escuchar sonidos que se encuentren en el rango que va de 20 Hz a 20 KHz. Pero, como es lógico suponer, esto no significa que un sonido de 20 Hz de un determinado nivel sonoro cercano al 0 dB SPL será escuchado sin problemas y que un sonido de 19 Hz de 140 dB SPL no se escuchará en absoluto. Mas bien hay que pensar que estos límites de frecuencia corresponden a una especie de frecuencia de corte del oído.

Cuanto mas baja sea la frecuencia de un sonido grave, mayor deberá ser el nivel SPL para que parezca del mismo nivel que otro sonido del rango de medios. De igual forma un sonido muy agudo deberá tener un nivel mayor que otro menos agudo para que la sensación auditiva sea similar en cuanto al nivel sonoro. 


En la figura anterior puede verse una representación esquemática de la situación. Si el sonido recibido tiene una serie de parciales todos de igual intensidad, el cerebro recibirá una sensación de menor volumen para los parciales muy graves y muy agudos. Para que la sensación sonora sea mas pareja es necesario resaltar el nivel de los parciales muy graves y muy agudos, esto puede hacerse ecualizando previamente la señal (Esto es lo que hace la función LOUDNESS o SONORIDAD de ciertos equipos de audio).

La única dificultad de representar este efecto de la sensación sonora por medio de un filtro del tipo RC consiste en que el filtro del oído es diferente para señales de diferente intensidad sonora. Si el sonido es de volumen bajo el filtro tiene un ancho de banda muy pequeño. Para sonidos de gran nivel sonoro, el ancho de banda del filtro se ensancha y debe ser representado mediante un filtro RC diferente al anterior.


Dos investigadores llamados Fletcher y Munson investigaron este fenómeno en 1933; y en 1956 Robinson y Dadson refinaron los experimentos que indican el nivel sonoro físico (relacionado solo con la amplitud) que es necesario, para que un sonido puro de una frecuencia determinada parezca tener el mismo volumen que un sonido de 1 KHz. 

Si tengo un sonido de dos parciales de 100 Hz y 1 KHz de igual amplitud, el oído escuchará el parcial de 100 Hz mas bajo. Estas curvas me indican cuánto mayor debe ser el sonido de 100 HZ para que parezcan del mismo volumen).


FILTROS PONDERADOS (weighting networks)

Para compensar estas diferencias entre el volumen físico (relacionado con la amplitud) y el volumen percibido se utilizan filtros que compensen estas diferencias. El filtro A es un filtro estandarizado que pretende simular en parte el efecto de los sonidos de bajo nivel sonoro (es un filtro de un pequeño ancho de banda y caída abrupta a los lados. El fitro C es un filtro que simula el efecto de sonoridad para altos niveles sonoros (se trata de un filtro de mayor ancho de banda y caída lateral mas suave). Los filtros no representan exactamente la respuesta del oído, fueron pensados para corregir en forma aproximada las mediciones de nivel sonoro, pero de forma que pueda ser fácilmente construido con circuitos RC simples.



En algunos casos se habla de filtro Z cuando se quiere respuesta plana del sonómetro. En la siguiente figura puede verse en el medidor de SPL del software Room EQ Wizard (REW) que aparece la posibilidad de seleccionar filtros A, B y Z, y por otra parte F y S (Fast y Slow).


2.1. Ejercicios sobre sonómetro

Estos ejercicios requieren tener en cuenta además las ecuaciones vistas en clases anteriores respecto de la potencia eléctrica de un parlante y la sensibilidad del parlante.

Necesitarán utilizar las curvas de los filtros ponderados y las de igual sonoridad de Fletcher-Munson

Indicar el nivel sonoro SPL que marcará el decibelímetro en los siguientes casos (notar que lo que cambia es el filtro utilizado y la frecuencia):

1 - Se aplican 10 Watts eléctricos de señal senoidal pura de 1 KHz, con un parlante de 90 dB de sensibilidad.

2 - Se aplican 10 Watts eléctricos de señal senoidal pura de 100 Hz, con un parlante de 90 dB de sensibilidad.


3 - Se aplican 10 Watts eléctricos de señal senoidal pura de 20 Hz, con un parlante de 90 dB de sensibilidad.


4 - ¿Qué nivel debe tener un sonido de 100 Hz para que parezca tener el mismo volumen que un sonido de 60 dB de 1 KHz?

5 - ¿Qué nivel debe tener un sonido de 5 KHz para que parezca tener el mismo volumen que un sonido de 120 dB de 1 KHz?

6 - Un sonido está formado por una senoidal pura de 1 Pascal de presión eficaz y frecuencia de 100 Hz. 

  a -¿Cuál es el nivel SPL generado?

  b -¿Cuál es el nivel SPL que detecta un sonómetro con filtro A?

  c -¿Cuál es el nivel SPL que detecta un sonómetro con filtro C?

------------------------------------------------------------

En los siguientes ejercicios se combina además el tema de sumar sonidos al aire. Este mismo tipo de "suma" se aplica cuando se superponen sonidos de dos frecuencias diferentes ya que en ese caso tampoco pueden ser "coherentes" entre sí. Recuerden que para dos sonidos al aire sus niveles de suman mediante una lógica más compleja. 

NSPL total=10.log(10N110+10N210)

Cuando se pregunte solamente por nivel SPL total se resolverá el nivel físico que un instrumento sin filtros ponderados podría captar. Cuando se pregunte por el nivel aparente o por lo que el sonómetro marcaría con alguno de los filtros será necesario primero obtener el nivel "aparente" en dB que corresponda a cada uno por separado y luego sumarlos utilizando el procedimiento de suma de sonidos al aire.

7 - Un sonido está formado por dos senoidales puras de 1 Pascal de presión eficaz cada una y frecuencias de 100 Hz y 1 KHz. 

  a -¿Cuál es el nivel SPL generado?

  b -¿Cuál es el nivel SPL que detecta un sonómetro con filtro A?

  c -¿Cuál es el nivel SPL que detecta un sonómetro con filtro C?

8 - Tengo un sonido formado por dos parciales, el primero de 70 dB SPL y 90 Hz; el segundo de 60 dB SPL y 1 KHz:

  a - ¿Cuál es el nivel SPL total de este sonido?

  b - ¿Cuál es el nivel "aparente" de este sonido?

9 - Tengo un sonido formado por dos parciales, el primero de 90 dB SPL y 90 Hz; el segundo de 90 dB SPL y 1 KHz:

  a - ¿Cuál es el nivel SPL total de este sonido?

  b - ¿Cuál es el nivel "aparente" de este sonido?