• Inteligibilidade : medindo, prevendo e melhorando

    A inteligibilidade é essencial para a comunicação. Neste artigo descreveremos em detalhes os diferentes aspectos que afetam a inteligibilidade, como medi-la, bem como medidas para melhorá-la .

    1. O que é inteligibilidade?

    A "inteligibilidade" é a qualidade de ser compreendido. Pode se aplicar a uma idéia ou a uma escrita, mas em nosso contexto se relaciona com a palavra falada e, menos comumente, com a música.

    Embora os profissionais de áudio estejam preocupados que a inteligibilidade dos sistemas que vendem ou alugam não seja um problema nas aplicações e locais onde são utilizados, é um conceito que poderia ser aplicado a uma fonte sonora não amplificada. Por exemplo, nas escadas de um prédio de 20 andares será difícil para duas pessoas se entenderem, mesmo que falem alto, se estiverem separadas por muitos andares. Ou, se um pároco decide dar a missa sem amplificação em um dia de pouca assistência em uma catedral católica reverberante, será difícil para as pessoas entenderem o sermão dos bancos mais distantes, mesmo que o padre tenha uma voz poderosa. Da mesma forma, será difícil nos fazer entender na rua acima do barulho de uma furadeira pneumática ou de uma demonstração lotada (mesmo com o Efeito Lombard EL), e dificilmente conseguiremos decifrar qual peça está sendo tocada por um músico de rua nessas mesmas condições.

    Embora a inteligibilidade possa depender da qualidade de um sistema sonoro, ruído ambiente ou reverberação, ela também é afetada pela inteligibilidade da própria fala. Por exemplo, um orador com má dicção, um sotaque diferente, uma voz abafada ou um discurso muito rápido pode ser difícil de entender em qualquer situação. Além disso, nem todos os idiomas são igualmente inteligíveis e os ouvintes podem não ser falantes nativos com diferentes níveis de compreensão auditiva. Da mesma forma, palavras simples em um contexto familiar serão mais fáceis de entender. (Quando há fome em casa, todos entendem "Vamos comer!"...)

    2. Você me entende?
    Formas de medir a inteligibilidade: objetiva e subjetiva

    Normalmente a inteligibilidade é importante, particularmente se estiver em palavras; afinal, é por isso que falamos ou tocamos uma mensagem gravada (embora às vezes preferíssemos que um discurso entediante e desnecessariamente longo se perdesse no eco da sala!) Em certas aplicações, essa importância pode até significar a diferença entre vida e morte, como no caso dos sistemas de evacuação de voz.

    É por isso que é feita uma tentativa de quantificar o grau de inteligibilidade, o que pode ser feito tanto subjetiva quanto objetivamente.

    2.1 Medição subjetiva

    Neste primeiro caso, poderíamos perguntar ao público se todos compreendem. De uma forma mais científica, o que geralmente se faz é utilizar listas de sílabas ou palavras projetadas especificamente para a finalidade com um equilíbrio fonético. As palavras podem ser colocadas dentro de uma frase que fornece um contexto que facilita a compreensão, ou podem ser pronunciadas ou reproduzidas uma a uma. Um grupo de pessoas faz um teste no qual ou selecionam cada palavra de uma lista de palavras ou têm que escrevê-la. Para que estes testes sejam estatisticamente válidos, as listas devem conter palavras suficientes (um mínimo de 50), é imperativo que sejam realizadas com um número suficiente de pessoas (com audição verificada), sessões e (se aplicável) locais.

    2.2 Medição objetiva

    As pessoas não somos subjetivamente confiáveis no subjetivo, dependendo de muitas variáveis como nosso estado de espírito, então os testes de inteligibilidade subjetiva são caros e demorados para se obter um resultado confiável.

    Portanto, existem diferentes métodos objetivos de medir (ou mais propriamente prever, já que a inteligibilidade não é medida diretamente) a inteligibilidade da fala.

    %ALC (%Alcons)
    Dentro de uma palavra ou sílaba, as consoantes desempenham um papel mais importante na compreensão da fala do que as vogais, particularmente em línguas não tonais como o português (em chinês, por exemplo, uma língua tonal, as inflexões tonais são um elemento lingüístico adicional que ajuda na inteligibilidade). Curiosamente, quando temos que nos fazer entender acima do ruído ambiente e tentar gritar, os resultados geralmente não são o que esperamos, e isto é em grande parte porque, assim como podemos gritar uma vogal, é difícil pronunciar a maioria das consoantes em um volume alto (tente gritar a letra 't'!).

    Esta importância das consoantes levou Victor Peutz em 1971 a desenvolver um dos primeiros indicadores utilizados para a inteligibilidade da fala, o %Alcons, um acrônimo para Articulation Loss of Consonants, que tenta traduzir a inteligibilidade de uma sala em uma diminuição da percepção das consoantes, calculada ou medindo os níveis sonoros diretos e refletidos ou pelos parâmetros principalmente arquitetônicos da sala. A fórmula no último caso é:

    200 D² T² (n+1)
    %Alcons = ------------- + K
    Q V M


    Onde:
    D = distância entre o ouvinte e a fonte sonora
    T = tempo de reverberação (RT60) em segundos para 1400 Hz
    K = Correção do orador/ouvinte (de 1% para bons oradores/ouvintes a 15% para maus condições)
    Q = fator de diretividade do falante (ou falante)
    n = o número de alto-falantes
    V = volume da sala em m³.
    M = coeficiente de absorção da área coberta pelos alto-falantes

    (a fórmula original de Peutz era um pouco mais simples, sem os três últimos parâmetros)


    Você pode ver que os parâmetros mais importantes (uma vez que são quadrados na fórmula) são a distância (D) entre a pessoa e a fonte e o tempo de reverberação (T), e como parâmetros secundários o número e a diretividade dos alto-falantes,

    Há também fórmulas mais complexas para o cálculo do %ALC com base nas medições dos níveis de som direto, som refletido e ruído ambiente de um analisador.

    Um %ALC acima de 15% é considerado inaceitável, aceitável para mensagens não complicadas de 15% a 10%, bom entre 10% e 5%, e excelente abaixo deste valor.

    O %ALC caiu em grande parte em desuso, em parte porque é calculado para apenas uma freqüência.


    STI

    Um elemento que encontraremos em comum entre as técnicas posteriores de medição objetiva é que as diferentes bandas de freqüência são avaliadas separadamente e mais peso (importância) é dado na nota final geral àqueles cuja contribuição para a inteligibilidade da fala é maior. Por exemplo, a oitava de 2k Hz é a mais importante, respondendo por mais de 30% da inteligibilidade, e será a que contará mais. Além disso, entre as bandas de 1000, 2000 Hz e 4000 Hz, mais de 75% da inteligibilidade da fala é abordada. O gráfico abaixo mostra a contribuição para a inteligibilidade para as diferentes faixas de oitava.

    Contribuição para a inteligibilidade por bandas de oitava




    No caso do STI (acrônimo para Speech Transmission Index ou, em português, Índice de Transmisión de Palabra), desenvolvido no início dos anos 70 pelos holandeses Tammo Houtgast e Herman Steeneken e baseado em bandas de oitava de ruído rosa com modulação de amplitude (ou seja, o volume aumenta e diminui como em um efeito tremolo) em diferentes velocidades (baseado nas inflexões de volume da fala real) e que prevê a inteligibilidade da fala transmitida por um sistema que fica entre o falante e o ouvinte, e cujos valores variam de 0 (completamente ininteligível) a 1 (completamente inteligível). O STI utiliza 14 velocidades (frequências) de modulação (de 0,63 a 12,5 Hz) do nível das bandas de oitava entre 125 e 8k Hz (portanto 7 bandas), com diferentes pesos aplicados a cada uma das bandas e de forma diferenciada para alto-falantes masculinos e femininos. A redução da profundidade de modulação (causada principalmente por reverberação e ruído) está associada à perda de inteligibilidade; é semelhante à medição da faixa dinâmica do sinal captado pelo microfone (de uma forma que procuramos medir o nível nos silêncios do sinal de teste).



    Algo semelhante pode ser visto neste vídeo no qual uma oitava de ruído centrada em 1000 Hz é primeiro reproduzida e é modulada em amplitude a 1 ciclo por segundo e depois este mesmo ruído pulsante com reverberação adicional, de modo que a relação de nível máximo para nível mínimo é reduzida audível e visivelmente.


    Se tivermos que modular 7 bandas diferentes de ruído a 14 velocidades diferentes, o resultado é 98 testes diferentes para obter o mesmo número de índices de transmissão (TI, Transmission Index), que são relações entre o sinal e o ruído (seja o próprio ruído ou qualquer outra coisa que não seja o sinal original, tais como reverberação, ecos ou distorção). A média das taxas de transmissão para as diferentes taxas de modulação em cada banda é então calculada, resultando no Modulation Transfer Index (MTI, Modulation Transfer Index) para cada uma das 7 bandas. Estas MTIs para cada banda são então combinadas em um único valor STI, para o qual as diferentes bandas de oitava são ponderadas diferentemente de acordo com sua contribuição para a inteligibilidade da fala. Por exemplo, a banda de oitava centrada em 2000 Hz tem o maior peso, já que a 2k é mais importante que as outras bandas no que diz respeito à inteligibilidade da fala.

    Quando as diferentes bandas de oitava e taxas de modulação são aplicadas completamente sequencialmente (para um cálculo direto), a duração do teste é de cerca de 15 minutos, embora sob certas suposições seja permitido um cálculo indireto (que se tornou o método usual e será discutido mais tarde) a partir de uma resposta de impulso, caso em que um resultado pode ser obtido em poucos segundos. Em ambos os casos, na presença de ruído flutuante, os testes devem ser realizados pelo menos 3 vezes.

    Foi somente no final dos anos 80 que o uso do STI começou a decolar após a definição de um método de medição acelerado, RaSTI, o aparecimento em 1985 do primeiro sistema de medição comercial (por Brüel & Kjaer) e a publicação de métodos de medição padronizados na norma IEC 60268-16 (Objective rating of speech intelligibility by speech transmission index) em 1988 (também em sua tradução como a norma brasileira ABNT NBR IEC 60268-16, "Avaliação objetiva da inteligibilidade da fala pelo índice de transmissão da fala").

    O algoritmo de cálculo especificado na norma acima mencionada mudou com as sucessivas edições. Além disso, foi acrescentada uma diferenciação entre o discurso feminino e o masculino que não existia originalmente, embora tenha sido eliminada na edição de 2020.

    Ao contrário do %ALC, o STI é melhor quanto mais alto o valor. Assim, podemos estabelecer esta escala de inteligibilidade com base em valores de DST para falantes nativos e ouvintes sem problemas de audição ou compreensão.

    Qualificação de inteligibilidade para ouvintes nativos
    Faixa de STI
    Inteligibilidade de acordo com IEC 60268-16
    Inteligibilidad das sílabas en %
    inteligibilidade das palavras en % inteligibilidade das frases en %
    0–0,3 Mau 0–34 0–67 0–89
    0,3–0,45 Pobre 34–48 67–78 89–92
    0,45–0,6 Aceitável 48–67 78–87 92–95
    0,6–0,75 Boa 67–90 87–94 95–96
    0,75–1 Excelente 90–96 94–96 94–100


    A quarta edição (2011) da IEC 60268-16 estabelece uma classificação alfabética que varia de "U" a "A+":

    Bandas de qualificação STI e aplicações típicas
    Categoria
    Valor nominal do STI
    Tipo de informação da mensagem
    Exemplos típicos de uso
    (para voz natural ou gravada)
    Comentário
    A+ >0,76 Estúdios de gravação Excelente inteligibilidade para raramente alcançável em ambientes habituais
    A 0,74 Mensagens complexas, palavras no familiares Teatros, auditorios para palabra, juzgados, sistema de escucha asistida Alta inteligibilidade de fala
    B 0,7 Mensagens complexas, palavras no familiares Teatros, salas de conferência, tribunais, sistemas de escuta assistiva Alta inteligibilidade de fala
    C 0,66 Mensagens complexas, palavras no familiares Teatros, salas de conferência, tribunais, sistemas de escuta assistiva Alta inteligibilidade de fala
    D 0,62 Mensagens complexas, palavras familiares Auditórios, salas de aula, salas de concertos Boa inteligibilidade de fala
    E 0,58 Mensajes complejos, contexto familiar Salas de concierto, iglesias modernas Sistemas de refuerzo sonoro de alta calidad
    F 0,54 Mensagens complexas, contexto familiar Salas de concerto, igrejas modernas Sistemas de reforço de som de alta qualidade
    G 0,5 Mensagens complexas, contexto familiar Centros comerciais, escritórios em edifícios públicos, sistemas de evacuação de voz Valor de busca para sistemas de evacuação de voz
    H 0,46 Mensagens simples, contexto familiares Sistemas de evacuação e alerta em ambientes acústicos difíceis Limite inferior normal para sistemas de evacuação de voz
    I 0,42 Mensagens simples, contexto familiar Evacuação e sistemas de alerta espaços muito difíceis
    J 0,38
    U <0,36

    Nota 1: Estes valores devem ser considerados como valores mínimos desejáveis.
    Nota 2: A inteligibilidade percebida para cada categoria também dependerá da resposta de freqüência em cada posição de escuta.

    Há fórmulas que correlacionam o %Alcons com o STI. Da mesma forma, os programas de modelagem calculam o STI com base em fórmulas que utilizam parâmetros arquitetônicos e tentam aproximar os resultados reais das medições.

    A quinta edição (2020) da IEC 60268-16, uma revisão técnica, agrega informações sobre procedimentos de predição e medição, atualiza as relações entre o STI e outras medidas de inteligibilidade, reduz o peso das bandas de 125 e 250 Hz, e elimina a diferenciação entre fala masculina e feminina, optando pelo pior cenário possível (fala masculina é menos inteligível que fala feminina).

    RaSTI
    Cada um destes testes, dos quais cada uma das 98 índices de transmissão é extraída, leva em média cerca de 10 segundos, de modo que um teste STI direto completo (STI direto completo, onde cada freqüência é reproduzida para cada índice de modulação) leva cerca de 15 minutos, o que é um longo tempo com o entendimento de que deve ser medido em diferentes posições (e várias medições feitas em cada posição, particularmente se o ruído ambiente não for constante). Para acelerar este processo, já na primeira edição da IEC 60268-16 havia a possibilidade de uma medição abreviada (RaSTI, acrônimo para Rapid STI ou STI rápida) na qual apenas duas bandas eram utilizadas: a banda de 2000 Hz (com 5 índices de modulação) e a banda de 500 Hz (com 4 índices, diferentes daquelas utilizadas para os 2000 Hz); além disso, para a velocidade, hoje em dia um único sinal é normalmente reproduzido contendo as duas bandas e todas as modulações, e as bandas são então separadas por processamento.

    Hoje RaSTI caiu em desuso, pois há maneiras rápidas de avaliar todas as faixas necessárias.


    STIPA
    A segunda edição da IEC 60268-16 introduz em 1998 o STIPA, uma versão melhorada do RaSTI que utiliza todas as sete bandas de freqüência com índices de modulação para cada uma (todas diferentes para alcançar os 14 índices diferentes da medição completa do STI). Isto proporcionou uma medição mais rápida (originalmente cerca de 60 segundos), mais confiável do que com RaSTI, que se tornou obsoleto com o tempo, mas ainda é usado como referência.

    Com o advento da tecnologia digital, a medição STIPA foi ainda mais acelerada pelo fato de que um único sinal foi reproduzido em todas as freqüências moduladas. No reprodutor abaixo podemos ouvir o sinal para a medição STIPA de um analisador do fabricante da NTI. Parece estático porque há sete bandas) de ruído diferentes com volumes subindo e descendo em velocidades diferentes em cada uma delas.




    STITEL
    Em nossa profissão, o elemento que torna a fala mais difícil de entender é a reverberação. Entretanto, o STI foi projetado para incluir o efeito de qualquer elemento entre o falante e o ouvinte, incluindo microfones e qualquer outro tipo de distorção, tais como dificuldades em receber um rádio ou TV. STITEL também é definido na IEC 60268-16 especificamente para avaliar sistemas de telecomunicações e é semelhante ao STIPA, embora com uma taxa de modulação única para cada uma das sete bandas de freqüência.

    Hoje existe uma multiplicidade de equipamentos no mercado que permite a medição de STI e derivados, tanto portáteis como baseados em computador. Ela deve ser medida em diferentes posições, e várias medições devem ser feitas em cada posição, particularmente se o ruído ambiente não for constante. Alguns analisadores permitem que o ruído ambiente e o sinal de teste sejam medidos separadamente, e então o índice calculado, o que é prático em certas aplicações onde as pessoas geram a maior parte do ruído ambiente (por exemplo, em um estádio, onde reproduzir o sinal com o público presente pode não ser uma opção). O sinal de teste pode ser alimentado no misturador do sistema de reforço, ou uma voz artificial ou pequeno alto-falante pode ser usado para reproduzir o sinal na frente do microfone, de modo a incluir o microfone e a acústica ao redor.


    Métodos indiretos
    As medidas objetivas de inteligibilidade que descrevemos até o momento são métodos de medição direta. Quer você toque bandas únicas moduladas a uma velocidade diferente a cada vez, ou você as soma todas em um único sinal (como o STIPA do reprodutor) e depois as divide em cada uma das bandas de freqüência para cálculo, a medição é direta.

    Entretanto, versões posteriores do padrão STI permitem cálculos baseados em uma resposta de pulso (geralmente calculada a partir de uma resposta de freqüência com amplitude e fase, ou MLS ou seno varrido), de modo que a medição se torna realmente rápida.

    Uma limitação tanto do método indireto quanto da medição com um único sinal com todas as freqüências reproduzidas ao mesmo tempo é que eles não são capazes de incluir o efeito do ruído ambiente, pois o volume do sinal nunca é zero (embora haja a possibilidade de adicionar um parâmetro de nível de ruído mais tarde). Também não é possível incluir o possível efeito que algumas bandas podem ter sobre outras.


    Predição
    Além de medições diretas ou indiretas mais ou menos completas, o software de modelagem de sistemas eletroacústicos também oferece a possibilidade de mapear níveis de inteligibilidade baseados em níveis sonoros diretos, uma previsão dos níveis sonoros refletidos e níveis de ruído que podem ser especificados.A figura mostra a variação do STI em uma sala do tipo estação reverberante de um nível ideal em frente ao alto-falante único ao nível do ouvido para valores de inteligibilidade muito baixos na parte posterior do edifício. Em grande medida estas variações nos STI (e portanto na inteligibilidade) refletem as variações na relação entre o nível de som direto e o refletido.


    Outros índices
    Há outros índices de inteligibilidade que preferimos não incluir para facilitar a compreensão e porque não são tão amplamente utilizados.

    • O AI (Articulation Index, Índice de Articulação) é um índice antigo semelhante ao STI, mas não considera o efeito da reverberação na inteligibilidade, baseado principalmente no efeito do ruído ambiente.
    • A CIS (Common Intelligibility Scale, Escala de Inteligibilidade Comum), proposta no final do século passado, dá uma leitura diferente da STI, aplicando a fórmula CIS = 1 + log (STI).
    • Os indicadores C de Clareza (clarity, clareza) merecem uma menção separada. Eles expressam, em decibéis, a relação entre o som que chega inicialmente e o que chega depois, estabelecendo em nome do indicador o tempo em milissegundos que separa ambos. Por exemplo, em indicadores de clareza C7, C50 e C80 esta divisão está em 7, 50, e 80 milissegundos, respectivamente. O C50 é normalmente tomado como um indicador de clareza da fala (um valor maior que 0 dB é recomendado para este fim), enquanto o C80 é usado para clareza musical e não deve ser inferior a -3 dB (um requisito que poderia ser reduzido para -5 dB, para música sagrada), enquanto o C7 deve ser maior que -10 ou -15 dB, dependendo do critério.
    • Algo semelhante ao C, são os indicadores D (Definition, definição), que expressam, em porcentagem, a relação entre o som que chega inicialmente e o nível total, estabelecendo também no nome do indicador o tempo em milissegundos em que se considera que a energia inicial termina. No caso de D50, recomenda um valor superior a 50% (uma relação superior a 0,5).
    • Os parâmetros U se destinam a expressar principalmente a relação entre som útil e som prejudicial (useful-to-detrimental sound ratio, relação entre som útil e som prejudicial). Eles são um pouco semelhantes aos indicadores C, mas também incorporam o nível de ruído e também permitem definir a divisão entre reflexos iniciais e retardados (por exemplo, U50, para os quais valores superiores a +2 dB são recomendados para a faixa de 1 kHz em aplicações de inteligibilidade de fala) e fornecidos em decibéis.



    3. Melhorias de inteligibilidade

    Como vimos, há dois fatores principais que dificultam a inteligibilidade, o ruído e a reverberação.

    • Ruído
      Quanto ao ruído ambiente, muitas vezes não há muito que possamos fazer (por exemplo, em um estádio, onde o barulho da multidão pode ser ensurdecedor). Em qualquer caso, para que a mensagem seja compreensível, teremos que projetar um sistema que possa gerar uma pressão sonora contínua real (levando em conta fatores como a dinâmica do sinal, o que implica não utilizar a potência máxima do amplificador para fazer os cálculos, e levando em conta outros fatores que possam reduzir a pressão sonora, como o aquecimento das bobinas do alto-falante) pelo menos 10 dB acima do ruído.

      Isto é imperativo nas aplicações do sistema de aviso de evacuação por voz. Se o edifício não for construído ou tiver que ser renovado, o ruído deve ser um fator no projeto. Por exemplo, garantir isolamento acústico suficiente para reduzir suficientemente o ruído externo. Ou, por exemplo, em um túnel rodoviário, evitando que o ruído das turbinas de ventilação seja um problema.

    • Reverberação
      A relação entre som direto e refletido é geralmente o elemento mais importante que determinará a inteligibilidade. Embora o tempo de reverberação não ajude, é principalmente uma relação baixa entre os dois que irá reduzir o STI. Em uma igreja ou estação reverberante, podemos ser capazes de entender perfeitamente uma pessoa falando ao nosso lado ou a mensagem sendo tocada quando estamos diretamente em frente a um alto-falante; o problema surge quando nos distanciamos, já que o nível do campo reverberante compete com o som direto.

      Neste sentido, o projeto do sistema de som deve evitar enviar muito som para superfícies vivas que geram reverberação, como tetos e paredes, mas também para áreas da sala onde não há público. Quando a quantidade de público é variável, podemos considerar desligar a emissão para áreas vazias por meio de uma memória que reconfigura o sistema de uma maneira simples para o usuário. Dependendo da aplicação, pode ser preferível um sistema distribuído que aproxime as fontes sonoras do público, ou um sistema central com bom controle de diretividade em todas as freqüências que possam ser problemáticas (e aqui lembramos que para gerar diretividade em baixas freqüências importa o tamanho, e pode ser necessário, por exemplo, ter uma formação de caixa grande o suficiente para alcançar o controle de diretividade nas freqüências problemáticas). A modelagem nestes casos pode nos dar uma estimativa antes de escolher o tipo de sistema, proporcionando médias e outras estatísticas, pois às vezes é difícil estimar com base em mapas coloridos.

    • Outras
      Qualidade de som e inteligibilidade freqüentemente andam de mãos dadas, mas não são a mesma coisa. Um sistema de fala pode ser altamente inteligível, mas não natural. Em qualquer caso, os componentes do sistema devem ser de qualidade suficiente. Todos nós provavelmente já ouvimos aqueles megafones baratos usados em demonstrações onde mesmo ao ar livre e perto do dispositivo é quase impossível entender os slogans se não os conhecemos de antemão. Os microfones são particularmente importantes e devem ser capazes de captar claramente a fala; esta é às vezes a maneira mais econômica de melhorar a inteligibilidade de um sistema de alerta.

      A distorção pode ser um fator crítico, embora seu efeito não seja geralmente visto nas medições de inteligibilidade. Se o áudio estiver vindo de uma videoconferência, uma velocidade de conexão adequada será importante para alcançar e manter uma qualidade de áudio suficiente. Por outro lado, a distorção nem sempre é negativa para a inteligibilidade: existem também formas de distorção cujos harmônicos adicionais podem melhorar a compressão de uma mensagem de fala, tais como um certo nível de clipagem (clip) ou saturação.

      Equalização e outros processos. Idealmente, a resposta de frequência estará livre de irregularidades e não mostre nenhuma variação entre diferentes posições além da perda natural em altas devido ao ângulo de cobertura. Os picos ou vales na resposta de freqüência que são comuns a todas as posições podem se beneficiar da equalização corretiva. Em sistemas de baixa qualidade com poucas agudos, o aumento do nível das bandas de 2k e 4k Hz aumentará a inteligibilidade; da mesma forma, o uso de um filtro passa-alto para cortar baixa e média-baixa pode ajudar na compreensão da mensagem se houver reverberação excessiva nessas bandas de freqüência. Em relação ao ruído, existem sistemas que monitoram o ruído ambiente e adaptam o volume do sinal para que ele fique acima, evitando níveis excessivos de pressão sonora quando o ruído ambiente é baixo. Da mesma forma, para anúncios de microfones, um compressor pode ajudar a atingir o nível adequado.

      Conhecimento do usuário. A pessoa que faz anúncios com um microfone deve receber um mínimo de treinamento.Eles devem saber não falar com os lábios contra o microfone (talvez um pequeno filtro anti-pop ajude) e não se afastar muito. Eles também devem falar no nível apropriado, vocalizar e falar o mais inteligivelmente possível em lugares com acústica difícil.


    EL Efeito Lombard. O efeito ou reflexo Lombard é a tendência natural não intencional de modificar a fala para aumentar a inteligibilidade em alto ruído de fundo. Além de um aumento no volume, as mudanças incluem mudanças na velocidade, freqüência, espectro e duração das vogais (alongamento). Os movimentos faciais também são exagerados. Um efeito equivalente também é observado quando vários músicos tocam ou cantam juntos, e também entre animais .

  • Ad

  • Ad