Descrição simplificada da placa de som :
A figura seguinte representa uma placa de som típica, com seus principais componentes :
A placa de som é controlada via comandos em linguagem de máquina, ou de forma mais amigável com as interfaces do Windows, uma para a reprodução de sons (volume control) e a outra para gravação (recording control), como pode ser visto na figura seguinte, (junto com um diagrama elétrico básico da parte analógica e a correspondência dos controles com os componentes, em vermelho) :
A figura seguinte mostra o diagrama simplificado de placa de som mais moderna, caso típico dos circuitos de som "On-board". Observe as principais diferenças:
- na parte de gravação, agora só pode ser fechada uma chave por vez, ou seja, somente pode ser selecionada uma única fonte de sinal, e por isso não tem mais o somador.
- ainda na gravação, agora não tem mais o controle de volume geral (recording control)
- ainda na gravação, agora tem novos circuitos: MIX mono e MIX stereo, que permitem gravar uma mistura (mix) dos sinais selecionados na tela de reprodução, ou ainda, fazer retornar os sinais selecionados na reprodução de volta para o circuito de gravação (loop-back).
- na parte de reprodução, temos agora potenciômetros SEPARADOS na parte de gravação e na parte de reprodução ( e não apenas um, comum à gravação e à reprodução)
- não tem mais o amplificador de potencia e nem a saída SPKR out. Agora o amplificador deve ser externo, geralmente incorporado aos alto-falantes.
A placa contem um oscilador a cristal que serve de referencia para obter as diversas taxas de amostragem usadas nos ADC/DAC, como 44100 Hz, 22050 Hz, 11025 Hz que são valores padronizados em áudio, e outras ainda . Normalmente uma boa placa permite taxas desde 4000 Hz até 48000 Hz.
No conversor analógico/digital ADC, dois parâmetros fundamentais são :
- a taxa de amostragem
ou freqüência de amostragem : quantidade de amostras por segundo.
Amostragem : divisão do eixo horizontal de tempo do sinal em amostras
PAM discretas, ou pulsos modulados em amplitude, que representam valores
instantâneos da amplitude do sinal.
- a resolução de
quantização destas amostras PAM em bits (divisão
do eixo vertical ou amplitude em valores discretos, o que introduz um erro
ou ruído de quantização, ou ainda, distorção
harmônica)
De acordo com o teorema de Nyquist, a taxa de amostragem deve ser
maior que o dobro da maior
freqüência contida no sinal, para que este possa ser reproduzido
sem distorção de aliasing.
Por isso o padrão de 44100 Hz usado no CD , que permite reproduzir
sinais de audio de até pouco mais de 20 kHz. Em telefonia basta
uma taxa de 8 kHz para reproduzir sinais de até 3,4 kHz.
Quanto a resolução, os ADC/DAC podem operar com
8 ou 16 bits, de acordo com a qualidade desejada em termos de relação
sinal/ruído de quantização ou distorção
harmônica :
8 bits : permitem 256 valores discretos e uma relação
sinal ruído de quantização S/N teórica
de no max. 48 dB (com quantização linear) , o que equivale
a uma distorção harmônica total THD não
menor que 0,4%. (suficiente para audio telefônico e SSTV)
16 bits : permitem 65536 valores discretos) e no max.
96 dB de S/N ou 0,0016% de THD. (necessário para HiFi, mas geram
arquivos maiores...Há um compromisso prático entre qualidade
e tamanho dos arquivos de som ou taxa de transmissão destes arquivos)
Obs.: para cada bit adicional, ganhamos 6 dB na S/N de quantização
e a THD de quantização cai pela metade.
Placas mais recentes também funcionam em 18, 20 ou 24 bits,
e taxas de amostragem de 96 kHz. (padrão de som de DVD : taxa 96
kHz e quantização com 24 bits).
O sinal digitalizado pelo DAC pode ser enviado por acesso direto à memória DMA para a CPU da placa mãe ou pode ser processado pelo DSP, aliviando assim a CPU, dependendo do software usado. A função básica do DSP é transformar as amostras digitais do sinal no domínio do tempo (forma de onda) para o domínio da freqüência (espectro) usando rotinas FFT, ou transformadas rápidas de Fourier. É muito mais fácil analisar e processar um sinal complexo no domínio da freqüência do que no tempo, e se necessário, voltar depois ao domínio do tempo, por FFT inversa.
Em SSTV, na recepção, o DSP permite, via FFT, fazer
a demodulação FM do
sinal de audio de SSTV, geralmente por simulação de um elo
amarrado em fase, PLL ou outro tipo de discriminador de freqüência.
Com 8 bits por exemplo, o sinal de vídeo em 1500 Hz vira 0, e 2300
Hz vira 255, valores dos bytes representantes do nível de cada cor
em R-G-B ou de Y-C. Na transmissão, o DSP processa a modulação
FM do sinal de audio SSTV, ou seja , transforma o valor de cada byte
de cor em um sinal senoidal de freqüência análoga : 0
vira 1500 Hz , 1 vira 1503,13 Hz e assim por diante até 255 que
vira 2300 Hz.
Portanto, a placa de som em SSTV funciona como um simples modulador/demodulador
FM.
Adicionalmente, o DSP pode aplicar outros processamentos ao sinal,
como filtros de todos os tipos. Consegue assim filtrar ruídos
fora da banda ocupada pelo sinal SSTV, extrair o sinal de sincronismo em
1200 Hz e os bits do VIS em 1100 e 1300 Hz.
O sinal no domínio da freqüência também pode ser
usado para fazer um display do espectro do sinal para sintonia, e
a representação deste espectro no tempo, trocando amplitude
por luminosidade ou cores, vira um espectrograma (eixo de tempo na horizontal)
ou waterfall (eixo de tempo na vertical).
Características importantes de uma placa de som :
- Capacidade ou não de operar em Full-duplex (ou seja gravar e reproduzir simultaneamente).
- Nível máximo de entrada Ve max : valor eficaz do maior sinal senoidal aplicável na entrada que não é distorcido (ceifado), ou seja, que produz o maior valor quantizável no pico da senoide do sinal. (medida em Volts ou mV).
- Dinâmica : Relação entre Ve max e o ruído de fundo da placa sem sinal (entrada terminada com impedância nominal). (medida em dB). ( não confundir com S/N).
- Distorção harmônica total THD : É a porcentagem da soma RMS (raiz da média dos quadrados) das tensões dos sinais harmônicos espúrios gerados em relação a tensão do sinal de teste. É uma forma de medir o ruído de quantização e outros gerados por distorções não lineares.
- Relação sinal/ruído S/N : relação entre Ve max e o ruído presente simultaneamente com este sinal. (N = ruído de fundo + THD) (medida em dB). Somente o sinal estando presente é que pode existir o ruído de quantização. Sem sinal, existe apenas o ruído de fundo, com característica de ruído branco (aleatório).
- Resposta em freqüência : desvio do nível (em dB) do sinal dentro da faixa de freqüência nominal em relação a 1 kHz. O limite superior da faixa de freqüências é a freqüência de Nyqist que é igual a metade da freqüência de amostragem usada.
- Ruído de aliasing : não sei porquê,
mas este é um parâmetro importante e omitido pela maioria
dos fabricantes. É muito fácil de ser medido ou observado
e é provocado pelo projeto incorreto do filtro anti-aliasing,
no circuito de gravação da placa (antes do ADC), e com conseqüências
desastrosas na qualidade do sinal gravado ou digitalizado,
principalmente em programas de analise espectral de sinais, como
o Spectrogram
(usado nos testes abaixo), o CoolEdit,
o audioTester ou qualquer
outro. Para esta aplicação e outras ainda, a placa deve
ter um excelente filtro anti-aliasing. A maioria das placas de som
On-board (para não dizer todas que já testei) ou
de baixo custo são péssimas nesse aspecto.
Por exemplo, uma placa com freqüência de amostragem de 22050
Hz não deve responder a um sinal com mais de 11025 Hz. Uma placa
ruim, na mesma taxa, gera uma sinal de 9050 Hz quando se injeta um sinal
de 13000 Hz, e, se for péssima, também gera 1000 Hz quando
se injeta 21050 Hz ou 23050 Hz ou outras mais!... ( Vide Teoria
sobre aliasing )
Obs.: em SSTV particularmente, uma placa com ruído de aliasing não é problema porque o sinal que sai do receptor e entra na placa já é limitado em freqüência pelo próprio receptor (por ex. 3000 Hz max.) e permite usar taxas de amostragem a partir de 6000 Hz. Mas se o RX limitar em 4 kHz devemos usar taxa de no mínimo 8 kHz. Por isso, os softs de SSTV usam geralmente 11025 Hz como taxa de amostragem, que é o valor padronizado mais próximo de 8 kHz que a maioria das placas suporta. E não é vantagem nenhuma amostrar um sinal de SSTV em taxas maiores que 11025 Hz (vide teorema de Nyquist) , o que só tomaria mais tempo do DSP ou da CPU.
As figuras seguintes são resultados de teste de duas placas diferentes, uma péssima e outra boa. Uma forma de fazer o teste para ver se a placa tem um bom filtro anti-aliasing é injetar um sinal quadrado simétrico de boa qualidade, isto é, que só contem harmônicos impares, com freqüência tal que se possa ver por ex. até o harmônico 15, como por ex. na figura seguinte, e tal que as raias de aliasing (por ex. raias 17 a 33) não caiam em cima destes harmônicos (raias 3 a 15) e nem nas próprias raias de aliasig de ordem superior (raias 35 a 45). (o nível da onda deve ser menor que Ve max para não produzir outros tipos de distorção) Uma outra forma de fazer o teste é injetar um sinal senoidal de boa qualidade e variar a sua freqüência desde fam /4 até 2 fam. A raia do sinal deverá desaparecer assim que a sua freqüência passar acima de fam / 2, que é a freqüência de Nyquist e também a máxima freqüência do eixo horizontal do espectro. (fam = freq. de amostragem). Numa placa de má qualidade, acima de fam /2 , a raia de aliasing aparece baixando em frequencia enquanto a frequencia do sinal sobe até fam.
A placa de boa qualidade apresenta um pequeno defeito de aliasing, porque o filtro anti-aliasing não pode ser perfeito, isto é, atenuar infinitamente sinais acima da freqüência de Nyquist, que é igual a metade da freqüência de amostragem. Quanto menores forem estes resíduos de aliasing, melhor é o filtro da placa. Na figura seguinte, aparecem dois sinais de aliasing bastante atenuados, que são os harmônicos 17 (o maior, e cuja freqüência é 11356 Hz, mas aparece em 10694 Hz) e 19 da onda quadrada de teste (o menor, e cuja freqüência é 12692 Hz, mas aparece em 9358 Hz).