Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Telecom - Conversor de voz, parte 1

Telecom - Conversor de voz, parte 1

Primeira apresentação referente ao nosso trabalho para o curso de Telecomunicações na UFRJ.

Pedro Boueke

December 15, 2015
Tweet

More Decks by Pedro Boueke

Other Decks in Technology

Transcript

  1. Conversão de voz (como ser um Lorde Sith) Alunos: Pedro

    Boueke & Marcos Seefelder Telecomunicações - UFRJ - 2015.2
  2. Aplicativo ANDROID A ideia do projeto é criar um aplicativo

    android que seja capaz de realizar a conversão da voz em tempo real.
  3. Pitch = Altura ou Tom Forma como o ouvido humano

    percebe a frequência fundamental dos sons.
  4. Observando: Tempo x Altura Expandir o sinal no eixo do

    tempo = Diminuir a altura (mais grave) Áudio em câmera lenta.
  5. Problemas: Passagem pelo trato vocal Formantes ▪ Relações harmônicas entre

    os componentes não são mantidas; ▪ Exemplo: ▪ Fundamental & 2 Harmônicos ▪ 1 KHz; 2 KHz; 5 KHz <-original ▪ 2,5 KHz; 5 KHz; 12,5 KHz <-objetivo ▪ 2,5 KHz; 3,5 KHz; 6,5 KHz <-essa técnica
  6. E no caso geral? ▪ Opções para o extender: ▪

    Domínio do Tempo: ▪ Ex.: SOLA & PSOLA ▪ Domínio da Frequência: ▪ Ex.: Phase Vocoder O programa que utilizamos implementa o algoritmo SOLA. O tempo do áudio é modificado por reamostragem.
  7. Depois, basta reamostrar o áudio. Vantagem: ▪ Simples e em

    tempo-real Desvantagem ▪ Pode gerar artefatos de repetição.
  8. Delay Alguns exemplos: Vibrato, flanging, coro e eco Sua estrutura

    básica consiste na combinação de filtros FIR e IIR comb filters.
  9. Delay Ideia básica a cerca de filtros: FIR e IIR.

    Delay único atrasado em T O sinal atrasado é somado ao original Simula infinitas reflexões Gera uma série infinita de respostas O sinal circula com atraso T sendo retroalimentado, ocorrendo uma atenuação a cada ciclo. Eventuais compensações para tratar a aplificação resultante da estrutura.
  10. Delay Ainda poderíamos ainda aplicar modulações sobre determinados efeitos vibrato

    Os filtros são combinados para gerar um Universal Comb Filter. Vibrato, eco, flanger, coro e slapback possuem essa mesma estrutura básica, mas resultam em sons diferentes.
  11. Compresão É o ajuste do nível do sinal gerado por

    uma onda sonora. É utilizada para controlar o volume e suavidade da onda sonora.
  12. 1:1 2:1 4:1 ∞:1 0 -20 -20 0 +20 +20

    Output (dB) Input (dB) Atenuação (Ratio) Threshold Compressão Attack Release Knee Make-up Gain Output