Aprimoramento de qualidade de áudio por meio de Redes Generativas Adversárias Condicionais

Carregando...
Imagem de Miniatura
Data
2023-12-19

Orientador(res)

Silva, Moacyr Alvim Horta Barbosa da

Métricas

Título da Revista

ISSN da Revista

Título de Volume

Resumo
Neste trabalho, exploramos o uso de Redes Generativas Adversárias Condicionais (CGANs), mais especificamente o modelo de Pix2Pix, para aprimorar a qualidade do áudio, com objetivo na remoção de ruídos. A metodologia envolve a criação de um banco de dados de pares de áudios: um puro, sem ruído, e outro idêntico, porém com a adição de um tipo específico de ruído. Ambos os áudios são então transformados em espectrogramas. A CGAN é treinada utilizando esses pares, habilitando-a a aprender a remover ruídos do áudio. Essa abordagem busca oferecer insights sobre a eficácia das CGANs na melhoria da qualidade do áudio, com potencial para ser adaptada a contextos específicos.

Descrição

Área do Conhecimento

Avaliação

Revisão

Suplementado Por

Referenciado Por