Aprimoramento de qualidade de áudio por meio de Redes Generativas Adversárias Condicionais
Carregando...
Arquivos
Data
2023-12-19
Orientador(res)
Silva, Moacyr Alvim Horta Barbosa da
Métricas
Título da Revista
ISSN da Revista
Título de Volume
Resumo
Neste trabalho, exploramos o uso de Redes Generativas Adversárias Condicionais (CGANs), mais especificamente o modelo de Pix2Pix, para aprimorar a qualidade do áudio, com objetivo na remoção de ruídos. A metodologia envolve a criação de um banco de dados de pares de áudios: um puro, sem ruído, e outro idêntico, porém com a adição de um tipo específico de ruído. Ambos os áudios são então transformados em espectrogramas. A CGAN é treinada utilizando esses pares, habilitando-a a aprender a remover ruídos do áudio. Essa abordagem busca oferecer insights sobre a eficácia das CGANs na melhoria da qualidade do áudio, com potencial para ser adaptada a contextos específicos.
