Desenvolvimento de arquiteturas de redes neurais profundas para melhoria de qualidade em vídeos comprimidos
Resumen
O consumo de vídeos representa atualmente a maior parte do tráfego de dados na
Internet, impulsionado por tecnologias emergentes como realidade virtual, vídeos em
360° e resoluções cada vez mais altas, como 4K e 8K. Para viabilizar a transmissão
e o armazenamento desses conteúdos, são utilizados padrões de codificação de ví deo que reduzem significativamente o volume de dados. No entanto, esse processo
de compressão introduz artefatos visuais que comprometem a qualidade percebida
pelo usuário. Soluções de pós-processamento baseadas em aprendizado profundo
têm se mostrado eficazes para restaurar a qualidade visual. Sendo assim, o obje tivo principal desta Tese foi o desenvolvimento de soluções baseadas em arquiteturas
de redes neurais profundas para a melhoria da qualidade de vídeos comprimidos,
considerando diferentes padrões de codificação, cenários de compressão e níveis de
quantização. Três abordagens principais foram desenvolvidas. A primeira, denomi nada multi-codec, foi treinada com vídeos comprimidos por múltiplos codecs (HEVC,
VVC, AV1 e VP9) e apresentou boa generalização, com ganhos de ∆PSNR variando
entre 0,091 dB e 0,382 dB. A segunda abordagem, Multi-Domínio, tratou cada codec
como um domínio distinto durante o treinamento, o que ampliou o potencial de especi alização da rede. Essa solução alcançou resultados superiores, com ganhos médios
de ∆PSNR entre 0,228 dB e 0,764 dB, ou ainda reduções de até 16,50% na taxa
de bits (BD-Rate). A proposta final, 3D-STDF, incorporou convoluções tridimensionais
para capturar de forma mais integrada e eficiente as correlações espaço-temporais
entre quadros consecutivos. Essa arquitetura obteve os melhores resultados, com
∆PSNR de até 0,85 dB (modelo 3D-STDF-L) e ∆SSIM de 0,016 em QP 37, man tendo desempenho elevado em quantizações severas (como 0,420 dB em QP 47). O
modelo também apresentou BD-Rate de até -16,50%, superando outras arquiteturas
propostas e demonstrando equilíbrio entre desempenho e custo computacional. Estes
resultados demonstram que a Tese contribuiu com soluções generalizáveis e eficazes
para restauração de vídeos comprimidos, equilibrando desempenho, capacidade de
generalização e custo computacional.
Colecciones
Ítems relacionados
Mostrando ítems relacionados por Título, autor o materia.
-
A produção de vídeo estudantil na prática docente: uma forma de ensinar
Silva, Josias Pereira da (2014-04-15)A tecnologia diminui a distância entre as pessoas, possibilitando que usuários sem conhecimento técnico tornem-se produtores de conteúdos. Crianças e jovens contam com ferramentas como celular, máquina fotográfica e tablet ... -
Avaliação Objetiva de Qualidade de Imagem e Vídeo 3D Utilizando Técnicas de Aprendizado de Máquina
Bastos, Narúsci dos Santos (2023-02-27)Décadas de pesquisa em Avaliação de Qualidade de Imagem e Vídeo promo veram a criação de uma variedade de métricas objetivas de qualidade que se correlacionam fortemente com a qualidade subjetiva de imagem e vídeo. No ... -
Desenvolvimento de Soluções Baseadas em Aprendi zado de Máquina para Transcodificação Rápida de Vídeo ao Formato AOMedia Video 1.
Borges, Alex Machado (2023-03-15)Codificadores de vídeo são ferramentas importantíssimas atualmente para a vi abilização de aplicações comuns no nosso cotidiano, seja em aplicativos dedicados à transmissão de vídeo para entretenimento, como YouTube e ...

