Mostrar el registro sencillo del ítem
Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)
dc.creator | Loose, Marta Breunig | |
dc.date.accessioned | 2025-06-17T22:03:58Z | |
dc.date.available | 2025-06-17T22:03:58Z | |
dc.date.issued | 2025-03-28 | |
dc.identifier.citation | LOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211 | |
dc.description.abstract | There is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos online. During the COVID-19 pandemic, this context intensified, demonstrating the importance of network infrastructure and strategies for video compression. In this sense, the Versatile Video Coding (VVC) standard provides new tools that enable higher compression ratios than previous standards and greater adaptability to different types of videos. The VVC standard and other modern encoders are based on the hybrid model of prediction residual coding. Its main steps include intra-frame and inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along with these characteristics, VVC is highly complex, resulting in a very high video encoding time. Therefore, many challenges are still open to reduce this problem. In light of this, this thesis aims to present solutions for reducing the encoding time in inter-frame prediction of the VVC standard. In addition to providing context on the VVC standard and inter-frame prediction itself, concepts of machine learning are also presented, along with results from a dense experimental analysis and a systematic literature review. Finally, four optimization solutions focused on inter-frame prediction are presented: one heuristic based on statistical analysis and three other solutions employing machine learning. The heuristic focuses on unidirectional, bidirectional, and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on bidirectional achieved an average reduction of 92% in time per step and 2% in total encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding Decision Tree models focused on Affine to the previous solution, achieved a total time reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused on Affine optimization, using Decision Tree models, obtained an average reduction of 42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency. Therefore, these results demonstrate that the use of machine learning techniques are the most promising ways to achieve a reduction in interframe coordination time with minimal impacts on update efficiency. | pt_BR |
dc.description.sponsorship | Sem bolsa | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | VVC | pt_BR |
dc.subject | Interquadros | pt_BR |
dc.subject | Tempo de codificação | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Inter-frame | pt_BR |
dc.subject | Encoding time | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.title | Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC) | pt_BR |
dc.title.alternative | Encoding Time Reduction in Versatile Video Coding (VVC) Inter-frame Prediction | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/3452656759670690 | pt_BR |
dc.contributor.advisorID | https://orcid.org/0000-0002-3421-5830 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9604735363839730 | pt_BR |
dc.contributor.advisor-co1 | Corrêa, Guilherme Ribeiro | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
dc.contributor.advisor-co2 | Sanchez, Gustavo Freitas | |
dc.contributor.advisor-co2Lattes | Não localizado. | pt_BR |
dc.description.resumo | Atualmente há uma crescente demanda por vídeos digitais de altas resoluções, principalmente através da Internet. Diferentes plataformas permitem a transmissão, o compartilhamento e o consumo de vídeos online. Durante a pandemia pela COVID-19, esse contexto se intensificou, demonstrando a importância da infraes trutura de rede e de estratégias para a compressão de vídeos. Nesse sentido, o padrão Versatile Video Coding (VVC) fornece novas ferramentas que possibilitam maiores taxas de compressão, comparado aos padrões anteriores, além de maior adaptabilidade aos diferentes tipos de vídeos. O padrão VVC, assim como os demais codificadores atuais, é baseado no modelo híbrido de codificação de resíduos de predições. Suas principais etapas consistem na predição intraquadro e interquadros, Transformada, Quantização e Codificação de Entropia. Entretanto, juntamente com essas características, o VVC detém um alto grau de complexidade, acarretando em um tempo de codificação de vídeo muito alto. Sendo assim, são muitos os desafios que ainda estão em aberto, a fim de diminuir esse problema. Diante disso, esta tese visa apresentar soluções para a redução do tempo de codificação na predição interquadros do padrão VVC. Além da contextualização sobre o padrão VVC e da interquadros em si, também são apresentados conceitos de aprendizado de máquina, além de resultados de uma densa análise experimental e de uma revisão sistemática da literatura. Por fim, são apresentadas quatro soluções de otimização focadas na predição interquadros, sendo uma heurística, com base em análise estatística e outras três soluções que utilizam aprendizado de máquina. A heurística é focada nas predições Unidirecional, Bidirecional e Affine, sendo configurável para três pontos de operação. Essa solução obteve resultados de redução no tempo de codificação de até 26,5%, para as etapas Unidirecional e Bidirecional, e de até 22,71% para a etapa Affine, com perda de eficiência de codificação de 0,9% e 0,44%, respectivamente. A solução usando Random Forest focada na Bidirecional, alcançou 92% em média de redução de tempo na etapa e 2% no tempo total de codificação, com perda de eficiência de codificação de 0,75%. Já a solução ampliada, adicionando modelos Decision Tree focados na Affine à solução anterior, alcançou redução de tempo total de 3,9%, com perda de eficiência de codificação de 0,72%. Por fim, a solução focada na otimização da Affine, utilizando modelos Decision Tree, obteve redução média de 42,1% no tempo da etapa, 3,4% no tempo total de codificação, com impacto de 0,25% na eficiência de codificação. Esses resultados demonstram que a utilização de técnicas de aprendizado de máquina são caminhos muito promissores para alcançar redução no tempo de codificação da predição interquadros com impactos mínimos na eficiência de compressão. | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.rights.license | CC BY-NC-SA | pt_BR |
dc.contributor.advisor1 | Agostini, Luciano Volcan | |
dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |
Ficheros en el ítem
Este ítem aparece en la(s) siguiente(s) colección(ones)
-
PPGC: Dissertações e Teses [230]
Dissertações e teses.