Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)

Loose, Marta Breunig

dc.creator	Loose, Marta Breunig
dc.date.accessioned	2025-06-17T22:03:58Z
dc.date.available	2025-06-17T22:03:58Z
dc.date.issued	2025-03-28
dc.identifier.citation	LOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.	pt_BR
dc.identifier.uri	http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211
dc.description.abstract	There is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos online. During the COVID-19 pandemic, this context intensified, demonstrating the importance of network infrastructure and strategies for video compression. In this sense, the Versatile Video Coding (VVC) standard provides new tools that enable higher compression ratios than previous standards and greater adaptability to different types of videos. The VVC standard and other modern encoders are based on the hybrid model of prediction residual coding. Its main steps include intra-frame and inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along with these characteristics, VVC is highly complex, resulting in a very high video encoding time. Therefore, many challenges are still open to reduce this problem. In light of this, this thesis aims to present solutions for reducing the encoding time in inter-frame prediction of the VVC standard. In addition to providing context on the VVC standard and inter-frame prediction itself, concepts of machine learning are also presented, along with results from a dense experimental analysis and a systematic literature review. Finally, four optimization solutions focused on inter-frame prediction are presented: one heuristic based on statistical analysis and three other solutions employing machine learning. The heuristic focuses on unidirectional, bidirectional, and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on bidirectional achieved an average reduction of 92% in time per step and 2% in total encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding Decision Tree models focused on Affine to the previous solution, achieved a total time reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused on Affine optimization, using Decision Tree models, obtained an average reduction of 42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency. Therefore, these results demonstrate that the use of machine learning techniques are the most promising ways to achieve a reduction in interframe coordination time with minimal impacts on update efficiency.	pt_BR
dc.description.sponsorship	Sem bolsa	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal de Pelotas	pt_BR
dc.rights	OpenAccess	pt_BR
dc.subject	VVC	pt_BR
dc.subject	Interquadros	pt_BR
dc.subject	Tempo de codificação	pt_BR
dc.subject	Aprendizado de máquina	pt_BR
dc.subject	Inter-frame	pt_BR
dc.subject	Encoding time	pt_BR
dc.subject	Machine learning	pt_BR
dc.title	Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC)	pt_BR
dc.title.alternative	Encoding Time Reduction in Versatile Video Coding (VVC) Inter-frame Prediction	pt_BR
dc.type	doctoralThesis	pt_BR
dc.contributor.authorLattes	http://lattes.cnpq.br/3452656759670690	pt_BR
dc.contributor.advisorID	https://orcid.org/0000-0002-3421-5830	pt_BR
dc.contributor.advisorLattes	http://lattes.cnpq.br/9604735363839730	pt_BR
dc.contributor.advisor-co1	Corrêa, Guilherme Ribeiro
dc.contributor.advisor-co1Lattes	http://lattes.cnpq.br/1389878856201800	pt_BR
dc.contributor.advisor-co2	Sanchez, Gustavo Freitas
dc.contributor.advisor-co2Lattes	Não localizado.	pt_BR
dc.description.resumo	Atualmente há uma crescente demanda por vídeos digitais de altas resoluções, principalmente através da Internet. Diferentes plataformas permitem a transmissão, o compartilhamento e o consumo de vídeos online. Durante a pandemia pela COVID-19, esse contexto se intensificou, demonstrando a importância da infraes trutura de rede e de estratégias para a compressão de vídeos. Nesse sentido, o padrão Versatile Video Coding (VVC) fornece novas ferramentas que possibilitam maiores taxas de compressão, comparado aos padrões anteriores, além de maior adaptabilidade aos diferentes tipos de vídeos. O padrão VVC, assim como os demais codificadores atuais, é baseado no modelo híbrido de codificação de resíduos de predições. Suas principais etapas consistem na predição intraquadro e interquadros, Transformada, Quantização e Codificação de Entropia. Entretanto, juntamente com essas características, o VVC detém um alto grau de complexidade, acarretando em um tempo de codificação de vídeo muito alto. Sendo assim, são muitos os desafios que ainda estão em aberto, a fim de diminuir esse problema. Diante disso, esta tese visa apresentar soluções para a redução do tempo de codificação na predição interquadros do padrão VVC. Além da contextualização sobre o padrão VVC e da interquadros em si, também são apresentados conceitos de aprendizado de máquina, além de resultados de uma densa análise experimental e de uma revisão sistemática da literatura. Por fim, são apresentadas quatro soluções de otimização focadas na predição interquadros, sendo uma heurística, com base em análise estatística e outras três soluções que utilizam aprendizado de máquina. A heurística é focada nas predições Unidirecional, Bidirecional e Affine, sendo configurável para três pontos de operação. Essa solução obteve resultados de redução no tempo de codificação de até 26,5%, para as etapas Unidirecional e Bidirecional, e de até 22,71% para a etapa Affine, com perda de eficiência de codificação de 0,9% e 0,44%, respectivamente. A solução usando Random Forest focada na Bidirecional, alcançou 92% em média de redução de tempo na etapa e 2% no tempo total de codificação, com perda de eficiência de codificação de 0,75%. Já a solução ampliada, adicionando modelos Decision Tree focados na Affine à solução anterior, alcançou redução de tempo total de 3,9%, com perda de eficiência de codificação de 0,72%. Por fim, a solução focada na otimização da Affine, utilizando modelos Decision Tree, obteve redução média de 42,1% no tempo da etapa, 3,4% no tempo total de codificação, com impacto de 0,25% na eficiência de codificação. Esses resultados demonstram que a utilização de técnicas de aprendizado de máquina são caminhos muito promissores para alcançar redução no tempo de codificação da predição interquadros com impactos mínimos na eficiência de compressão.	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Computação	pt_BR
dc.publisher.initials	UFPel	pt_BR
dc.subject.cnpq	CIENCIAS EXATAS E DA TERRA	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.rights.license	CC BY-NC-SA	pt_BR
dc.contributor.advisor1	Agostini, Luciano Volcan
dc.subject.cnpq1	CIENCIA DA COMPUTACAO	pt_BR

Ficheros en el ítem

Nombre:: Tese_Marta Breunig Loose.pdf
Tamaño:: 9.138Mb
Formato:: PDF

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

PPGC: Dissertações e Teses [236]
Dissertações e teses.

Mostrar el registro sencillo del ítem