dc.creator | Loose, Marta Breunig | |
dc.date.accessioned | 2025-06-17T22:03:58Z | |
dc.date.available | 2025-06-17T22:03:58Z | |
dc.date.issued | 2025-03-28 | |
dc.identifier.citation | LOOSE, Marta Breunig. Redução do Tempo de Codificação na Predição Inter quadros do Padrão Versatile Video Coding (VVC). Orientador: Luciano Volcan Agostini. 2025. 205 f. Tese (Doutorado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16211 | |
dc.description.abstract | There is a growing demand for high-resolution digital videos, mainly over the In ternet. Different platforms allow the transmission, sharing, and consumption of videos
online. During the COVID-19 pandemic, this context intensified, demonstrating the
importance of network infrastructure and strategies for video compression. In this
sense, the Versatile Video Coding (VVC) standard provides new tools that enable
higher compression ratios than previous standards and greater adaptability to different
types of videos. The VVC standard and other modern encoders are based on the
hybrid model of prediction residual coding. Its main steps include intra-frame and
inter-frame prediction, Transforms, Quantization, and Entropy coding. However, along
with these characteristics, VVC is highly complex, resulting in a very high video
encoding time. Therefore, many challenges are still open to reduce this problem. In
light of this, this thesis aims to present solutions for reducing the encoding time in
inter-frame prediction of the VVC standard. In addition to providing context on the
VVC standard and inter-frame prediction itself, concepts of machine learning are also
presented, along with results from a dense experimental analysis and a systematic
literature review. Finally, four optimization solutions focused on inter-frame prediction
are presented: one heuristic based on statistical analysis and three other solutions
employing machine learning. The heuristic focuses on unidirectional, bidirectional,
and Affine predictions, and can be configured for three operating points. This so lution achieved encoding time reductions of up to 26.5% for the unidirectional and
bidirectional stages and up to 22.71% for the Affine stage, with a coding efficiency
loss of 0.9% and 0.44%, respectively. The solution using Random Forest focused on
bidirectional achieved an average reduction of 92% in time per step and 2% in total
encoding time, with a coding efficiency loss of 0.75%. The expanded solution, adding
Decision Tree models focused on Affine to the previous solution, achieved a total time
reduction of 3.9%, with a coding efficiency loss of 0.72%. Finally, the solution focused
on Affine optimization, using Decision Tree models, obtained an average reduction of
42.1% in time per step, 3.4% in total time, with an impact of 0.25% on coding efficiency.
Therefore, these results demonstrate that the use of machine learning techniques are
the most promising ways to achieve a reduction in interframe coordination time with
minimal impacts on update efficiency. | pt_BR |
dc.description.sponsorship | Sem bolsa | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | VVC | pt_BR |
dc.subject | Interquadros | pt_BR |
dc.subject | Tempo de codificação | pt_BR |
dc.subject | Aprendizado de máquina | pt_BR |
dc.subject | Inter-frame | pt_BR |
dc.subject | Encoding time | pt_BR |
dc.subject | Machine learning | pt_BR |
dc.title | Redução do Tempo de Codificação na Predição Interquadros do Padrão Versatile Video Coding (VVC) | pt_BR |
dc.title.alternative | Encoding Time Reduction in Versatile Video Coding (VVC) Inter-frame Prediction | pt_BR |
dc.type | doctoralThesis | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/3452656759670690 | pt_BR |
dc.contributor.advisorID | https://orcid.org/0000-0002-3421-5830 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/9604735363839730 | pt_BR |
dc.contributor.advisor-co1 | Corrêa, Guilherme Ribeiro | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/1389878856201800 | pt_BR |
dc.contributor.advisor-co2 | Sanchez, Gustavo Freitas | |
dc.contributor.advisor-co2Lattes | Não localizado. | pt_BR |
dc.description.resumo | Atualmente há uma crescente demanda por vídeos digitais de altas resoluções,
principalmente através da Internet. Diferentes plataformas permitem a transmissão,
o compartilhamento e o consumo de vídeos online. Durante a pandemia pela
COVID-19, esse contexto se intensificou, demonstrando a importância da infraes trutura de rede e de estratégias para a compressão de vídeos. Nesse sentido, o
padrão Versatile Video Coding (VVC) fornece novas ferramentas que possibilitam
maiores taxas de compressão, comparado aos padrões anteriores, além de maior
adaptabilidade aos diferentes tipos de vídeos. O padrão VVC, assim como os demais
codificadores atuais, é baseado no modelo híbrido de codificação de resíduos de
predições. Suas principais etapas consistem na predição intraquadro e interquadros,
Transformada, Quantização e Codificação de Entropia. Entretanto, juntamente com
essas características, o VVC detém um alto grau de complexidade, acarretando em
um tempo de codificação de vídeo muito alto. Sendo assim, são muitos os desafios
que ainda estão em aberto, a fim de diminuir esse problema. Diante disso, esta
tese visa apresentar soluções para a redução do tempo de codificação na predição
interquadros do padrão VVC. Além da contextualização sobre o padrão VVC e da
interquadros em si, também são apresentados conceitos de aprendizado de máquina,
além de resultados de uma densa análise experimental e de uma revisão sistemática
da literatura. Por fim, são apresentadas quatro soluções de otimização focadas na
predição interquadros, sendo uma heurística, com base em análise estatística e
outras três soluções que utilizam aprendizado de máquina. A heurística é focada nas
predições Unidirecional, Bidirecional e Affine, sendo configurável para três pontos de
operação. Essa solução obteve resultados de redução no tempo de codificação de
até 26,5%, para as etapas Unidirecional e Bidirecional, e de até 22,71% para a etapa
Affine, com perda de eficiência de codificação de 0,9% e 0,44%, respectivamente.
A solução usando Random Forest focada na Bidirecional, alcançou 92% em média
de redução de tempo na etapa e 2% no tempo total de codificação, com perda de
eficiência de codificação de 0,75%. Já a solução ampliada, adicionando modelos
Decision Tree focados na Affine à solução anterior, alcançou redução de tempo total
de 3,9%, com perda de eficiência de codificação de 0,72%. Por fim, a solução focada
na otimização da Affine, utilizando modelos Decision Tree, obteve redução média
de 42,1% no tempo da etapa, 3,4% no tempo total de codificação, com impacto de
0,25% na eficiência de codificação. Esses resultados demonstram que a utilização de
técnicas de aprendizado de máquina são caminhos muito promissores para alcançar
redução no tempo de codificação da predição interquadros com impactos mínimos na
eficiência de compressão. | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.rights.license | CC BY-NC-SA | pt_BR |
dc.contributor.advisor1 | Agostini, Luciano Volcan | |
dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |