Mostrar registro simples

dc.creatorJahnke, Matheus da Silva
dc.date.accessioned2025-07-21T11:43:02Z
dc.date.available2025-07-21
dc.date.available2025-07-21T11:43:02Z
dc.date.issued2025-05-16
dc.identifier.citationJAHNKE, Matheus da Silva. Predição de Light Fields Utilizando Redes Neurais Convolucionais. Orientador: Bruno Zatt. 2025. 48 f. Dissertação (Mestrado em Ciência da Computação) - Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025.pt_BR
dc.identifier.urihttp://guaiaca.ufpel.edu.br/xmlui/handle/prefix/16642
dc.description.abstractDigital images are extremely commons and used in myriad applications. How ever, their bidimensional structure is insufficient for some applications as, for instance, representing immersive environments, post-capture refocus and illumination. Trying to solve this limitation, other representations like point clouds, 3d and omnidirectional images and light fields(LFs)– the last being the focus of this work. Light fields are, essentially, quadridimensional images. Given a set de points in a plane– referred as the sensor plane– LFs describe, for every incidence direction, a possibly different intensity. This can be interpreted in many ways, one of them being a bidimensional matrix where every entry is a bidimensional image, or, in this context, a sub-aperture image(SAI). Given they are quadridimensional structures, the volume of data involved to store and transmit them require a efficient compression. Various proposals were made, in a broader view, they can be classified in two big groups: those who organize the SAIs in a pseudo temporal sequence– which is then compressed using some video encoder, for instance, the High Efficiency Video Coding(HEVC)– and those which directly explore the quadrimentional nature of LFs. Neural networks were already used with success to a myriad of problems, including the processing of visual signals: dentification of written numbers, detection and identification of objects, facial recognition, amongst others. In particular, intra-frame prediction for compression of images and video approaches were developed using neural networks. With that in mind, this work proposes the creation of intra-LF prediction models using convolutional neural networks.pt_BR
dc.description.sponsorshipFundação de Amparo à Pesquisa do Estado do Rio Grande do Sul - FAPERGSpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectRedes Neurais Convolucionaispt_BR
dc.subjectLight Fieldspt_BR
dc.subjectCompressãopt_BR
dc.subjectConvolutional Neural Networkspt_BR
dc.titlePredição de Light Fields Utilizando Redes Neurais Convolucionaispt_BR
dc.title.alternativeLight field prediction using neural networkspt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/9901662050753096pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8251926321102019pt_BR
dc.description.resumoImagens digitais são extremamente comuns e usadas em inúmeras aplicações atuais. No entanto, sua estrutura bidimensional é insuficiente para algumas aplicações como, por exemplo, representação de ambientes imersivos, mudança de foco e iluminação pós-captura, entre outras. Buscando tratar essa limitação, estuda-se outras representações como nuvens de pontos, imagens tridimensionais, imagens omnidirecionais e light fields (LFs)– este sendo o foco deste trabalho. Light Fields são, essencialmente, imagens quadrimensionais. Dado um conjunto de pontos em um plano– referido como plano do sensor– LFs descrevem, para cada direção de incidência, uma intensidade diferente. Isso pode ser interpretado de vá rias formas, uma delas é como uma matriz bidimensional onde cada elemento é uma imagem bidimensional ou, nesse contexto, uma sub-aperture image (SAI). Dentro das SAIs, variamos as dimensões espaciais de um LF, enquanto que, ao variar as dimensões angulares, escolhemos uma SAI ou outra. Como eles são estruturas quadrimensionais, o volume de dados necessário para armazená-los e transmiti-los exige uma compressão eficiente. Várias propostas foram feitas, em geral podendo ser classificadas em dois grandes grupos: aquelas que organizam as SAIs em uma sequência pseudo temporal– que então é comprimida utilizando algum codificador de vídeo, tal como o High Efficiency Video Coding (HEVC)– tratando uma matriz de SAIs como uma sequência de SAIs; e aquelas que exploram diretamente a natureza quadridimensional de um LF, tal como o JPEG-Pleno. Umas das técnicas utilizadas para melhorar o desempenho da compressão é a predição. Ou seja, a partir de dados que foram (de)codificados anteriormente, tenta-se prever os próximos dados. Quanto melhor for a predição, menores serão os resíduos– a diferença entre o que foi predito com o que realmente é– deverão ser codificados e maior será a eficiência de codificação. O JPEG-Pleno não utiliza predição intraquadro, mostrando que existe uma área a ser investigada. Redes neurais já foram utilizadas com sucesso para uma miríade de problemas, inclusive no processamento de sinais visuais: identificação de números escritos, detecção e identificação de objetos, reconhecimento facial, entre outros. Em particular, foram desenvolvidas com elas abordagens de predição intra-quadro para compressão de imagens e vídeos. Com isso em mente, este trabalho propôs a criação de modelos de predição intra-LF utilizando redes neurais convolucionais.pt_BR
dc.publisher.programPrograma de Pós-Graduação em Computaçãopt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCIENCIAS EXATAS E DA TERRApt_BR
dc.publisher.countryBrasilpt_BR
dc.rights.licenseCC BY-NC-SApt_BR
dc.contributor.advisor1Zatt, Bruno
dc.subject.cnpq1CIENCIA DA COMPUTACAOpt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples