dc.creator | Pereira, Alejandro da Silva | |
dc.date.accessioned | 2025-08-15T10:55:38Z | |
dc.date.available | 2025-08-15 | |
dc.date.available | 2025-08-15T10:55:38Z | |
dc.date.issued | 2025-07-07 | |
dc.identifier.citation | PEREIRA, Alejandro da Silva. Uma nova abordagem baseada em modelos do tipo encoder-decoder para segmentação semântica de lesões de fundo associadas à retinopatia diabética. Orientador: Marilton Sanchotene de Aguiar. 2025. 92 f. Dissertação (Mestrado em Ciência da Computação) – Centro de Desenvolvimento Tecnológico, Universidade Federal de Pelotas, Pelotas, 2025. | pt_BR |
dc.identifier.uri | http://guaiaca.ufpel.edu.br/xmlui/handle/prefix/17064 | |
dc.description.abstract | Diabetes is a chronic disease that affects the body’s ability to produce or use in sulin properly. Researchers estimate that approximately 537 million adults worldwide
are affected by the disease, representing 10.5% of the population between 20 and 79
years old, and they project this number will reach 783 million by 2045. In this global
context, Brazil occupies the fourth position in prevalence, with approximately 13.7
million cases. Diabetic Retinopathy (DR) is one of the main microvascular complica tions of diabetes and one of the leading causes of blindness in adults of working age.
Since specialists usually diagnose DR by analyzing fundus images and identifying
lesions such as Hard Exudates, Hemorrhages, Soft Exudates, and Microaneurysms,
researchers can use deep learning approaches to segment these lesions. This work
aims to propose a new approach to improve the accuracy in the segmentation of these
lesions, which will contribute to a more effective diagnosis of the disease and facilitate
the process of annotating images in new DR datasets. The proposed approach com bined the U-Net++, Attention U-Net, and R2U-Net architectures as ensembles. This
work applied pre-processing, data augmentation, and pre-training steps to improve
the extraction of lesion features. The experiments used two public RD datasets. The
DDR dataset supported training, adjustment, and evaluation of the models composing
the proposed approach, achieving an mDC of 63.75%, an mIoU of 83.18% in the
validation stage, and an mDC of 66.47% and an mIoU of 81.15% in the testing
stage. To evaluate the generalization capacity of the proposed approach on different
DR datasets, this study employed the IDRiD dataset, reaching an mIoU of 84.36%
in the validation stage and 82.84% in the testing stage. The results obtained were
superior to those presented in related works, evidencing that integrating ensembles of
encoder-decoder type models, combined with pre-processing, data augmentation, and
pre-training steps, represents an effective strategy for segmenting fundus lesions. | pt_BR |
dc.description.sponsorship | Sem bolsa | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de Pelotas | pt_BR |
dc.rights | OpenAccess | pt_BR |
dc.subject | Retinopatia diabética | pt_BR |
dc.subject | Imagens de fundo | pt_BR |
dc.subject | Segmentação de lesões | pt_BR |
dc.subject | Aprendizado profundo | pt_BR |
dc.subject | Diabetic retinopathy | pt_BR |
dc.subject | Fundus images | pt_BR |
dc.subject | Lesions segmentation | pt_BR |
dc.subject | Deep learning | pt_BR |
dc.title | Uma nova abordagem baseada em modelos do tipo encoder-decoder para segmentação semântica de lesões de fundo associadas à retinopatia diabética | pt_BR |
dc.title.alternative | A novel encoder-decoder model-based approach for semantic segmentation of fundus lesions associated with diabetic retinopathy | pt_BR |
dc.type | masterThesis | pt_BR |
dc.contributor.authorID | https://orcid.org/0009-0008-1422-6365 | pt_BR |
dc.contributor.authorLattes | http://lattes.cnpq.br/0512513672119043 | pt_BR |
dc.contributor.advisorID | https://orcid.org/0000-0002-5247-6022 | pt_BR |
dc.contributor.advisorLattes | http://lattes.cnpq.br/3499616508280892 | pt_BR |
dc.contributor.advisor-co1 | Santos, Carlos Alexandre Silva dos | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/2197968274601332 | pt_BR |
dc.description.resumo | O diabetes é uma doença crônica que compromete a capacidade do corpo de
produzir ou utilizar insulina de forma adequada. Atualmente, estima-se que aproxi madamente 537 milhões de adultos em todo o mundo sejam afetados pela doença, o
que representa 10,5% da população entre 20 e 79 anos, com projeção de atingir 783
milhões até 2045. Nesse contexto global, o Brasil ocupa a quarta posição em preva lência, com cerca de 13,7 milhões de casos. A Retinopatia Diabética (RD) é uma das
principais complicações microvasculares do diabetes e constitui uma das principais
causas de cegueira em adultos em idade produtiva. Como o diagnóstico da RD é
geralmente realizado por meio da análise de imagens do fundo de olho – nas quais
se identificam lesões como Exsudatos Duros, Hemorragias, Exsudatos Algodonosos
e Microaneurismas –, é possível empregar abordagens baseadas em aprendizado
profundo para a segmentação dessas lesões. O objetivo deste trabalho é propor
uma nova abordagem para aprimorar a precisão na segmentação dessas lesões,
contribuindo para um diagnóstico mais eficaz da doença e facilitando o processo de
anotação de imagens em novos conjuntos de dados de RD. A abordagem proposta
tem como base as arquiteturas U-Net++, Attention U-Net e R2U-Net, integradas por
meio de ensembles. Além disso, foram aplicadas etapas de pré-processamento,
aumento de dados e pré-treinamento com o objetivo de melhorar a extração das
características das lesões. Os experimentos utilizaram dois conjuntos de dados
públicos de RD. O conjunto DDR foi empregado para treinar, ajustar e avaliar os
modelos que compõem a abordagem proposta, alcançando mDC de 63,75% e mIoU
de 83,18% na etapa de validação, e mDC de 66,47% e mIoU de 81,15% na etapa
de teste. O conjunto IDRiD foi utilizado para avaliar a capacidade de generalização
da abordagem proposta em diferentes bases de dados de RD, apresentando mIoU
de 84,36% na etapa de validação e 82,84% na etapa de teste. Os resultados
obtidos superaram os apresentados em trabalhos relacionados, evidenciando que a
integração de ensembles de modelos do tipo encoder-decoder, combinada às etapas
de pré-processamento, aumento de dados e pré-treinamento, constitui uma estratégia
eficaz para a segmentação de lesões no fundo de olho. | pt_BR |
dc.publisher.program | Programa de Pós-Graduação em Computação | pt_BR |
dc.publisher.initials | UFPel | pt_BR |
dc.subject.cnpq | CIENCIAS EXATAS E DA TERRA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.rights.license | CC BY-NC-SA | pt_BR |
dc.contributor.advisor1 | Aguiar, Marilton Sanchotene de | |
dc.subject.cnpq1 | CIENCIA DA COMPUTACAO | pt_BR |