Mostrar registro simples

dc.creatorLabonde, Juliapt_BR
dc.date.accessioned2017-09-01T19:14:45Z
dc.date.available2017-09-01T19:14:45Z
dc.date.issued2016-02-19
dc.identifier.citationLABONDE, Julia. Aplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spp. 2016. 37f. Dissertação (Mestrado) - Programa de Pós-Graduação em Biotecnologia. Universidade Federal de Pelotas, Pelotas.pt_BR
dc.identifier.urihttp://repositorio.ufpel.edu.br/handle/prefix/3710
dc.description.abstractLeptospirosis is an infectious disease of global importance that affects humans and animals caused by pathogenic spirochetes belonging to the genus Leptospira. For epidemiological and clinical areas, it is essential that laboratories have the ability to identify and classify accurately species of Leptospira that cause disease, to take decisions consistent with respect to public health. In this study, we report for the first time the use of data mining tools for the purposes of strain classification of the genus Leptospira. Twenty-five loci related to 15 genes were selected and analyzed in 600 Leptospira draft genomes in order to search polymorphisms that could be used for the classification of each species. For this, data mining-based algorithms - C4.5, Naive Bayes and SVM - were used. All data mining computational algorithms used in this study showed accuracy levels above 93% for Leptospira classification species, however, the C4.5 algorithm achieve the best accuracy rating (95.6%) and presented the genes that contributed to the final result of the analysis. The same genomic database used by computer algorithms has been tested with the MLST methodology – most used technique for molecular classification of species of this genus - however, none of the tests show accuracy higher to 80%. Because data mining algorithm C4.5 achieve better accuracy than other algorithms, it can be concluded that C4.5 is a very promising data mining tool to classify species of Leptospira.pt_BR
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPESpt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal de Pelotaspt_BR
dc.rightsOpenAccesspt_BR
dc.subjectBiotecnologiapt_BR
dc.subjectLeptospirapt_BR
dc.subjectMineração de dadospt_BR
dc.subjectAlgoritmos computacionaispt_BR
dc.subjectData miningpt_BR
dc.subjectComputational algorithmspt_BR
dc.titleAplicação de algoritmos de mineração de dados para classificação molecular de Leptospira spppt_BR
dc.title.alternativeApplication of data mining algorithms for molecular classification of Leptospira spppt_BR
dc.typemasterThesispt_BR
dc.contributor.authorLatteshttp://lattes.cnpq.br/5606708840951379pt_BR
dc.contributor.advisorLatteshttp://lattes.cnpq.br/4649853685495071pt_BR
dc.description.resumoA leptospirose é uma doença infecciosa de importância mundial, que afeta humanos e animais, causada por espiroquetas patogênicas pertencentes ao gênero Leptospira. Para a área epidemiológica e clínica é fundamental que os laboratórios tenham a capacidade de identificar e classificar com precisão as espécies de Leptospira que causam doença, para que sejam tomadas decisões coerentes com relação à saúde pública. Neste estudo, nós relatamos pela primeira vez a utilização de ferramentas de mineração de dados para fins de classificação de cepas do gênero Leptospira. Vinte e cinco loci referentes a 15 genes foram selecionadas e analisados em 600 genomas rascunho de Leptospira, com o propósito de buscar polimorfismos que pudessem ser utilizados na classificação de cada espécie. Para isso, foram utilizados os algoritmos baseados em mineração de dados C4.5, Naive Bayes e Support Vector Machine. Todos os algoritmos computacionais de mineração de dados utilizados neste trabalho apresentaram valores de acurácia acima de 93% para classificação de Leptospira a nível de espécie, no entanto, o algoritmo C4.5, além de atingir a melhor acurácia de classificação (95.6%), também apresentou os genes que contribuíram para o resultado final da análise. O mesmo banco de dados genômicos utilizado pelos algoritmos computacionais foi submetido a testes com a metodologia MLST – técnica mais utilizada para classificação molecular de espécies deste gênero – no entanto, nenhum dos testes apresentou acurácia superior a 80%. Visto o algoritmo de mineração de dados C4.5 atingir uma acurácia superior aos outros algoritmos, pode-se concluir que C4.5 é uma ferramenta de mineração de dados bastante promissora para classificar espécies de Leptospira.pt_BR
dc.publisher.departmentCentro de Desenvolvimento Tecnológicopt_BR
dc.publisher.programPrograma de Pós-Graduação em Biotecnologiapt_BR
dc.publisher.initialsUFPelpt_BR
dc.subject.cnpqCNPQ::OUTROSpt_BR
dc.publisher.countryBrasilpt_BR
dc.contributor.advisor1Dellagostin, Odir Antôniopt_BR


Arquivos deste item

Thumbnail
Thumbnail
Thumbnail
Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples