Hipercubos booleanos aplicados na análise do código genético e entropia aplicada em sequências de DNA

dc.contributor.advisorOliveira, Anderson José de
dc.contributor.authorRibeiro, Bianca Lapa
dc.contributor.refereeAlbuquerque, Clarice Dias de
dc.contributor.refereeNogueira, Denismar Alves
dc.date.accessioned2025-09-11T19:11:38Z
dc.date.available2025-09-11T19:11:38Z
dc.date.issued2025-02-10
dc.description.abstractA modelagem matemática do código genético e um estudo que possibilita dentre outros aspectos a análise, a interpretação e a caracterização de propriedades associadas aos aminoácidos e possíveis interferências em diversas situações, como o caso das mutações genéticas. Diagramas de Hasse, códigos de Gray e hipercubos booleanos representam algumas ferramentas matemáticas que podem ser empregadas nesse estudo. O código genético consiste na associação das trincas encontradas no RNA mensageiro, formadas pelas bases nitrogenadas e os aminoácidos que estão nas proteínas. A partir do mapeamento das bases nitrogenadas com a estrutura algébrica do anel Z4 = {0, 1, 2, 3}, ´e possível obter 24 permutações, organizadas em três rotulamentos (A, B e C). Ademais, o código genético pode ser representado por um hipercubo booleano 6-dimensional, construído a partir da tabela do código de Gray. Outro aspecto a ser considerado é a entropia da informação, a qual auxilia a identificar padrões, tanto dentro de uma sequência genética específica, quanto entre diferentes sequências genéticas, uma vez que, conhecida a entropia, é possível gerar métodos para que uma mensagem chegue ao destino com confiabilidade. Nesse sentido, é possível aplicar esse conceito da base de informação, o DNA, até a síntese completa de uma proteína. Em Teoria da Informação, a entropia é obtida em relação a uma sequência, um modelo e a distribuição de probabilidades fornecida pelo modelo, sendo utilizadas as Cadeias de Markov. O objetivo deste trabalho é apresentar uma caracterização do código genético por meio de estruturas matemáticas, como o código de Gray e o hipercubo booleano, al´em de analisar sequências de DNA a partir de elementos estatísticos, em particular, a entropia. A metodologia adotada neste trabalho baseia-se em uma natureza qualitativa e quantitativa, visando um estudo descritivo aplicado. A pesquisa foi dividida em cinco etapas: 1) fundamentação teórica: elementos de Biologia, Álgebra e Teoria da Informação; 2) compreensão das construções dos diagramas de Hasse e dos códigos de Gray, utilizando permutações associadas aos três rotulamentos (A, B e C) do código genético; 3) construção de hipercubos booleanos, a partir de tabelas dos códigos de Gray; 4) análise das construções realizadas; 5) análise das possibilidades de aplicações de elementos da Teoria da Informação associados a problemas biológicos, como a entropia. Com isso, buscou-se compreender as conexões existentes entre Biologia, Álgebra, Geometria e Engenharia, além de analisar as possibilidades de aplicação e possíveis contribuições da Teoria da Informação no estudo e analise do código genético e em sequências de DNA.
dc.description.abstract2Mathematical modeling of the genetic code is a study that enables, among other aspects, the analysis, interpretation and characterization of properties associated with amino acids and possible interferences in various situations, such as genetic mutations. Hasse diagrams, Gray codes and Boolean hypercubes represent some mathematical tools that can be used in this study. The genetic code consists of the association of triplets found in messenger RNA, formed by nitrogenous bases and the amino acids that are in proteins. From the mapping of the nitrogenous bases with the algebraic structure of the ring Z4 = {0, 1, 2, 3}, it is possible to obtain 24 permutations, organized into three labelings (A, B and C). In addition, the genetic code can be represented by a 6-dimensional Boolean hypercube, constructed from the Gray code table. Another aspect to be considered is the entropy of information, which helps to identify patterns, both within a specific genetic sequence and between different genetic sequences, since, once entropy is known, it is possible to generate methods for a message to reach its destination reliably. In this sense, it is possible to apply this concept from an information base, DNA, to the complete description of a protein. In Information Theory, entropy is obtained in relation to a sequence, a model and the probability distribution provided by the model, being used as Markov Chains. The aim of this work is to present a characterization of the genetic code through mathematical structures, such as the Gray code and the Boolean hypercube, in addition to analyzing DNA sequences from statistical elements, in particular, the entropy. The methodology is based on a qualitative and quantitative nature, aiming for descriptive study and applied approach. The research will be divided into five steps: 1) theoretical basis: elements of Biology and Algebra and Information Theory; 2) understanding the constructions of Hasse diagrams and Gray codes, using permutations associated with three labelings (A, B and C) of the genetic code; 3) construction of Boolean hypercubes, from the tables of Gray codes; 4) analysis of the constructions made; 5) analysis of the proposed applications of elements of Information Theory associated with biological problems, such as the entropy. With this, we seek to understand the existing connections among Biology, Algebra, Geometry and Engineering, in addition to analyzing the possibilities of application and possible contributions of Information Theory in the study and analysis of the genetic code in DNA sequences.
dc.description.physical97
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES
dc.identifier.lattesAdvisorhttp://lattes.cnpq.br/1349156075777095
dc.identifier.lattesAuthorhttp://lattes.cnpq.br/9542504610783451
dc.identifier.urihttps://repositorio.unifal-mg.edu.br/handle/123456789/2956
dc.language.isopt
dc.publisher.campiSede
dc.publisher.courseMestrado em Estatística Aplicada e Biometria
dc.publisher.departmentInstituto de Ciências Exatas
dc.publisher.initialsUNIFAL-MG
dc.publisher.institutionUniversidade Federal de Alfenas
dc.publisher.programPrograma de Pós-Graduação em Estatística Aplicada e Biometria
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 Brazilen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/br/
dc.subject.cnpqCiências Exatas e da Terra
dc.subject.cnpqCiências Exatas e da Terra::Probabilidade e Estatística::Estatística
dc.subject.enInformation theory
dc.subject.enMarkov chains
dc.subject.enGray code
dc.subject.enAmino acids.
dc.subject.pt-BRTeoria da informação
dc.subject.pt-BRCadeias de Markov
dc.subject.pt-BRCódigo de Gray
dc.subject.pt-BRAminoácido
dc.titleHipercubos booleanos aplicados na análise do código genético e entropia aplicada em sequências de DNA
dc.typeDissertação

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertacao_de_Bianca_Lapa_Ribeiro.pdf
Tamanho:
3.01 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.89 KB
Formato:
Item-specific license agreed upon to submission
Descrição: