Hipercubos booleanos aplicados na análise do código genético e entropia aplicada em sequências de DNA
| dc.contributor.advisor | Oliveira, Anderson José de | |
| dc.contributor.author | Ribeiro, Bianca Lapa | |
| dc.contributor.referee | Albuquerque, Clarice Dias de | |
| dc.contributor.referee | Nogueira, Denismar Alves | |
| dc.date.accessioned | 2025-09-11T19:11:38Z | |
| dc.date.available | 2025-09-11T19:11:38Z | |
| dc.date.issued | 2025-02-10 | |
| dc.description.abstract | A modelagem matemática do código genético e um estudo que possibilita dentre outros aspectos a análise, a interpretação e a caracterização de propriedades associadas aos aminoácidos e possíveis interferências em diversas situações, como o caso das mutações genéticas. Diagramas de Hasse, códigos de Gray e hipercubos booleanos representam algumas ferramentas matemáticas que podem ser empregadas nesse estudo. O código genético consiste na associação das trincas encontradas no RNA mensageiro, formadas pelas bases nitrogenadas e os aminoácidos que estão nas proteínas. A partir do mapeamento das bases nitrogenadas com a estrutura algébrica do anel Z4 = {0, 1, 2, 3}, ´e possível obter 24 permutações, organizadas em três rotulamentos (A, B e C). Ademais, o código genético pode ser representado por um hipercubo booleano 6-dimensional, construído a partir da tabela do código de Gray. Outro aspecto a ser considerado é a entropia da informação, a qual auxilia a identificar padrões, tanto dentro de uma sequência genética específica, quanto entre diferentes sequências genéticas, uma vez que, conhecida a entropia, é possível gerar métodos para que uma mensagem chegue ao destino com confiabilidade. Nesse sentido, é possível aplicar esse conceito da base de informação, o DNA, até a síntese completa de uma proteína. Em Teoria da Informação, a entropia é obtida em relação a uma sequência, um modelo e a distribuição de probabilidades fornecida pelo modelo, sendo utilizadas as Cadeias de Markov. O objetivo deste trabalho é apresentar uma caracterização do código genético por meio de estruturas matemáticas, como o código de Gray e o hipercubo booleano, al´em de analisar sequências de DNA a partir de elementos estatísticos, em particular, a entropia. A metodologia adotada neste trabalho baseia-se em uma natureza qualitativa e quantitativa, visando um estudo descritivo aplicado. A pesquisa foi dividida em cinco etapas: 1) fundamentação teórica: elementos de Biologia, Álgebra e Teoria da Informação; 2) compreensão das construções dos diagramas de Hasse e dos códigos de Gray, utilizando permutações associadas aos três rotulamentos (A, B e C) do código genético; 3) construção de hipercubos booleanos, a partir de tabelas dos códigos de Gray; 4) análise das construções realizadas; 5) análise das possibilidades de aplicações de elementos da Teoria da Informação associados a problemas biológicos, como a entropia. Com isso, buscou-se compreender as conexões existentes entre Biologia, Álgebra, Geometria e Engenharia, além de analisar as possibilidades de aplicação e possíveis contribuições da Teoria da Informação no estudo e analise do código genético e em sequências de DNA. | |
| dc.description.abstract2 | Mathematical modeling of the genetic code is a study that enables, among other aspects, the analysis, interpretation and characterization of properties associated with amino acids and possible interferences in various situations, such as genetic mutations. Hasse diagrams, Gray codes and Boolean hypercubes represent some mathematical tools that can be used in this study. The genetic code consists of the association of triplets found in messenger RNA, formed by nitrogenous bases and the amino acids that are in proteins. From the mapping of the nitrogenous bases with the algebraic structure of the ring Z4 = {0, 1, 2, 3}, it is possible to obtain 24 permutations, organized into three labelings (A, B and C). In addition, the genetic code can be represented by a 6-dimensional Boolean hypercube, constructed from the Gray code table. Another aspect to be considered is the entropy of information, which helps to identify patterns, both within a specific genetic sequence and between different genetic sequences, since, once entropy is known, it is possible to generate methods for a message to reach its destination reliably. In this sense, it is possible to apply this concept from an information base, DNA, to the complete description of a protein. In Information Theory, entropy is obtained in relation to a sequence, a model and the probability distribution provided by the model, being used as Markov Chains. The aim of this work is to present a characterization of the genetic code through mathematical structures, such as the Gray code and the Boolean hypercube, in addition to analyzing DNA sequences from statistical elements, in particular, the entropy. The methodology is based on a qualitative and quantitative nature, aiming for descriptive study and applied approach. The research will be divided into five steps: 1) theoretical basis: elements of Biology and Algebra and Information Theory; 2) understanding the constructions of Hasse diagrams and Gray codes, using permutations associated with three labelings (A, B and C) of the genetic code; 3) construction of Boolean hypercubes, from the tables of Gray codes; 4) analysis of the constructions made; 5) analysis of the proposed applications of elements of Information Theory associated with biological problems, such as the entropy. With this, we seek to understand the existing connections among Biology, Algebra, Geometry and Engineering, in addition to analyzing the possibilities of application and possible contributions of Information Theory in the study and analysis of the genetic code in DNA sequences. | |
| dc.description.physical | 97 | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES | |
| dc.identifier.lattesAdvisor | http://lattes.cnpq.br/1349156075777095 | |
| dc.identifier.lattesAuthor | http://lattes.cnpq.br/9542504610783451 | |
| dc.identifier.uri | https://repositorio.unifal-mg.edu.br/handle/123456789/2956 | |
| dc.language.iso | pt | |
| dc.publisher.campi | Sede | |
| dc.publisher.course | Mestrado em Estatística Aplicada e Biometria | |
| dc.publisher.department | Instituto de Ciências Exatas | |
| dc.publisher.initials | UNIFAL-MG | |
| dc.publisher.institution | Universidade Federal de Alfenas | |
| dc.publisher.program | Programa de Pós-Graduação em Estatística Aplicada e Biometria | |
| dc.rights | Attribution-NonCommercial-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/br/ | |
| dc.subject.cnpq | Ciências Exatas e da Terra | |
| dc.subject.cnpq | Ciências Exatas e da Terra::Probabilidade e Estatística::Estatística | |
| dc.subject.en | Information theory | |
| dc.subject.en | Markov chains | |
| dc.subject.en | Gray code | |
| dc.subject.en | Amino acids. | |
| dc.subject.pt-BR | Teoria da informação | |
| dc.subject.pt-BR | Cadeias de Markov | |
| dc.subject.pt-BR | Código de Gray | |
| dc.subject.pt-BR | Aminoácido | |
| dc.title | Hipercubos booleanos aplicados na análise do código genético e entropia aplicada em sequências de DNA | |
| dc.type | Dissertação |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertacao_de_Bianca_Lapa_Ribeiro.pdf
- Tamanho:
- 3.01 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.89 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
