Mestrado em Estatística Aplicada e Biometria
URI Permanente para esta coleçãohttps://repositorio.unifal-mg.edu.br/handle/123456789/2658
Navegar
Navegando Mestrado em Estatística Aplicada e Biometria por Orientador(a) "Ferreira, Eric Batista"
Agora exibindo 1 - 15 de 15
- Resultados por página
- Opções de Ordenação
Item Acesso aberto (Open Access) Algoritmos de aprendizado de máquina aplicados na previsão clínica de pacientes com insuficiência cardíaca e uma revisão para dados limitados(Universidade Federal de Alfenas, 2024-03-08) Alves, João Carlos Pereira; Ferreira, Eric Batista; Souza, Anderson Luiz Ara; Beijo, Luiz Alberto; Carvalho, Iago Augusto DeO uso do aprendizado de máquina na área da saúde representa uma revolução significativa nos métodos de diagnóstico e tratamento de doenças. Essa tecnologia aproveita a capacidade computacional avançada para identificar padrões complexos em dados médicos. Essa abordagem representa significativo o potencial de melhorar substancialmente a eficiência dos diagnósticos relacionados a doenças graves como o caso da Insuficiência Cardíaca Congestiva. No entanto, enfrenta-se um desafio contínuo nesta área: a aplicação efetiva de aprendizado de máquina em cenários de escassez de dados, isto é, em situações onde as amostras disponíveis são limitadas. Este desafio estimula o estudo do aprendizado de máquina com pequenas amostras, uma abordagem que busca adaptar e otimizar os modelos de aprendizado de máquina para funcionar eficientemente mesmo com um número restrito de dados. Esta dissertação, composta por uma coleção de artigos, explora aplicações de algoritmos de aprendizado de máquina na previsão clínica de pacientes com Insuficiência Cardíaca e a revisão de técnicas de aprendizado de máquina em cenários de poucos dados. O primeiro artigo apresenta uma aplicação prática que utiliza modelos de aprendizado de máquina para prever a sobrevivência e o tempo de internamento de pacientes com Insuficiência Cardíaca Congestiva, com enfoque nas variáveis mais significativas associadas aos fatores de risco e os resultados destacam o potencial dos modelos de aprendizado de máquina na previsão de desfechos clínicos em pacientes com ICC. O segundo artigo realiza uma análise teórica, investigando a aplicabilidade e eficácia de técnicas de aprendizado de máquina em contextos caracterizados pela escassez de dados. Este estudo destaca a importância dos modelos de aprendizado de máquina, técnicas como a seleção de variáveis, e o uso de dados médicos no campo do aprendizado de máquina, com contribuições na área da saúde, onde decisões baseadas em dados podem ter impactos consideráveis na vida dos pacientes.Item Acesso aberto (Open Access) Análise de Arquétipos: introdução a teoria e aplicações(Universidade Federal de Alfenas, 2015-04-10) Martins Júnior, José Márcio; Ferreira, Eric Batista; Bueno Filho, Júlio Silvio De Sousa; Dias, Adriana; Beijo, Luiz AlbertoExistem diversas técnicas que auxiliam na interpretação e análise de dados multivariados. Uma das técnicas mais difundidas e utilizadas é a Análise de Componentes Principais, que tem como principal objetivo reduzir a dimensionalidade dos dados afim de facilitar a interpretação. A Análise de Arquétipos também é uma técnica multivariada que busca reduzir a dimensionalidade dos dados, mas por meio de combinações convexas dos próprios dados. Os arquétipos são selecionados pela minimização da soma de quadrados de resíduos que representa o erro cometido ao se reconstruir os dados originais utilizando os arquétipos. Este trabalho teve como objetivo geral explorar em mais detalhes a Análise de Arquétipos e traçar a sua história, além de verificar potencialidades de aplicações existentes e futuras em diversas áreas do conhecimento. De forma mais específica objetivou-se: descrever em detalhes a Análise de Arquétipos, identificar similaridades e diferenças entre a Análise de Arquétipos e a Análise de Componentes Principais, realizar estudos de simulação para avaliar qual a melhor métrica para medir a falta de ajuste dos dados recompostos pelos arquétipos, aplicar a técnica Análise de Arquétipos em dados sobre a movimentação de jogadores de futebol, realizar simulações Monte Carlo para avaliar se há algum ganho em executar a Análise de Arquétipos em conjunto com a Análise de Componentes Principais, e aplicar esta em dados sensométricos experimentais sobre hambúrgueres. As metodologias utilizadas foram uma extensa revisão bibliográfica e simulações Monte Carlo. Os resultados mostraram que a Análise de Arquétipos é uma técnica com ampla aplicabilidade e excelentes resultados práticos. O estudo das métricas concluiu que a soma de quadrados de resíduos deve ser utilizada por ser a mais simples, e que não há qualquer prejuízo em utilizar esta métrica em relação as outras estudadas. No contexto do futebol a Análise de Arquétipos foi capaz de verificar se o jogador ou grupo de jogadores atuam em seu espaço designado, se a apostura foi ofensiva ou defensiva entre outras, sendo uma nova abordagem para ser utilizada em conjunto com outras técnicas para este fim. No estudo de simulação que visava aplicar as duas técnicas, foi evidenciado a capacidade de reconstrução das técnicas em conjunto e a melhora na interpretabilidade que as técnicas apresentam quando utilizadas conjuntamente.There are several techniques that aid in the interpretation and analysis of multivariate data. One of the most widespread techniques used and is the Principal Component Analysis, which aims to reduce the dimensionality of the data in order to facilitate interpretation. The Archetypal Analysis is also a multivariate technique that seeks to reduce the dimensionality of the data, but through convex combinations of the data itself. Archetypes are selected by minimizing the residual sum of squares that is the mistake to reconstruct the original data using the archetypes. This work aimed to explore in more detail the Archetypal Analysis and trace its history, and to identify capabilities of existing and future applications in various areas of knowledge. More specifically it aimed to: describe in detail the Archetypal analysis, identify similarities and differences between the Archetypal Analysis and Principal Component Analysis, conduct simulation studies to assess how best metric for measuring the lack of fit of the data recomposed by archetypes, apply the Archetypal Analysis on data of the movement of soccer players, perform Monte Carlo simulations to assess whether there is some gain in performing Archetypal Analysis in conjunction with the Principal Component Analysis, and apply this to experimental sensory data of burgers. The methodologies used were an extensive literature review and Monte Carlo simulations. The results showed that the Archetypal Analysis is a technique with wide applicability and excellent practical results. The study of metrics concluded that the residual sum of squares should be used because it is the simplest, and that there is no harm in using this metric compared to the others tha was studied. In the context of the soccer, Archetypal Analysis was able to verify that the player or group of players are in their designated space, the offensive or defensive behavior among others, being a new approach to be used in conjunction with other techniques for this purpose. About the study of simulation designed to implement both techniques, was evidenced a improvement of reconstruction capacity and in the interpretability.Item Acesso aberto (Open Access) Análise sequencial no ajuste de mapas de preferência(Universidade Federal de Alfenas, 2018-07-27) Fagundes, Cássia De Souza Santos; Ferreira, Eric Batista; Oliveira, Marcelo Silva De; Gomes, Davi ButturiO Mapa de Preferência Externo (MPE) é uma das ferramentas estatísticas aplicadas à Análise Sensorial de alimentos e bebidas, sendo muito utilizado para identificar a aceitação dos consumidores com relação aos produtos avaliados. De forma resumida, pode ser entendido como a sobreposição de superfícies de resposta ajustadas aos dados da aceitação de consumidores em função dos atributos sensoriais de um produto. Na literatura que fundamenta os MPE, recomenda-se um tamanho amostral de pelo menos 100 consumidores para avaliar a aceitação dos produtos. Uma forma de não pré-fixar tamanho amostral é utilizar os testes sequenciais que, além disso, controlam as taxas de erro Tipo I e Tipo II. Um modo de utilizar estes testes em MPE é inferindo sobre a qualidade de ajuste dos mesmos. Sendo assim, o objetivo deste trabalho é propor uma abordagem sequencial na construção de MPE, inferir em sua qualidade de ajuste por meio do coeficiente de determinação (R2) e propor uma forma de selecionar modelos sequencialmente. Os dados analisados foram obtidos por meio de uma análise sensorial de refrigerante sabor guaraná de duas marcas com duas versões (tradicional e zero-açúcar). O mapa de preferência sequencial ajustado obteve ajuste mínimo de 70% pelo teste t sequencial e foi construído com 40 consumidores. Assim, foi possível constatar que a versão tradicional de ambas as marcas foi mais bem aceita, porém a marca líder de mercado destaca na aceitação média. Na comparação de modelos, dentre os modelos existentes na literatura, o vetorial foi o que apresentou o melhor ajuste. Por fim, conclui-se que é possível decidir sequencialmente sobre a qualidade do ajuste de mapas de preferência, de modo que ele possa ser construído sem uma determinação prévia do número de consumidores a serem entrevistados.Item Acesso aberto (Open Access) Café: emoções, hábitos, preferências, aspectos sensoriais e extrínsecos(Universidade Federal de Alfenas, 2021-05-12) Cardoso, Ana Beatriz Dos Anjos; Ferreira, Eric Batista; Pereira, Renato Nunes; Oliveira, Tiago Almeida DeO café tem uma importância significativa para o Brasil. O país é o maior produtor e exportador mundial, sendo este o quinto produto na pauta das exportações brasileiras. Os consumidores brasileiros estão buscando cada vez mais produtos com maior qualidade e atributos diferenciados. Conhecer os hábitos dos consumidores é de grande importância para produtores, torrefações, cooperativas e cafeterias. Neste sentido, buscou-se investigar o perfil do consumidor brasileiro de café antes e durante a pandemia de COVID-19; o porquê do início do hábito de tomar café; os tipos de cafés mais consumidos; formas de preparo da bebida, marcas e horários de consumo preferidos. Também foi avaliada a influência dos aspectos extrínsecos como a embalagem e o preço no processo de decisão de compra do produto. Em adição, foi analisada a lista CATA proposta por Ricardi (2016). Foram feitas duas pesquisas online, via Google Forms. Todas as análises utilizaram o software RStudio versão 4.0.4 e a linguagem de programação R. Foram fei tas análises exploratórias a partir de estatística descritiva, teste de Qui-Quadrado, testes exato de Fisher, testes de McNemar, análises de correspondência, de componentes principais e de fato res. Constatou-se nesse trabalho uma prevalência do sexo feminino com idade média de 35 anos, frequência de consumo em sua maioria de duas vezes ao dia, sendo o motivo principal para o início do hábito de tomar café a tradição familiar e a marca preferida a Pilão. A principal forma de tomar o café é puro, com açúcar branco e logo pela manhã. O pior horário para consumo, desconsiderando a noite e madrugada, é logo antes do almoço. Os consumidores brasileiros preferem cafés tracionais e extra-forte. Alterações no padrão de consumo durante a pandemia foram observadas. A variável mais afetada foi o local de consumo, seguida pelo número de xí caras e horários de consumo. Em adição, percebeu-se uma mudança no padrão de consumo de café coado e de café solúvel, com diminuição de ambos. O estudo também selecionou um léxico de emoções evocadas pelo café a partir da metodologia CATA com 22 termos emocionaisItem Acesso aberto (Open Access) Comparação de testes para a igualdade de média sob heterocedasticidade: simulação e aplicações(Universidade Federal de Alfenas, 2016-02-29) Oliveira, Helen Maria Pedrosa De; Ferreira, Eric Batista; Oliveira, Marcelo Silva De; Nomelini, Quintiliano Siqueira SchrodenEm experimentação, geralmente a comparação de várias médias é feita por meio de testes para detectar a existência de diferenças entre os tratamentos. Um dos testes mais utilizados para a comparação de médias é o teste F, no contexto da Análise da Variância. Entretanto, a credibilidade desse teste está diretamente ligada ao cumprimento de quatro pressuposições, que são: aditividade dos termos do modelo, os erros devem seguir uma distribuição normal, serem independentes e possuírem variâncias homogêneas. De acordo com alguns pesquisadores, a pressuposição que mais afeta o desempenho do teste F é a quebra da homogeneidade. Contudo, na literatura existem diversos testes alternativos ao F, quando se quebra alguma das pressuposições. O objetivo deste trabalho foi a comparação de oito testes para a igualdade de médias sob heterocedasticidade. A avaliação dos testes foi feita por meio de simulação Monte Carlo analisando as taxas de erro tipo I e poder, ao longo de cenários resultantes da combinação de diferentes números de tratamentos (5, 10, 15 e 20), repetições (3 e 20), graus de heterogeneidade (1, 2, 4, 8, 16, 32, 64, 128, 256) e erros padrões da diferença entre as médias (0,5, 1; 2; 4 e 8). De maneira geral, os testes se mostraram pouco sensíveis ao aumento da heterogeneidade da variância, o que não aconteceu com o teste de Welch. Nas condições avaliadas, os testes de melhor desempenho foram Kruskal-Wallis e o F no contexto da ANAVA, seguidos do bootstrap paramétrico de Krishnamoorthy, Lu e Mathew. Já os testes de pior desempenho foram o bootstrap não-paramétrico de Reddy, Kumar e Ramu e o bootstrap não-paramétrico de Zhow e Wong.Item Acesso aberto (Open Access) Emoções e lembranças associadas ao consumo de café em ambientes evocados via internet(Universidade Federal de Alfenas, 2022-10-03) Mequelino, Daiana Barbosa; Ferreira, Eric Batista; Behrens, Jorge Herman; Gomes, Davi Butturi; Silva, Wanderson Roberto DaA crescente demanda por cafés qualificados, mostra a necessidade da utilização de técnicas que permitam obter uma caracterização robusta do produto e dos consumidores. As inovações metodológicas em ciências sensoriais são importantes para a melhoria da qualidade dos produtos. Desta forma, foi proposta uma nova metodologia de pesquisa via internet, em ambientes evocados, para analisar a aceitabilidade do café. Para otimizar a experiência do consumidor, desenvolveu-se um léxico especializado em lembranças eliciadas pelo consumo de café e refinou-se o léxico de emoções, por meio da metodologia CATA. Diante do disposto, este trabalho tem o principal objetivo de responder como que diferentes ambientes evocados via internet afetam a aceitação da bebida do café, e quais são as principais emoções e lembranças associados ao seu consumo nesses ambientes. Foi realizada uma pesquisa online e os dados obtidos foram avaliados utilizando análises exploratórias, através da estatística descritiva e análises sensométricas, como: análise de variância (ANOVA), teste de Scott-Knott, análise de correspondência e teste de qui-quadrado. A pesquisa, foi respondida por brasileiros, com idade entre 18 e 67 anos, com prevalência de participantes do sexo feminino. Os resultados apontam um maior índice de aceitabilidade do café quando consumido na cozinha e na cafeteria evocadas via internet, enquanto o laboratório e o supermercado foram os ambientes menos aceitos. O estudo possibilitou o desenvolvimento de um léxico de lembranças composto por 17 termos e selecionou 28 termos emocionais para o consumo de café. Observou-se que os consumidores tendem a associar o consumo do café em ambientes evocados via internet, a lembranças e emoções agradáveis. Indicando que as motivações para o seu consumo refletem um significado social satisfatório da bebida.Item Acesso aberto (Open Access) Estatística Aplicada à Vantagem de Casa no Futebol(Universidade Federal de Alfenas, 2022-02-25) Paludo, Giovani Festa; Ferreira, Eric Batista; Teixeira, Josiane Magalhães; Neves , Person PereiraOs fatores que fazem com que o Campeonato Brasileiro tenha mais vantagem de casa do que, por exemplo, as ligas europeias, ainda não estão completamente elucidados. Para poder explicar melhor os fatores associados à vantagem de casa no Brasil, primeiro seria necessário um método para medir o efeito de casa que permitisse obter uma informação para cada participação de um time na competição e que fosse por pontos. Um dos principais estudos que obtém o efeito de casa por pontos no Campeonato Brasileiro, fez uma correção pela habilidade e não trouxe os valores por ano que um time participou por questões metodológicas. Assim, o nosso objetivo foi desenvolver uma forma de obter o efeito de casa por pontos, que possibilite trazer uma informação para cada time em cada participação e que não necessite uma correção pela habilidade. Para atingir esse objetivo foram desenvolvidos dois estudos, um no Capítulo 4 e outro no Capítulo 5. O Capítulo 4 teve como objetivo propor uma métrica para medir o efeito de casa no futebol baseada em pontos. O ponto inicial do Capítulo 4 foi partir de uma métrica bem conhecida para o efeito de casa e a partir de certas modificações propor uma nova métrica. Em seguida, utilizou-se o Campeonato Brasileiro de Futebol Série A de 2003 a 2020 como aplicação. Como resultado, foi obtida a nova métrica denominada de d, que atingiu os pontos que haviam sido listados. Ainda foi desenvolvido um teste sobre d que permitiu verificar quando há informação suficiente para afirmar se existe efeito de casa, tirando o efeito da oscilação quando o time ganha poucos pontos. Com base nisso, das 370 participações de 43 times em 18 edições, uma apresentou desvantagem de casa, 259 tiveram vantagem de casa e 110 não apresentaram efeito de casa. Além disso, d permitiu visualizar o comportamento individual de cada time ao longo das edições da competição. Já o Capítulo 5 tratou a métrica d como uma variável aleatória (v.a.) D procurando descrever sua distribuição e características através de uma distribuição de probabilidade. Foram trazidas algumas características importantes como média e variância, e, na impossibilidade de obter a distribuição exata, foram estudadas aproximações. Para avaliar e decidir qual distribuição melhor aproximava a distribuição de D, foi feito um estudo de simulação para verificar a melhor aproximação. Como resultado do estudo de simulação, a aproximação pela distribuição normal foi aquela que apresentou maior aderência e foi considerada para as aplicações. Para ilustrar a metodologia desenvolvida, foram feitas cinco aplicações utilizando a aproximação pela normal. Sendo que o conhecimento da distribuição possibilita a inferência estatística utilizando a variável aleatória D e permite um série de aplicações com testes bastante conhecidos. Assim, foi proposto uma variável aleatória para medir o efeito de casa e estudou-se sua distribuição, que possibilita a realização de diversas inferências.Item Acesso aberto (Open Access) Modelagem de batalhas no Instagram via distribuição Beta e Inferência Bootstrap(Universidade Federal de Alfenas, 2024-04-05) Valadares, Fernanda Lara; Ferreira, Eric Batista; Dias, Adriana; Nogueira, Denismar AlvesCompeti¸c˜oes, concursos e campeonatos s˜ao comumente praticados nas mais diversas ´areas - esportes, beleza, habilidades, m´usica, etc - para comparar e ranquear competidores. Particularmente, alguns campeonatos seguem um esquema de chaves ou chaveamento, que podem ser simples, duplos ou m´ultiplos, para conduzir os vencedores at´e eleger o campe˜ao. Nesses casos, o enfrentamento acontece aos pares, ou seja, quando dois oponentes se enfrentam, apenas um sai vitorioso. Quando n˜ao ´e poss´ıvel haver empates ou repescagem, esses confrontos s˜ao chamados de “mata-mata”. Ao final de campeonatos desse tipo, o resultado ´e o agrupamento dos competidores nas classes: primeiro colocado, segundo, terceiros, quartos, quintos, etc. No entanto, como cada confronto acontece uma ´unica vez, tem-se uma amostra de tamanho 1 de uma popula¸c˜ao conceitual de infinitas repeti¸c˜oes daquele combate. Sendo assim, os agrupamentos resultantes de tais campeonatos possuem uma incerteza associada, que ´e normalmente desprezada. Seria ´util modelar a incerteza envolvida em um campeonato, a fim de saber quais vencedores podem ser considerados realmente superiores e quais venceram por mero acaso. Para responder a essa demanda, este trabalho prop˜oe uma abordagem metodol´ogica que utiliza distribui¸c˜ao Beta, inferˆencia Bootstrap param´etrico, e escala hedˆonica. Como exemplos de sua utiliza¸c˜ao, campeonatos foram conduzidos nos stories do Instagram, com os queijos populares no Brasil e os mais famosos cantores sertanejos. Desta forma, apresenta-se n˜ao somente uma forma de inferir sobre a igualdade dos competidores de cada batalha do campeonato, mas tamb´em a interpreta¸c˜ao de qu˜ao bem aceitos eles s˜ao pelos seguidores que participaram das vota¸c˜oes. Ao final, metodologia proposta se mostrou eficiente na modelagem da incerteza associada a agrupamentos promovidos por campeonatos em chaveamento, revelando que os queijos que se enfrentaram n˜ao podem ser ditos estatisticamente diferentes e que Mar´ılia Mendon¸ca, Henrique e Juliano, Jorge e Mateus e Z´e Neto e Cristiano s˜ao os cantores sertanejos preferidos pelos brasileiros.Item Acesso aberto (Open Access) Percepções e embalagens de cafés produzidos por mulheres(2025-03-10) Pereira, Maria Izabelle; Ferreira, Eric Batista; Montes Villanueva, Nilda Doris; Barros, Renata Chrystina Bianchi deCom a análise das percepções é possível compreender o pensamento do consumidor, principalmente quando se trata de um produto novo no mercado. Além disso, a principal maneira de apresentação de um produto ocorre pela embalagem, que chama a atenção e expressa as percepções e expectativas de um produto. Desta forma, diante da escassez de informações sobre as percepções dos consumidores de Café Produzido por Mulheres (CPM), esta pesquisa torna-se necessária para o desenvolvimento da área. A fim de ampliar o conhecimento acerca das percepções de consumidores, este trabalho buscou elencar as percepções dos consumidores e eleger uma embalagem para o CPM condizente e com maior probabilidade de aceitação e identificação. Para tanto, analisou-se, por meio da ANOVA DBC e teste de Tukey, a feminilidade das bebidas usuais com o objetivo de verificar como o consumidor avalia cada bebida. Em seguida, identificou-se as percepções através da associação de palavras com 25 indivíduos do grupo especial e 157 participantes grupo tradicional. Com o uso da entrevista, elencou-se os elementos gráficos remetentes ao CPM, e assim, encontrou-se os atributos formato, cor, tipo de fonte e selo. A combinação dos níveis destes atributos formaram os perfis de embalagem analisados por 376 participantes para identificar a embalagem preferida e a que remetesse ao CPM. Para a análise dos dados usou-se a ANOVA fatorial mista e o teste de Tukey. Como resultado, encontrou-se que a bebida do café ´ e considerada uma bebida masculina, reforçando que as barreiras enfrentadas pelas mulheres est˜ ao arraigadas na cultura também dos consumido res. As percepções acerca do CPM refletiram as principais impressões dos consumidores sobre o Café Produzido Tradicionalmente (CPT). Por isso, o grupo 2 destacou percepções de “desconhecimento” e “desnecessário”, enquanto o grupo 1 elencou palavras voltadas ao contexto social, como “força” e “independência”. Por fim, a embalagem preferida é composta por saco, cor preta, fonte Rage Italic e com a presença de selo, expressando café de qualidade. Por outro lado, a embalagem mais fortemente associada ao CPM possui os mesmos elementos gráficos, exceto a cor verde (RGB 0,163,0). A cor (RGB 0,163,0) verde ´ e o elemento identificador deste café e pode estar, subjetivamente, associado à percepção incerta de que o CPM é “orgânico”. Tais resultados mostram que ainda há estereótipos e desconhecimento acerca do CPM e, por este fato, deve haver o investimento e divulgações, a fim de que aumente a sua valorização. Logo, espera-se que esta pesquisa norteie investimentos e ações de divulgação, uma vez que expressa as opiniões e percepções dos consumidores o que colabora para a valorização do CPM e, consequentemente, para a valorização do trabalho das mulheres no campo.Item Acesso aberto (Open Access) Proposta de algoritmos para aumento de dados via arquétipos(Universidade Federal de Alfenas, 2016-07-11) Cavalcanti, Pórtya Piscitelli; Ferreira, Eric Batista; Nogueira, Denismar Alves; Silva, Roberta Bessa VelosoArquétipos, na estatística, são os elementos extremos mais representativos de uma amostra ou população, a partir dos quais todos os outros podem ser reescritos. A Análise de Arquétipos (AA) é uma técnica multivariada que visa reduzir a dimensionalidade dos dados, por meio de combinações convexas dos próprios dados, proporcionando encontrar e selecionar seus arquétipos. Existem aplicações da AA em diversas áreas do conhecimento, contudo ainda não foi explorado o seu potencial no aumento de dados amostrais. Quando um conjunto de dados é caracterizado como incompleto ou não possui o tamanho necessário para cometer o erro desejado no procedimento de inferência estatística, surge a ideia, ou necessidade, de aumentar essa amostra. Para esse fim, a técnica de aumento de dados consiste em introduzir dados não observados ou variáveis latentes por meio de métodos iterativos ou algoritmos de amostragem. Sendo assim, como os arquétipos permitem reescrever os elementos amostrais com um erro mínimo, gerando elementos não observados, esses poderiam ser utilizados para o aumento de dados. Então, o objetivo deste trabalho foi propor e avaliar a eficiência do aumento de dados por meio dos arquétipos. Foram programados três algoritmos para aumento de dados amostrais via arquétipos (Algoritmos 1, 2 e 3 - A1, A2 e A3, respectivamente), e foram realizados dois estudos de simulação para avaliar e comparar cada algoritmo quanto à sua eficiência; sendo testada a distribuição da variável aleatória e as estimativas de seus parâmetros, e também para verificar se esse aumento pode ser executado sucessivas vezes. Além disso, foi feita a aplicação dos algoritmos em um conjunto de dados reais sobre análise sensorial. Os três algoritmos apresentaram resultados semelhantes, destacando-se o A3, por ter apresentado um desempenho apropriado em todos os cenários. Esse algoritmo permitiu aumentar 10% do tamanho da amostra inicial, sem alterar a distribuição de probabilidade, bem como as estimativas de seus parâmetros. O estudo sobre aumentos sucessivos de dados também indicou o A3 como o mais eficiente, que foi capaz de aumentar a amostra em 110% de seu tamanho inicial, através de 11 aumentos sucessivos de 10% cada. O estudo com dados reais permitiu aumentar o tamanho da amostra e proporcionar maior precisão na inferência praticada. Portanto, parece seguro realizar o aumento de dados via arquétipos sugerindo-se o algoritmo 3.Item Acesso aberto (Open Access) Revisitando a estimação de coeficiente de determinação(Universidade Federal de Alfenas, 2019-09-06) Pala, Luiz Otávio De Oliveira; Ferreira, Eric Batista; Pereira, Gislene Araújo; Silva, Washington Santos Da; Pascoa, Marcelino Alves Rosa DeO coeficiente de determinação (R2) é uma métrica muito utilizada para a análise de qualidade de ajuste de modelos lineares. Este coeficiente assume valores no intervalo entre 0 e 1, de modo que quanto mais próximo de 1, maior parte da variação da variável resposta está sendo explicada pelo modelo. Há outras métricas com o mesmo objetivo, como o coeficiente de determinação ajustado, o erro absoluto e erro quadrático médio, por exemplo. Mesmo sendo muito utilizado, o R2 é tratado com cautela na literatura, pois este pode ser viesado em modelos com poucas observações ou inflacionado quando se acrescentam covariáveis ao modelo. Neste sentido, autores sugerem tratá-lo como uma estatística que estima um parâmetro populacional ( 2), sendo este entendido como a qualidade de ajuste que um modelo possuiria se as infinitas observações do fenômeno viessem a ser coletadas. Desta forma, sendo 2 um parâmetro e R2 um estimador pontual, é natural pensar em estimação intervalar e testes de hipóteses para possibilitar a tomada de decisão sobre a adequação do modelo candidato ao fenômeno no qual deseja-se descrever. Entretanto, essa questão inferencial ainda não é considerada fechada na literatura, pois autores discutem distribuições de probabilidade para a modelagem deste em diferentes cenários e regiões do espaço paramétrico. Desta forma, este trabalho estudou a estimação do coeficiente de determinação paramétrico ( 2) a partir de cinco estimadores intervalares paramétricos. Para compará-los, foi realizado um estudo de simulação Monte Carlo, computando precisão e acurácia em diferentes cenários compostos pela combinação do número de covariáveis do modelo (k), tamanho amostral (n) e o verdadeiro valor paramétrico ( 2). Em conjunto a isso, elaborouse um índice de desempenho de estimação intervalar que valoriza simultaneamente precisão e acurácia com importâncias relativas previamente fixadas. Os resultados permitiram a recomendação do melhor estimador para cada região do espaço paramétrico. Com isso, verificou-se que os estimadores propostos apresentaram qualidade similar aos indicados na literatura ao longo do espaço paramétrico. Por fim, foi construído um pacote R, possibilitando que o usuário estime de forma intervalar a qualidade do ajuste utilizando o estimador com melhor desempenho.Item Acesso aberto (Open Access) Testes assintóticos para detectar consenso multivariado em painéis sensoriais(Universidade Federal de Alfenas, 2016-12-16) Ferreira, Laís Brambilla Storti; Ferreira, Eric Batista; Gomes, Davi Butturi; Ferreira, Daniel FurtadoA unidimensionalidade de um painel sensorial está diretamente relacionada com a consonância do mesmo, ou seja, um painel é considerado unidimensional quando os provadores pontuam da mesma forma um determinado atributo. Devido a importância da concordância do painel para a confiabilidade da análise sensorial os provadores devem ser treinados de modo que concordem entre si em relação às características deste atributo. Na literatura é possível encontrar métodos que vem sendo propostos para avaliar esta concordância, porém os métodos existentes avaliam as notas dadas pelos provadores para um atributo de cada vez, tornando a análise mais lenta. Assim, o objetivo deste trabalho é generalizar o teste assintótico de autovalores proposto por Ferreira (2008a), a fim de inferir sobre o consenso multivariado de painéis sensoriais. A partir da generalização do teste assintótico de autovalores foi possível obter quatro novas estatísticas de teste. A avaliação dos testes foi realizada via simulação Monte Carlo, na qual foram avaliados diferentes cenários resultantes da combinação dos números de provadores (2, 5, 10 e 15), atributos (2, 5, 10 e 20), observações (10, 20, 30, 40, 50, 100 e 200), grau de treinamento do painel sensorial (0;1 ≥ p² ≥ 0;99) e da restrição n ≥ pq. De maneira geral, analisando a taxa de erro tipo I e o poder dos testes, o teste InvH2 mostrou-se ser o mais eficiente.Item Acesso aberto (Open Access) Testes baseados em correlação canônica para avaliar a consonância de painéis sensoriais(Universidade Federal de Alfenas, 2015-03-20) Rocha, Marcela Costa; Ferreira, Eric Batista; Dias, Adriana; Nogueira, Denismar AlvesUm painel sensorial é considerado consonante quando todos os julgadores pontuam um produto de maneira semelhante. Dessa forma, a consonância entre os julgadores que compõem um painel sensorial é uma das características necessárias para a confiabilidade da análise sensorial e pode ser mensurada pelo seu nível de unidimensionalidade. Na literatura existem testes para a unidimensionalidade de um painel sensorial, mas sua aplicação é restrita à análise para um atributo sensorial por vez. Diante disso, o objetivo do presente trabalho foi a generalização de cinco testes propostos para avaliar a consonância de painéis sensoriais, a saber: teste de Fujikoshi, teste Monte Carlo para unidimensionalidade, dois testes bootstrap paramétricos e teste sobre autovalores Monte Carlo. Tal generalização consistiu em utilizar a matriz de correlação canônica, de forma que fosse possível inferir sobre a consonância de painéis levando em consideração todos os atributos simultaneamente. A avaliação do desempenho das generalizações propostas, em termos de poder e taxa de erro tipo I, foi feita via simulação Monte Carlo. A generalização do teste sobre autovalores Monte Carlo foi aplicada para avaliar a consonância do painel de um experimento realizado por Pereira (2005). O teste sobre autovalores Monte Carlo apresentou desempenho igual ou superior aos demais testes e, por esse motivo, é recomendado para a análise da unidimensionalidade multivariada de painéis sensoriais.Item Acesso aberto (Open Access) Testes Monte Carlo para autovalores na verificação de consenso multivariado de painéis sensoriais(Universidade Federal de Alfenas, 2019-02-27) Araujo, Tatiane Gomes De; Ferreira, Eric Batista; Lúcia, Flávia Della; Dias, AdrianaEm análise sensorial a concordância entre os membros de um painel é fundamental para verificar a eficiência do treinamento por ele recebido. Para essa finalidade, encontram-se na literatura alguns métodos e testes, dentre os quais destacam-se os testes assintóticos de Ferreira (2017), que avaliam a consonância de um painel de forma multivariada. Por serem testes assintóticos, eles necessitam de um grande número de observações amostrais, o que não é comum no contexto sensorial. Diante disso, o objetivo deste trabalho foi propor versões Monte Carlo dos testes de Ferreira (2017) para obter melhores características de poder e erro tipo I em qualquer tamanho amostral, bem como compará-los com os testes assintóticos via simulação computacional. Também foi objetivo, adaptar o protocolo de verificação de desempenho de painéis proposto por Tomic et al. (2009), inserindo uma etapa de teste de consenso multivariado. Os quatro testes Monte Carlo propostos foram considerados exatos e apresentaram maior poder em 95,24% dos cenários analisados, quando comparados com as versões assintóticas. Recomenda-se o uso do teste InvH2mc. A eficiência deste teste pôde ser comprovada ao verificar o desempenho de um painel sensorial ao avaliar duas marcas de refrigerante sabor guaraná em suas versões tradicionais e zero açúcar. Verificou-se que o painel não apresentou consenso multivariado, ou seja, os provadores não pontuaram os atributos de forma semelhante. A inserção do teste Monte Carlo no protocolo permitiu analisar de forma inferencial o comportamento do painel, corroborando com as fases exploratórias.Item Acesso aberto (Open Access) Testes para a seleção de provadores com base na proporção de acertos ao longo de ensaios triangulares(Universidade Federal de Alfenas, 2020-01-30) Paula, Iasmine Queiroga De; Ferreira, Eric Batista; Lucia, Flávia Della; Petrini, JulianaOs consumidores têm se tornado cada vez mais críticos e exigentes quando se trata da escolha dos alimentos. Buscando aprimorar a qualidade desses produtos, muitos estudos que envolvem a pesquisa sensorial se tornam relevantes. A análise sensorial é um procedimento experimental que permite medir, analisar e interpretar através dos sentidos reações estimuladas pelos alimentos. Essa análise é realizada através de painéis sensoriais, que constituem pessoas responsáveis por analisar sensorialmente o produto. Para selecionar degustadores e submetê-los ao treinamento, testes triangulares são comumente utilizados a fim de avaliar a capacidade discriminativa dos juízes. Deseja-se cometer o menor erro possível durante a seleção, levando em consideração que esses avaliadores podem ter uma proporção de acerto constante ou não. Nesta última situação, os juízes podem adquirir queda da proporção de acertos (devido à fadiga), ou até mesmo apresentarem elevação da proporção de acertos (aprendizagem). Dessa forma, o objetivo deste trabalho é fazer um estudo de estimadores intervalares, reescrevendo-os como testes a serem aplicados para seleção de provadores, a fim de recomendar o melhor em termos de menor taxa de erro tipo I e maior poder. Para isso, foram realizadas simulações de Monte Carlo considerando provadores que acertam a uma proporção (p) constante ao longo dos ensaios (n) e também aqueles que desenvolvem fadiga ou aprendem de forma linear e não linear, avaliando o comportamento dos testes com a quebra de pressuposição (p constante). Adicionalmente, foram modelados dados reais para candidatos submetidos à análise olfativa de café, com o uso da regressão segmentada, que permite verificar pontos de mudança, auxiliar a decisão do teste e recomendar número de ensaios a serem aplicados. Dos seis testes analisados, obtidos de estimadores da Normal (TN1, TN2 e TN3), da Distribuição F (TF), do Teste Sequencial (TS) e da Poisson (TP), o TS apresentou menor erro tipo I e maior poder para proporção constante e n < 20, enquanto TN3 apresentou essas características para n 20. Com a quebra da pressuposição de p constante, observou-se que as taxas de erro tipo I e poder são bastante afetadas. Para o cansaço, há uma queda no poder, devido ao pequeno valor de n quando p aumenta, enquanto na aprendizagem há o aumento do poder simultâneo a n e p. Nota-se que a não linearidade das funções afeta a velocidade de alcance do poder final. Já a regressão segmentada é uma grande ferramenta a ser utilizada para se tomar uma decisão quando a proporção de acertos converge ou reduz a variabilidade. A recomendação foi de 15 ensaios para análise olfativa de café.