Please use this identifier to cite or link to this item:
https://www.arca.fiocruz.br/handle/icict/69085
TRATAMENTO DE DADOS NÃO NORMAIS DE ENSAIOS DE POTÊNCIA DE PRODUTOS BIOLÓGICOS ANTIRRÁBICOS
Apolinário, Matheus da Costa | Date Issued:
2025
Author
Advisor
Co-advisor
Affilliation
Fundação Oswaldo Cruz. Instituto Nacional de Controle de Qualidade em Saúde. Rio de Janeiro, RJ, Brasil.
Abstract in Portuguese
O emprego do Controle Estatístico de Processos na garantia da qualidade de produtos e serviços é fundamentado na coleta e análise de dados, e realizado por ferramentas estatísticas. As variações pertinentes aos processos podem ser avaliadas utilizando-se gráficos de controle, por meio dos quais a consistência de produção pode ser demonstrada. Tais gráficos baseiam-se na premissa de que os dados apresentam uma distribuição normal, onde a variação em um processo pode ser causada por fontes comuns e previsíveis. A distribuição normal, ou gaussiana, é caracterizada pela sua forma de sino e simetria em torno da média, com caudas que se estendem simetricamente para ambos os lados. Em contrapartida, a não normalidade manifesta-se na ausência de distribuição normal apresentando diferentes padrões de distribuição, assimétricos, com picos e formas não convencionais. A presença de valores extremos, dados heterogêneos e
a própria natureza dos dados analisados enquadram-se nas possíveis causas da não normalidade. O reconhecimento desse tipo de dado é crucial, visto que a sua existência pode comprometer a integridade das análises estatísticas realizadas, em especial as que se presume uma distribuição normal. A análise de dados não normais exige metodologias alternativas, específicas, robustas e adaptadas para promover uma melhor interpretação dos resultados. A transformação de dados é uma das estratégias utilizadas visando modificar e converter a distribuição não normal, com o objetivo de torná-la mais apropriada para análise estatística ou para atender às suposições de determinados métodos. Dentre os métodos com esse potencial, cita-se a transformação logarítmica, a de raiz quadrada e Box-Cox. O objetivo deste trabalho foi desenvolver um estudo sobre tratamento e avaliação de dados não normais a serem utilizados em gráficos de controle para análise de tendência e demonstração da consistência de produção de soros e vacinas antirrábicas, avaliando a eficiência dos métodos de transformação de dados, a concordância dos métodos de cálculo de normalidade D’Agostino-Pearson, Shapiro-Wilk e Kolmogorov-Smirnov com o valor de referência do Gráfico de Probabilidade Normal e avaliando o impacto do incremento do número de amostras sobre a normalidade, também utilizando estes quatro testes de normalidade. Foi possível concluir que apenas as transformações Logarítmica e Box Cox foram eficientes com 100% de resultados normais. O teste D'Agostino-Pearson apresentou o maior índice de concordância. Não houve diferença significativa com 20 amostras com as obtidas com 10, 40, 80 ou 100 para cálculo da média, desvio padrão e limites de controle, indicando que o tamanho recomendado nos procedimentos internos do INCQS (n=20) é adequado para o cálculo dos limites em gráficos de controle para os três grupos de amostras analisados (Vacina Antirrábica, Soro Antirrábico in vitro e Soro Antirrábico in vivo).
Abstract
The use of Statistical Process Control in ensuring the quality of products and services is based on the collection and analysis of data, carried out through statistical tools. Variations relevant to processes can be assessed using control charts, through which production consistency can be demonstrated. Such charts are based on the premise that the data follow a normal distribut io n, where variation in a process can be caused by common and predictable sources. The normal, or Gaussian, distribution is characterized by its bell-shaped curve and symmetry around the mean, with tails extending symmetrically on both sides. In contrast, non-normality manifests in the absence of a normal distribution, presenting different distribution patterns, such as asymmetr y, peaks, and unconventional shapes. The presence of extreme values, heterogeneous data, and the very nature of the analyzed data are among the possible causes of non-normalit y. Recognizing this type of data is crucial, as its existence can compromise the integrity of statistical analyses, especially those that assume a normal distribution. Analyzing non-normal data requires alternative, specific, robust, and adapted methodologies to promote better interpretation of results. Data transformation is one of the strategies used to modify and convert non-normal distributions, aiming to make them more suitable for statistical analysis or to meet the assumptions of certain methods. Among the methods with this potential are logarit hmic transformation, square root transformation, and Box-Cox transformation. The objective of this work was to develop a study on the treatment and evaluation of non-normal data to be used in control charts for trend analysis and demonstration of production consistency in rabies serum and vaccines, evaluating the efficiency of data transformation methods, the agreement of normality tests (D’Agostino-Pearson, Shapiro-Wilk, and Kolmogorov-Smirnov) with the reference value of the Normal Probability Plot, and assessing the impact of increasing the number of samples on normality, also using these four normality tests. It was concluded that only the Logarithmic and Box-Cox transformations were effective, with 100% normal results. The D'Agostino-Pearson test showed the highest agreement rate. There was no signific ant difference between 20 samples and those obtained with 10, 40, 80, or 100 samples for calculating the mean, standard deviation, and control limits, indicating that the sample size recommended in the internal procedures of INCQS (n=20) is adequate for calculating control limitsin control chartsfor the three groups ofsamples analyzed (Rabies Vaccine, in vitro Rabies Serum, and in vivo Rabies Serum)
Share