MÉTODOS EN LA IDENTIFICACIÓN DE DATOS ATÍPICOS

Autores/as

Palabras clave:

Datos atípicos, Modelos de regresion lineal, Modelos de regresión multiple, Investigación social

Resumen

Los datos atípicos son en ocasiones una cuestión subjetiva (significa que depende de la percepción, interpretación o criterio personal de quien analiza), y no de una regla totalmente fija u objetiva, ya que su identificación depende del contexto de la investigación y de los criterios utilizados. No obstante, existen diversos métodos que permiten clasificar y analizar estos valores para obtener resultados más confiables y evitar interpretaciones erróneas.
El objetivo es conocer los métodos para determinar los datos atípicos en diferentes investigaciones recomendando su identificación y analizando el alcance de sus efectos sobre la serie de datos, con el fin de evitar errores en los resultados finales, especialmente dentro de la aplicación de modelos de regresión lineal o múltiple.
Se implementa el método descriptivo, para conocer el objeto de estudio, así como el método analítico y sintético (Analizar los distintos tipos de valores atípicos, integra los distintos métodos de identificación para proponer un enfoque más completo), que permite determinar los puntos de datos observados que se alejan de la línea de mínimos cuadrados (errores o residuales). La principal aportación de este trabajo consiste en destacar la importancia de identificar oportunamente los valores atípicos y proponer un enfoque combinado de métodos que contribuye a mejorar la precisión de los análisis estadísticos y la fiabilidad de los resultados obtenidos.
En conclusión, es necesario determinar los valores atípicos para alcanzar resultados más precisos y evitar que estos influyan negativamente en las conclusiones de la investigación y en la correcta interpretación de los valores.

Biografía del autor/a

  • M. Sc. Veronica Cuenca Ramallo, Universidad Mayor de San Andrés, La Paz-Bolivia

    Docente de la Carrera de Estadística de la Facultad de Ciencias Puras y Naturales de la Universidad Mayor de San Andrés.

Referencias

Badhan, A., & Ganpati, A. (2024). Overview of outlier detection methods and evaluation metrics. En A. K. Gupta, S. K. Singh, & Y. K. Prajapati (Eds.), Challenges in Information, Communication and Computing Technology (pp. 736-741). CRC Press.

Durdağ, U. M., & Yılmaz, S. (2024). Minimum-variance-based outlier detection method using geodetic networks. Geodesy and Geodynamics, 17(4), 2187-2199. https://doi.org/10.1016/j.geog.2024.07.003

Faraway, J. J. (2017). Linear models. McGraw-Hill.

Fisher, R. A. (2010). Limiting forms of the frequency distribution of the largest or smallest member of a sample. Proceedings of the Cambridge Philosophical Society, 24(2), 180-190. (Trabajo original publicado en 1928).

Fréchet, M. (2010). Sur la loi de probabilité de l'écart maximum. Annales de la Société Polonaise de Mathématique, 6, 93-116. (Trabajo original publicado en 1927).

Geoffroy, J. (1990). Contributions a la théorie des valeurs extrêmes. Publications de l’Institut de Statistique de l’Université de Paris.

Gnedenko, B. (1980). Sur la distribution limite du terme maximum d'une serie aléatoire. Annals of Mathematics, 44(3), 423-453. (Trabajo original publicado en 1943).

Greene, W. H. (2016). Análisis econométrico. Prentice Hall.

Gujarati, D. N. (2017). Econometría. McGraw-Hill.

Kale, B. K. (2000). Estimation of expected life in the presence of an outlier observation. Technometrics, 42(3), 320-323.

Karamata, J. (2000). Sur un mode de croissance régulière des fonctions. Mathematica (Cluj), 35, 33-52. (Trabajo original publicado en 1930).

Neyman, J. (2013). Outlier proneness of phenomena and of related distributions. En J. S. Rustagi (Ed.), Optimizing Methods in Statistics (pp. 413-430). Academic Press. (Trabajo original publicado en 1971).

Rundel, C. (2017). OpenIntro Statistics. OpenIntro.

Tobin, J. (2018). Estimation of relationships for limited dependent variables. Econometrica, 26(1), 24-36. (Trabajo original publicado en 1958).

Von Mises, R. (1998). La distribution de la plus grande de n valeurs. Revue Mathématique de l'Union Interbalkanique, 1(1), 1-20. (Trabajo original publicado en 1936).

White, H. (2019). A heteroskedasticity-consistent covariance matrix estimator and a direct test for heteroskedasticity. Econometrica, 48(4), 817-838. (Trabajo original publicado en 1980).

Yepes, R. (2018). ¿Qué hacemos con los valores atípicos? Universidad Politécnica de Madrid.

MÉTODOS EN LA IDENTIFICACIÓN DE DATOS ATÍPICOS

Descargas

Publicado

28-10-2025

Número

Sección

Artículos Originales

Cómo citar