Las estadísticas
La estadística se divide en dos corrientes: la clásica y la bayesiana. Quizás en alguna oportunidad has escuchado sobre la Estadística Bayesiana; pero no habías tenido la oportunidad de conocer un poco sobre ella. En este artículo te presentamos descripciones breves de ambas y las ventajas del enfoque bayesiano de la estadística frente al clásico. Esperamos que te sirva como incentivo para que indagues y puedas comenzar a usarla en tus proyectos.
La estadística frecuentista también conocida como «clásica» es el enfoque estadístico más conocido, es la que se enseña en cursos de bachillerato y pregrado, y también a la que estamos acostumbrados. Se basa en la probabilidad frecuentista; entendida como la frecuencia relativa de un evento a largo plazo o cuando un ensayo se repite una gran cantidad de veces (característica que en la realidad pocas veces sucede). Este enfoque considera a los parámetros de una población estadística como desconocidos pero fijos, y a las observaciones como aleatorias con una distribución de probabilidad.
Por su parte, la estadística bayesiana toma los parámetros como cantidades aleatorias y le asigna una distribución de probabilidad (distribución posterior o a posteriori) para representar la incertidumbre acerca de ellos. Además, considera en los modelos estadísticos las creencias previas, experiencias y criterio del investigador en modo de probabilidad subjetiva sobre los parámetros en cuestión (distribución a priori). Utiliza el famoso Teorema de Bayes para calcular la distribución posterior de los parámetros, es decir, la actualización de la creencia del investigador (a priori) con la evidencia de los datos recolectados (verosimilitud), los cuales se consideran fijos. En este caso se tiene una medida de incertidumbre y no de frecuencia.
Pros y contras de la estadística bayesiana
Existen muchas críticas sobre ambas corrientes (sobre todo hacia la estadística bayesiana en cuanto a la elicitación de la distribución a priori), así como ventajas indiscutibles. Aquí nos centraremos en mencionar algunos aspectos a favor de la estadística bayesiana según varios autores:
- Es adecuada para aprender inductivamente a partir de la experiencia.
- Su aplicación no contiene una subjetividad mayor que la de otros métodos estadísticos. Por ejemplo, el nivel de significación se establece arbitrariamente, la definición de las variables, escalas de medición, pruebas de significación utilizadas, son otros ejemplos de las elecciones subjetivas del investigador en la estadística clásica. Díaz(2007)
- Proporciona la información que realmente interesa a los investigadores en términos de incertidumbre acerca de los parámetros.
- Se puede dar una medida de incertidumbre sobre el verdadero valor del parámetro y obtener un intervalo de credibilidad cuya interpretación es totalmente diferente a los intervalos de confianza frecuentista. Por ejemplo, la probabilidad de que un parámetro caiga dentro de un intervalo calculado es igual a 0,90.
- Brinda un campo amplio de soluciones a respuestas que en algunas situaciones no puede resolverse con la estadística clásica o esta no responde a las preguntas planteadas según la investigación.
- Existe software estadístico que facilita la aplicación de esta metodología.
- Se puede repetir el análisis usando diferentes distribuciones iniciales e informar las diferencias obtenidas en la distribución final.
- La distribución a posteriori puede emplearse como distribución a priori de otro análisis, tomando en cuenta nueva información que se tenga, lo cual no ocurre en estadística clásica donde en caso de haber nueva información debe realizarse el proceso nuevamente.
- Resulta muy difícil en ciencia partir de un desconocimiento total de un fenómeno y/o ejecutar experimentos en forma repetida, por tanto el enfoque bayesiano está siendo ampliamente utilizado en este campo.
Por qué deberíamos utilizar la estadística bayesiana
Dado que es el investigador quien especifica la distribución inicial de los parámetros de un modelo bayesiano, esto puede llevar a que distintos investigadores, asumiendo que tengan la misma información muestral, obtengan diferentes resultados de los mismos datos.
También puede ocurrir que, si no se tiene una idea clara de la distribución inicial al comienzo del análisis, cambiemos los modelos e interpretaciones a lo largo del mismo. No obstante esto no resulta un problema, ya que es común en la modelización «dejar a los datos que hablen por sí mismos».
De cualquier manera, lo cierto es que gracias al avance de los métodos computacionales y el surgimiento de algoritmos y métodos para Estadística Bayesiana vía simulación como *Cadenas de Markov Monte Carlo (MCMC por sus siglas en Inglés) cada vez está siendo más utilizada la Estadística Bayesiana gracias a su adaptación favorable en situaciones complejas donde difícilmente puede llegarse a una buena conclusión usando la estadística clásica. Con el planteamiento subjetivo de la probabilidad podemos plasmar en un modelo toda forma de conocimiento que se tenga sobre un tema, por lo cual la estadística bayesiana está implementándose cada vez más en investigaciones científicas.
Esperamos que este artículo haya despejado cualquier duda y sea un incentivo para que comiences a usar la estadística bayesiana en procesos donde requieras la toma de decisiones basadas en tus conocimientos y experiencia y en los datos observados en cualquier proyecto de investigación. Proximamente publicaremos algunos artículos sobre ejemplos breves del uso de estadística bayesiana con Python.
A continuación mencionamos algunos casos de uso de la estadística bayesiana:
- Aplicación de modelos bayesianos para estimar la prevalencia de enfermedad y la sensibilidad y especificidad de tests de diagnóstico clínico sin gold standard
- Descripción general de la Inferencia Bayesiana y sus aplicaciones en los procesos de gestión
- Aplicación de la inferencia bayesiana al análisis de competitividad. Caso: Industria de partes y piezas de madera.
- Aplicación de técnicas bayesianas en el análisis genético de árboles forestales
Referencias
- Aplicaciones de la estadística bayesiana
- Díaz C. (2007). Viabilidad de la enseñanza de la inferencia bayesiana en el análisis de datos en Psicología. Tesis. Granada: Universidad de Granada.
- Correa y Barrera (2018). Introducción a la estadística Bayesiana. 1era edición. Medellín-Colombia. Instituto Tecnológico Metropolitano.