Cómo saber si las estadísticas son verdaderas o falsas

Usted no Lo mejor que obtienes (fuera de los sistemas cerrados y conocidos) es una medida de confianza.

Considere el escenario de tablero de dardos inverso. Digamos que tenemos una gran pared de cartón. Por un lado, hemos pintado un tablero de dardos, y yo estoy por ese lado lanzando dardos. Estás del otro lado mirando los lugares donde los dardos se asoman a través del cartón. El problema para usted es determinar (sin caminar alrededor de la pared) dónde está el centro del tablero de dardos. Sabes estas cosas:

  • Qué bueno soy un lanzador de dardos, al observar cuán ampliamente o de cerca están los puntos de dardos.
  • Donde parece que estoy apuntando, calculando el centro de los puntos de dardos que puedes ver

Cuantos más dardos arroje, más sentido tendrá de ambos; cuanto mejor soy el lanzador de dardos, más confianza tienes de que el centro que calculas está cerca del centro real del tablero. Sin embargo, a menos que sea un lanzador perfecto (con cada punto de dardo mostrando exactamente el mismo hoyo), nunca puedes estar exactamente seguro de dónde está el centro del tablero. Lo mejor que puede hacer es dibujar un círculo aproximado (calculado a partir de mi distribución de lanzamientos) y decir que está razonablemente seguro de que el centro del tablero está en ese círculo en alguna parte.

Y eso ni siquiera aborda el problema del sesgo invisible; ¿Qué pasa si todos mis disparos se levantan hacia la izquierda?

Las estadísticas son herramientas, probablemente debería preocuparse más sobre si las inferencias hechas a partir de las estadísticas son verdaderas.

En ese caso: busque sesgos tanto en la forma en que se recopilaron los datos como en la forma en que se analizaron. Asegúrese de que tengan una muestra lo suficientemente grande y de que su población sea representativa de la población sobre la que están haciendo inferencias.