Cómo evitar sesgos en la data

Una guía básica para manejar datos, y estadísticas sin sesgos

0

Este artículo es una continuación de este otro sobre sesgos en el manejo de datos. Apunta a contribuir a ser más precisos y objetivos en la reconstrucción de lo que pasa, a nivel periodístico y en otros ámbitos, en los que es cada vez más común trabajar con datos.

¿Cómo evitar tener sesgos en la data y los resultados?

La data se ha convertido en un instrumento bastante poderoso para realizar investigaciones, gracias al desarrollo de herramientas tecnológicas que permiten procesarla de manera más eficiente.

Pero, realizar investigaciones en las que se tenga que manejar data puede ser todo un desafío y se pueden cometer errores que den origen a sesgos en la información y los resultados.

Estos errores y sesgos pueden ser intencionados para buscar cambiar el resultado o pueden tener lugar debido a un descuido del investigador.

En este artículo hablaremos sobre algunas recomendaciones para evitar tener sesgos en la data y en el proceso de investigación, tomando en cuenta algunos de los errores comunes.

Recomendaciones para evitar sesgos en la data y en las investigaciones

 

1. Hacer actualizaciones en la data

Un error común es utilizar data antigua para realizar investigaciones, el problema es que los resultados que se obtienen estarán basados en un periodo anterior y no representara necesariamente lo que pasa en el momento de realizarse la investigación.

Es por ello que se debe mantener actualizada la data, así se podrá ofrecer una imagen actualizada de lo que ocurre. En caso de que en la investigación se estén contrastando distintas hipótesis, lo recomendable es usar distintos sets de data. De esta forma se eliminaran correlaciones que respondan a una misma data y no al fenómeno que se investiga.

 

2. Conocer la data y de donde surge

Un sesgo que se puede tener en una investigación es el sesgo del superviviente, en el cual solo se toman en cuenta datos que han pasado por un filtro.
El problema es que se está dejando fuera de la investigación datos que podrían ser relevante y que, incluso, podrían cambiar por completo el resultado.

Lo más recomendable para evitar este tipo de sesgos es conocer como está compuesta la data con la que se está trabajando, tomarse un tiempo para examinarla. De esta forma, no solo se evita este tipo de sesgos, sino que se podrán hacer manipulaciones a la data para obtener resultados más claros.

 

3. Evitar asumir causalidades en base a los datos.

En muchas ocasiones, dos eventos ocurren de manera simultánea y los investigadores asumen que es debido a que están relacionados. Es decir, piensan que la aparición de uno está ligada a la aparición del otro.

Incluso, algunos se fían de los índices de correlación para demostrar causalidad entre los fenómenos.
Esto es erróneo, para poder demostrar causalidad entre dos sucesos se debe encontrar una secuencia lógica que logre explicar la relación entre los fenómenos.

4. Ser honesto al dividir la muestra.

En algunos estudios es necesario dividir la muestra en grupos. Por ejemplo, si se quiere hacer un estudio sobre distribución de ingreso, utilizando el ingreso promedio de las familias, será necesario dividir los grupos por nivel de ingreso.

El problema es que existe la tentación de establecer grupos “a conveniencia”, es decir, agrupar a las personas de una forma que favorezca al resultado que se quiere obtener con la investigación.

En el ejemplo de la distribución de ingreso, esto se aplica cuando se colocan las divisiones de los niveles de ingreso ajustadas a la muestra para poder tener un porcentaje cercano al que se desea en la investigación.

Las recomendaciones para evitar esto son: ver cuáles son las maneras más comunes de dividir los niveles de ingreso y aplicarlas en el estudio. Si se está consultando la información de cómo se distribuye el ingreso, lo más recomendable es consultar distintas fuentes.

Se debe tener en cuenta que los índices de Gini son una manera bastante acertada y trasparente para hablar sobre distribución de ingreso, aunque no muestre el nivel del ingreso.

 

5. Escoger una muestra representativa.

Quizás la recomendación más importante para cualquier investigación sea esta. Puede que sea un poco difícil estudiar una muestra representativa cuando se está estudiando a una población numerosa. Sin embargo, existen los mecanismos para lograr hacerlo.

El problema que surge cuando la muestra no es representativa, es que las conclusiones que arroja la investigación no son acordes a la población. El tamaño recomendado de la muestra varía dependiendo de cada investigación, lo más recomendable es asesorarse con alguien que tenga experiencia en el tema.

 

6. Evitar el efecto Hawthorne.

Es de esperarse que cuando alguien está siendo vigilado, su actitud pueda cambiar. Esto implica que la reacción de la persona será distinta cuando está siendo estudiado.
Lo recomendable para evitar esto es hacer una medición que no sea intrusiva, es decir, que permita obtener data sin que las personas estén conscientes de ello. Esto no es algo que pueda hacerse siempre, ya que hay algunas cosas que las personas no revelaran si no se les pregunta.

Si el método para obtener la información (data), es realizar una encuesta, algo que no puede hacerse sin que la persona lo sepa (al menos no fácilmente), es recomendable que se haga de forma anónima para que la persona no tenga temor en contestar de forma honesta.

 

7. No centrarse en la fama sino en la metodología.

Lo más importante al realizar cualquier investigación, es mantenerse centrado y aplicar la metodología de manera imparcial. Esto significa que no se deben forzar los resultados y ser completamente honesto en el proceso.

La realidad es que en muchos casos, quien financia la investigación puede tener un interés particular en un resultado específico. Otras veces, el mismo investigador será quien desee algo de fama al presentar un resultado que genere controversia.
Esto deja en muy mala posición a las personas que realizan estas investigaciones, ya que pierden la credibilidad. Además, no es difícil encontrar el “error” que se comete para lograr el resultado que quieren.

Deja una respuesta

Enviar comentarios sobre la nota. Su dirección de correo electrónico no será publicada. Esta sección no es para realizar consultas ni asesoramiento legal, que debe procurarse abogado/a.