Importancia y rol de la
bioestadística en Ciencias de la
Salud
Importance and role of biostatistics in Health
Sciences
Félix Omar López Contreras
Especialista en Traumatología y
Ortopedia, Hospital General del Norte de
Guayaquil Los Ceibos,
dromarlopezc@gmail.com,
https://orcid.org/0000-0003-1917-4484.
Jonathan Gabriel Ordóñez Astudillo
dico general, Benemérito Cuerpo de
Bomberos de Guayaquil,
jonathan.gabriel87@gmail.com,
https://orcid.org/0000-0002-0209-6240
Carolina Rocío Bello Vinueza
Especialista en Pediatría, Hospital General
de Portoviejo-IESS, carobevi@gmail.com,
https://orcid.org/0000-0001-7636-3674
Alexandra Asunción Vanegas Vélez
Magíster en Gerencia en Salud y
Desarrollo Local, Hospital Matilde Hidalgo
de Procel, alexav2002@hotmail.com,
https://orcid.org/0000-0001-5877-5659
Cristopher Adrián López Diaz
Estudiante de Medicina, Universidad
Católica de Santiago de Guayaquil,
adrian2805lopezdiaz@hotmail.com,
https://orcid.org/0000-0002-1914-9759
Guayaquil - Ecuador
http://www.jah-
journal.com/index.php/jah
Journal of American health
Julio - Diciembre vol. 5. Num. 2 – 2022
Esta obra está bajo una Licencia Creative
Commons
Atribución-NoComercial-CompartirIgual
4.0 Internacional.
RECIBIDO: 4 DE FEBRERO 2022
ACEPTADO: 10 DE ABRIL 2022
PUBLICADO: 31 DE JULIO 2022
RESUMEN
La bioestadística se puede definir como la
ciencia de los métodos de reducción de
datos, variabilidad y poblaciones, en el
campo de la medicina y las ciencias
biomédicas. Tras los avances tecnológicos
en las ciencias biomédicas durante el siglo
XX, la bioestadística moderna se enfrenta
al formidable desafío de traducir la
información en conocimiento. La
bioestadística ha contribuido
significativamente al desarrollo de las
ciencias biomédicas en muchas áreas:
medicina de laboratorio (valores de
referencia y control de calidad), ensayos
clínicos aleatorizados (ECA), toma de
decisiones clínicas, desarrollo de nuevos
fármacos. Sin embargo, la explosión de la
investigación científica en las últimas
décadas ha llevado al mal uso y al abuso de
los métodos estadísticos. Por lo tanto,
siempre debe prevalecer el sentido común.
Esta revisión tiene como objetivo conocer
la importancia clínica de la bioestastica
aplicada a las investigaciones en ciencia de
la salud y su correcto uso. La metodología
empleada fue el análisis documental, se
emplearon motores de búsqueda como
Scielo y Pubmed usando las palabras clave
específicas relacionadas el tema.
PALABRAS CLAVE: bioestadística,
investigación, análisis, inferencial,
descriptivo.
ABSTRACT
Biostatistics can be defined as the science
of data reduction methods, variability and
populations, in the field of medicine and
biomedical sciences. Following the
technological advances in the biomedical
sciences during the 20th century, modern
biostatistics faces the formidable challenge
of translating information into knowledge.
Biostatistics has contributed significantly to
2
the development of biomedical sciences in
many areas: laboratory medicine
(reference values and quality control),
randomized clinical trials (RCTs), clinical
decision making, new drug development.
However, the explosion of scientific
research in recent decades has led to the
misuse and abuse of statistical methods.
Therefore, common sense should always
prevail. This review aims to know the
clinical importance of biostatistics applied
to research in health science and its correct
use. The methodology used was
documentary analysis, search engines such
as Pubmed, Elsevier, Scielo and Uptodate
were used using specific keywords related
to the topic.
KEYWORDS: biostatistics, research,
analysis, inferential, descriptive.
INTRODUCCIÓN
El razonamiento estastico proporciona la base teórica para extraer conocimiento de los datos
en presencia de variabilidad e incertidumbre (1). Es un elemento crítico de la mayoría de las
investigaciones empíricas en salud blica y medicina clínica, y los mejores estudios incorporan
aportes bioestadísticos en aspectos que van desde el diseño del estudio hasta el análisis de
datos y la presentación de informes. Los métodos bioestadísticos sustentan disciplinas clave de
investigación en salud blica, como la epidemiología y la investigación en servicios de salud,
un papel que refleja la naturaleza central de la disciplina bioestadística (2,3). De manera similar,
la bioinformática y la biología computacional son nuevas áreas importantes en la investigación
biomédica intensiva en datos que se sustentan en conceptos y métodos estadísticos, junto con
componentes fuertemente informados por otras disciplinas centrales, como la informática y
las matemáticas haciéndose eco de observaciones similares realizadas más de dos décadas
antes.
Es importante destacar que la bioestadística, como una subdisciplina de la estadística
(posiblemente, la "ciencia de datos" original), es una disciplina científica establecida propia y
no es simplemente un conjunto de herramientas de técnicas que deben usarse correctamente
(4). El trabajo bioestadístico sólido requiere no solo una comprensión de las mateticas, la
probabilidad y las fuentes de sesgo, que sustentan la teoría y los todos estadísticos, sino
también (y cada vez más) amplias habilidades técnicas, incluida la informática. Se necesita una
formación profunda para desarrollar estas habilidades junto con la comprensión necesaria para
conceptualizar los problemas y navegar por las aguas difíciles entre las cuestiones de salud del
mundo real y las técnicas complejas.
La comprensión superficial de las estadísticas puede conducir fácilmente a una práctica no
científica y puede considerarse responsable en gran parte de la actual "crisis de
reproducibilidad" en la investigación. La era emergente de los grandes datos aumenta la
necesidad de experiencia en bioestadística, con más tomadores de decisiones e investigadores
que buscan extraer valor de datos complejos y desordenados, y un uso creciente de software
3
empaquetado por parte de personas con una comprensión insuficiente de los métodos
subyacentes.
La big data requiere una comprensión avanzada de los conceptos y todos estadísticos
fundamentales, incluidos los desarrollos recientes en el razonamiento causal, así como una
mayor capacidad en herramientas computacionales como reducción de dimensionalidad,
procesamiento distribuido, aprendizaje automático y procesamiento de lenguaje natural
(5). Más datos no necesariamente significan mejores datos, y más análisis no necesariamente
significan mejor ciencia, ya que la calidad y la reproducibilidad de los hallazgos de la
investigación seguirán dependiendo en gran medida del diseño de la recopilación de datos, la
comprensión de las limitaciones asociadas y los sesgos resultantes, así como como todos
analíticos apropiados.
En este informe, proporcionamos un esquema general tanto del marco descriptivo como
analítico de las estadísticas utilizando ejemplos reales para ilustrar cómo, cuándo y qué
significan estos análisis en términos clínicos. Esto es esencial para la integridad científica del
estudio de investigación y su aceptación en la comunidad médica general. Además, se enfocará
en los errores estadísticos más comunes que se encuentran en la literatura médica y se brinda
consejos y trucos sobre cómo evitarlos.
MATERIALES Y MÉTODOS
Se realizó un estudio bibliográfico y transversal, que analizó publicaciones en libros y artículos
en las siguientes bases de datos: SciELO (Scientific Electronic Library Online) y PubMed
(Disponible en el Centro Nacional de Información Biotecnológica). Los términos de búsqueda
fueron "bioestadística”, “investigación”, “análisis”, “inferencial”, “descriptivo”. La búsqueda se
realizó el 1 de enero del 2000 hasta el 31 de diciembre del 2022. Los criterios de inclusión
fueron artículos de revisión narrativa o sistemática y artículos originales cuyo tema central fue
la importancia de la bioestadística, utilidad y aplicabilidad en ciencias de la salud. Solo se
incluyó literatura inglés y español, excepto aquellos artículos de carácter histórico que deben
mencionarse por su importancia en el tema. De un total de 36 artículos seleccionados, se
excluyeron 12 artículos que no estaban en inglés y solo 24 artículos cumplieron con los criterios
de inclusión.
RESULTADOS
La bioestadística se refiere a la aplicación de cnicas estadísticas a datos biológicos recopilados
prospectiva y/o retrospectivamente (1-3). En pocas palabras, la estadística juega un papel clave
en todas las fases de un proyecto de investigación, desde la etapa de diseño hasta el
seguimiento, la recopilación de datos, el análisis de datos y la interpretación de los resultados
en términos clínicos (4). Una comprensión clara del enfoque estadístico en relación con la
hipótesis del estudio, los resultados informados y la interpretación es vital para la integridad
científica y la interpretación de los hallazgos del estudio en la comunidad dica general (5). El
importante papel que desempeña la estadística en el campo de la investigación dica, y los
errores comunes de informes estadísticos y las formas de evitar esos errores son bien
reconocidos y ampliamente publicados
4
Una comprensión básica de los conceptos estadísticos es necesaria para evaluar efectivamente
la literatura existente. Sin embargo, los resultados estadísticos no permiten determinar la
aplicabilidad clínica de los hallazgos publicados. Los resultados estadísticos se pueden usar para
hacer inferencias sobre la probabilidad de un evento entre una población determinada. Se
requiere una interpretación cuidadosa por parte del dico para determinar el valor de los
datos que se aplican a un paciente individual o grupo de pacientes.
Los buenos estudios de investigación proporcionarán una hipótesis o predicción clara y
comprobable sobre lo que esperan encontrar en las relaciones que se prueban (5). La hipótesis
se basa en la literatura empírica, en observaciones clínicas o experiencia, y debe ser
innovadora en sus pruebas de una relación novedosa o confirmación de un estudio previo. Hay
como mínimo dos hipótesis en cualquier estudio: (1) la hipótesis nula asume que no hay
diferencia o que no hay efecto, y (2) la hipótesis experimental o alternativa predice que ocurrirá
un evento o resultado. A menudo, la hipótesis nula no se establece o se asume (6,7-9,10). Las
hipótesis se prueban examinando las relaciones entre las variables independientes, o aquellas
que se cree que tienen algún efecto, y las variables dependientes, o aquellas que se cree que
son movidas o afectadas por la variable independiente. Estas también se denominan variables
predictoras y de resultado, respectivamente (11).
Las estadísticas se utilizan para probar la hipótesis alternativa o experimental de un
estudio. Los modelos estadísticos se ajustan según la naturaleza, el tipo y otras características
del conjunto de datos (9). Los datos generalmente involucran niveles de medicn, y estos
determinan el tipo de modelos estadísticos que se pueden aplicar para probar una hipótesis.
Los datos nominales son aquellas variables que contienen dos o más categorías sin un orden o
valor subyacente (10). Los ejemplos de datos nominales incluyen indicadores de pertenencia a
grupos, como hombres o mujeres. Los datos ordinales son datos nominales que incluyen un
orden o una clasificación, pero tienen un espacio indefinido entre grupos o niveles, como la
clasificación del profesorado o el nivel educativo (11). Los datos de intervalo son datos
ordinales con un espacio claramente definido entre los intervalos y sin puntos cero
absolutos. Un ejemplo de datos de intervalo es la escala de temperatura, ya que la magnitud
de la diferencia entre intervalos es consistente y medible (un grado).
Los datos de proporción son datos de intervalo que incluyen un cero absoluto, como el monto
de la deuda de préstamos estudiantiles. Los datos nominales y ordinales son categóricos,
donde las entidades se dividen en grupos distintos, mientras que, depende del investigador
aplicar adecuadamente los modelos estadísticos al probar hipótesis (12). Se pueden usar varios
enfoques para analizar el mismo conjunto de datos, y la forma en que esto se logra depende
en gran medida de la naturaleza de la redacción en la hipótesis de un investigador. Existe una
variedad de paquetes de software estadístico, algunos disponibles de forma gratuita mientras
que otros cobran tarifas de licencia anuales, que se pueden utilizar para analizar datos (13). Casi
todos los paquetes requieren que el usuario tenga una comprensión básica de los tipos de
datos y la aplicación adecuada de modelos estadísticos para cada tipo. Los paquetes más
sofisticados requieren que el usuario use el lenguaje de codificación patentado del programa
5
para realizar pruebas de hipótesis (14). Estos pueden requerir una buena cantidad de tiempo
para aprender, y los errores pueden pasar fácilmente desapercibidos para el ojo inexperto.
Se recomienda enfáticamente que los usuarios que no estén familiarizados consulten con un
analista estadístico cuando diseñen y ejecuten modelos estadísticos. Las consultas
bioestadísticas pueden ocurrir en cualquier momento durante un estudio, pero las consultas
anteriores son aconsejables para evitar la introducción de sesgos accidentales en los datos del
estudio y para ayudar a garantizar la precisión y los métodos de recopilación que serán
adecuados para permitir las pruebas de hipótesis.
La elección de una muestra puede ser extremadamente difícil. La muestra debe ser
representativa de toda una población para ser utilizada como guía. El uso de una muestra
representativa asegura que las inferencias y conclusiones puedan extenderse con seguridad
desde la muestra a toda la población. Un problema crucial es determinar el tamaño adecuado
de la muestra. La muestra debe ser lo suficientemente grande para ser representativa, pero no
necesita ser demasiado grande para reducir los costos del estudio (11,15).
Significancia estadística
Si la probabilidad de obtener un valor estadístico de prueba por casualidad (valor p) es menor
que 0.05, entonces la hipótesis experimental se acepta como verdadera (1,5). Otra forma de
pensar sobre los valores p es la probabilidad de que la hipótesis nula sea verdadera, lo que para
un punto de corte de p menor que 0.05 significaría que hay menos del 5% de probabilidad de
que la diferencia observada no sea una diferencia verdadera. Sin embargo, al interpretar los
resultados estadísticos, el valor p por sí solo no es suficiente. Significativo no siempre equivale
a importante (12,16). Efectos muy pequeños, potencialmente sin importancia, pueden resultar
estadísticamente significativos.
Significancia clínica
Para evaluar la relevancia cnica o la importancia de un resultado significativo, uno debe estar
seguro de considerar el tamaño del efecto. Las medidas de efecto están estandarizadas para
permitir su aplicación en diferentes escalas de medición. Las siguientes son algunas de las
formas más comunes en que se pueden estimar los tamaños del efecto (16):
1. Realizar una revisión de la literatura y examinar los resultados informados,
2. Llevar a cabo estudios piloto para obtener una indicación de los efectos que podrían verse
en estudios más amplios,
3. Hacer conjeturas basadas en lo que es clínica o prácticamente significativo e informado por
la experiencia.
4. Uso de recomendaciones convencionales para medidas del tamaño del efecto
Una medida común del efecto es el coeficiente de correlación, r. En general, los efectos
pequeños, o r=.10, indican que el efecto explica el 1% de la varianza total. Asimismo, r=.30 se
considera un efecto medio y r=.50 grande, explicando el 25% de la varianza y teniendo mayor
relevancia clínica. El cuadrado de un valor r correlacional indica la proporción de varianza
6
explicada por la relación probada (14,15). De manera similar, los intervalos de confianza
ofrecen una forma de determinar la fuerza clínica o la magnitud de los efectos observados.
Un intervalo de confianza del 95 % indica un rango de valores plausibles en torno a otro
parámetro (la media o la razón de probabilidades) donde existe un 95 % de probabilidad de
que los datos dentro de ese intervalo realmente capturen el valor observado en la población
que se está estudiando (16). Los intervalos de confianza también brindan información sobre la
precisión, ya que los intervalos más pequeños sugieren una mayor precisión; mientras que los
intervalos más grandes pueden sugerir un alto nivel de variabilidad (17). Se ha recomendado
que, como mínimo, los estudios deben informar las estimaciones del efecto y los intervalos de
confianza para permitir una interpretación adecuada de sus resultados.
También es importante tener en cuenta que, aunque un estudio puede diseñarse y probarse
estadísticamente de manera que sugiera que se podría concluir la inferencia y la causalidad
(observaciones longitudinales de cambios a lo largo del tiempo), solo los estudios que emplean
un diseño aleatorio y/o controlado permitir que se hagan declaraciones causales a partir de sus
resultados.
El análisis estadístico es esencial para cualquier investigación clínica. Es de mayor importancia
comprender la importancia clínica de los resultados informados y determinar si esos resultados
pueden extrapolarse a la población general (17). Comprender las definiciones y los métodos
descritos anteriormente debería ayudar a una mejor comprensión y facilidad de uso para los
profesionales y estudiantes médicos.
Principales errores estadísticos en investigación cienfica de salud
Diseño de estudio inapropiado
Con frecuencia, el objetivo del estudio es probar una hipótesis nula (H
0
) contra la alternativa
(H
1
) utilizando un conjunto particular de datos bajo el diseño de estudio adecuado. Las fallas
durante el diseño del estudio dan como resultado errores fundamentales, que son difíciles de
corregir durante el proceso de análisis estadístico. La selección de los grupos objetivo y de
control apropiados constituye un paso fundamental en el proceso de diseño del estudio (1-
5,10,14). Decisiones igualmente importantes están relacionadas con la elección de los métodos
óptimos de aleatorización, cegamiento y emparejamiento. Vale la pena mencionar que la
eficacia clínica ("¿puede funcionar?") se demuestra en "circunstancias óptimas" en ensayos
controlados aleatorios, mientras que los estudios de cohortes se reservan para la eficacia
("¿funciona?”). De manera similar, la eficiencia clínica ("¿vale la pena? ") se evalúa mediante
estudios de evaluación económica, que incluyen análisis de costo-beneficio, costo-efectividad
y costo-utilidad (17,18).
Estudios con bajo poder estadístico sin una estimación a priori del tamaño de la muestra
Un componente inherente del proceso de diseño del estudio es la estimación de la muestra del
estudio para asegurar un poder adecuado y detectar la significación estadística. El tamaño de
muestra requerido depende del nivel aceptable de error tipo II, la diferencia o efecto de interés
y la variabilidad estimada de la variable de resultado (10). Idealmente, el tamaño de la muestra
7
se calcula para obtener estimaciones de la precisión deseada, detectar un efecto si realmente
existe y debe ser lo suficientemente grande como para compensar los abandonos (18). Es
posible que los estudios de tamaño pequeño no tengan el poder suficiente para llegar a
conclusiones estadísticas seguras, mientras que las muestras injustificadamente grandes
conducen a un desperdicio innecesario de recursos.
Valores faltantes
Los valores perdidos constituyen un problema esencial en el proceso de recolección de datos,
ya que reducen el poder total del estudio y pueden introducir sesgos. La gravedad del problema
depende de la naturaleza y la magnitud de la 'falta'. En general, existen tres tipos de datos
perdidos según el modo de ocurrencia (19): perdidos completamente al azar (MCAR), perdidos
al azar (MAR) y perdidos no al azar (MNAR). En el caso de MCAR, la probabilidad de que falten
datos no esrelacionada ni con el valor específico que se supone que se obtiene, ni con el
conjunto de respuestas observadas. MAR ocurre cuando la probabilidad de que falten las
respuestas depende del conjunto de respuestas observadas, pero no es relacionada con los
valores faltantes específicos. Si los datos faltantes no son MCAR o MAR, entonces entran en la
categoría de MNAR (20).
No existe un método óptimo para tratar los datos faltantes. Con mucho, la práctica más común
es realizar un análisis basado en los casos completos. Alternativamente, se recomienda alguna
forma de imputación de datos faltantes. La imputación media, la imputación de regresión y la
última observación llevada adelante, solo por nombrar algunas, se han utilizado
esporádicamente en la literatura médica.
Categorización de variables continuas
La categorización de variables continuas es una práctica común en la investigación
clínica. Simplifica el análisis estadístico y facilita la interpretación y el informe de resultados
(3,7,10). Sin embargo, conduce a varios problemas estadísticos graves, incluida la pérdida de
precisión del estudio, la aparición del error de tipo I y la ocultación de la no linealidad entre las
variables dependientes e independientes. La categorización se justifica cuando los datos están
marcadamente sesgados, las variables muestran una relación no lineal entre sí y cuando los
valores son “estimaciones” o imputaciones de datos faltantes (15). Se desaconseja
encarecidamente el uso de puntos de corte "óptimos" que den como resultado valores p
mínimos (20). Si se va a utilizar un punto de corte, entonces es preferible utilizar umbrales
clínicamente importantes.
Violación de supuestos estadísticos
La mayoría de las pruebas paramétricas son válidas dado que se cumplen ciertos supuestos,
incluido el supuesto de normalidad, independencia, linealidad e igualdad de varianza u
homocedasticidad. Las pruebas de Shapiro-Wilk y Smirnoff-Kolmogorov se pueden utilizar para
probar el supuesto de distribución de normalidad. La suposición de linealidad se puede evaluar
mediante la inspección de la gráfica de "residuales sobreajustados". La igualdad de varianza
puede evaluarse mediante la prueba F para comparar las varianzas de dos muestras, y la prueba
de Bartlett o la prueba de Levene para comparar las varianzas de ltiples muestras. Las
pruebas no paramétricas, caracterizadas por una baja potencia estadística en muestras
8
pequeñas, se utilizan cuando no se cumplen los supuestos estadísticos. La violación de estos
supuestos conduce a resultados y conclusiones erróneas (8,12,20,21).
No detectar dependencias
La unidad estadística, definida como la entidad sobre la cual se recibe información, constituye
un parámetro frecuentemente sub-reportado en la Literatura Médica. Los pacientes
individuales forman las unidades estadísticas más utilizadas (18). La falta de reconocimiento de
la unidad estadística conduce con frecuencia a la ocultación de dependencias y la manipulacn
de variables dependientes como independientes, a costa de información valiosa (22). Los datos
de mediciones repetidas y grupos emparejados son ejemplos de datos dependientes que
requieren un manejo especial.
Múltiples comparaciones
Toda prueba estadística conlleva una probabilidad distinta de cero de detectar
incorrectamente la significación por casualidad (error de tipo I). Realizar comparaciones
múltiples aumenta este error potencial y debe evitarse. Están disponibles varias pruebas y
ajustes especializados, que difieren en los términos de cómo controlan la tasa general de error
de tipo I (11,15,20). La prueba de Dunnett se usa para comparar cada una de varias condiciones
experimentales con un control. Las pruebas de Tukey o Duncan se utilizan para comparar todos
los pares de condiciones experimentales, según el mero de comparaciones deseadas y los
tamaños de muestra (21,22). El ajuste de Bonferroni es otro enfoque válido, según el cual el
nivel de significación se restablece en 0,05/N, donde N representa el número de comparaciones
de interés. Alternativamente, se aconseja a los investigadores que reconozcan el riesgo de
falsos positivos en la sección de limitaciones (23).
Interpretaciones incorrectas del valor p
Se ha abusado de los valores P de múltiples maneras. Para empezar, la significación estadística
estimada por el p-valor no es equivalente a la relevancia e importancia clínica. Los valores P se
centran únicamente en la prueba de hipótesis estadísticas, no transmiten información
cuantitativa importante y no proporcionan evidencia de direccionalidad (una o dos colas)
(10). Por lo tanto, un valor p muy pequeño no representa necesariamente una gran diferencia
(o asociación) entre dos variables. Asimismo, la ausencia de evidencia (valor p grande) no es
sinónimo de evidencia de ausencia (sin efecto). Esto es particularmente cierto cuando no hay
una estimación del tamaño de muestra requerido.
Subinforme de las estimaciones del tamaño del efecto
La relevancia clínica y la significación estadística se representan con frecuencia con la
estimación del tamaño del efecto junto con sus intervalos de confianza del 95%, que con
frecuencia no se informan lo suficiente (4,9). A veces se evalúa la relevancia clínica de los
resultados según los niveles establecidos por el investigador. Los intervalos de confianza del
95% denotan que, al repetir el experimento, el 95% de las muestras incluirán el valor verdadero
dentro de su IC del 95%. Un intervalo de confianza amplio significa que el tamaño de la muestra
era demasiado pequeño, mientras que un intervalo estrecho indica una alta precisión
(16,20). En consecuencia, muchas revistas de renombre han desaconsejado durante mucho
9
tiempo el uso de valores de p y recomendaron estimaciones del tamaño del efecto y los
intervalos de confianza del 95 %.
Uso inapropiado de la desviación estándar y del error estándar de la media
Tradicionalmente, una variable continua se describe mediante una medida de tendencia
central (media o mediana) y una medida de dispersión, como la desviación estándar (DE). Por
otro lado, el error esndar de la media (EEM), una estadística inferencial, es una medida de la
precisión de la media (16,19). Es un error frecuente proporcionar números sin citar lo que
representan. Igualmente, importante, la desviación estándar y el error estándar de la media no
son sinónimos y no deben usarse indistintamente. El EEM es la DE dividida por la raíz cuadrada
del tamaño de la muestra. La elección de EEM sobre DE depender en última instancia de lo que
el investigador está tratando de transmitir en su informe (22,23).
Pobres tablas y figuras
Las tablas y figuras son herramientas valiosas para almacenar, analizar e interpretar datos. Sin
embargo, los artículos publicados deben contener el número mínimo de tablas y figuras para
ayudar en la comunicación adecuada del estudio (5). Con este objetivo, las tablas se utilizan
con frecuencia para comunicar datos numéricos precisos, los gráficos se optimizan para
presentar patrones generales y comparaciones, y los mapas se reservan para resaltar las
relaciones espaciales. No obstante, tal práctica no esexenta de posibles errores (8,12,16).
Con frecuencia, los investigadores sin experiencia no saben cómo hacer coincidir el tipo de
gráfico adecuado con el tipo de datos disponible y terminan usando gráficos al azar, lo que da
como resultado una impresión errónea de la verdadera naturaleza de los datos
(24). Finalmente, muchas pantallas gráficas carecen de una descripción adecuada de la
leyenda, los ejes y las estadísticas subyacentes.
DISCUSIÓN
El análisis estadístico se refiere a una colección de todos utilizados para procesar grandes
cantidades de datos e informar tendencias generales. Incluye la recopilación, examen,
resumen, manipulación e interpretación de datos cuantitativos para descubrir sus causas
subyacentes, patrones, relaciones y tendencias. Una comprensión clara de los objetivos del
proyecto de investigación y los datos de la investigación son clave para utilizar las herramientas
estadísticas adecuadas, lo que a su vez es esencial para la interpretación precisa de los
resultados.
El establecimiento exitoso de la bioestadística como una disciplina central dentro de la salud
académica y la investigación médica requiere el reconocimiento de la bioestadística como una
disciplina académica, fundamental para la infraestructura intelectual de la empresa de
investigación más amplia. Esto implica la necesidad de estructuras que respalden una variedad
de niveles de trabajo bioestadístico, desde no especialistas como médicos, hasta graduados en
bioestadística a nivel de maestría y estudiantes de doctorado, hasta investigadores
postdoctorales y líderes de investigación en metodología bioestadística. La necesidad de
actividad académica en este rango es similar en otras áreas de la ciencia, pero se pasa por alto
ampliamente para la bioestadística debido a la tendencia a considerar el campo como un
10
simple conjunto de herramientas de técnicas en lugar de una disciplina de investigación en
evolución propia.
La investigación bioestadística desarrolla y evalúa métodos rigurosos para sacar conclusiones
de nuevos diseños de estudio y nuevos tipos de datos, un proceso extenso que implica
derivaciones y conceptualizaciones matemáticas, estudios de simulación, estudios de casos
detallados y traducción de los métodos desarrollados recientemente para que los utilicen otros
investigadores. Como ejemplo del papel clave de los nuevos métodos estadísticos, el desarrollo
de modelos estructurales marginales fue fundamental en la ola de investigación sobre
antirretrovirales para el tratamiento de la infección por el virus de la inmunodeficiencia
humana, al permitir el manejo adecuado de la confusión dependiente del tiempo en las
decisiones de tratamiento basadas en los niveles de recuento de lulas CD4 que se ven
afectados por el tratamiento (21). La experiencia en investigación metodológica también es un
componente esencial en la formación de futuros líderes bioestadísticos.
Como para cualquier disciplina académica, para apoyar el desarrollo continuo de amplias vías
de formación para bioestadísticos, necesitamos estructuras departamentales claramente
identificadas dentro de nuestras instituciones. Estos deben proporcionar centros de suficiente
masa crítica para permitir la transferencia de experiencia y conocimiento dentro y entre los
múltiples niveles de actividad, desde no especialistas hasta líderes de investigación. Estos
centros deben estar integrados en las escuelas de salud pública, medicina y ciencias de la salud,
y sus institutos asociados, y deben estar dirigidos por bioestadísticos activos en la investigación
metodológica.
La importancia fundamental de la bioestadística para la salud y la investigación médica ha sido
reconocida en otros países. En los Estados Unidos, muchas universidades importantes tienen
departamentos de bioestadística que se establecieron en la cada de 1970 a través de la
financiación de programas de capacitación en investigación bioestadística por parte de los
Institutos Nacionales de Salud, con un llamado para un esfuerzo renovado para expandir los
programas de capacitación en bioestadística en 2006 (17). De manera similar, el Consejo de
Investigación Médica del Reino Unido ha financiado durante mucho tiempo un centro nacional
de metodología bioestadística la Unidad de Bioestadística del Consejo de Investigación
Médica y, desde 2009, una serie de centros de metodología cuya agenda principal de
investigación es la metodología estadística (21). También hay fuentes de financiación dedicadas
a la investigación metodológica.
En Europa continental, el consorcio Integrated Design and Analysis of Small Population Group
Trials (IDEAL) recibió 3 millones de euros entre 2013 y 2019 del programa de financiación
Marco para la investigación y la innovación de la Unión Europea para desarrollar nuevas
metodologías de diseño y análisis (22). La inversión a largo plazo en investigación bioestadística
en estas naciones significa que están mucho mejor posicionadas en términos de infraestructura
metodológica que sustenta su investigación médica. Por ejemplo, los investigadores modernos
se están moviendo hacia ensayos adaptativos y, en particular, ensayos de plataforma, sin
11
embargo, los investigadores que desarrollan tales ensayos en Australia dependen de la
experiencia bioestadística del extranjero.
A diferencia de Europa y EE. UU, nunca ha habido una inversión sistemática en el desarrollo de
la bioestastica en Ecuador, ni en las universidades ni a través de planes de financiación
nacionales. Ninguna de las principales universidades tiene un departamento de
bioestadística; en cambio, hay muchos grupos pequos (o incluso solo individuos), a menudo
conectados entre sí o dentro de departamentos o escuelas que están dominados por disciplinas
distintas a la medicina y la salud pública. Por ejemplo, todas las universidades del país tienen
estructuras que vinculan las estadísticas con las matemáticas o los negocios, lo que inhibe el
vínculo entre la investigación bioestadística y médica que es fundamental para lograr la
excelencia en la planificación, realización y análisis de los estudios de investigación
médica. Este panorama apenas está comenzando a cambiar en la Universidad Internacional del
Ecuador, con iniciativa reciente para la contratación de estadísticos y bioestadísticos en una
variedad de niveles y con la creación de la maestría de investigación en Ciencias de la Salud.
La investigación clínica moderna requiere el uso extensivo de estadísticas. Esto es
comprensible, ya que, por un lado, los autores a veces se caracterizan por un interés excesivo
en lograr un gran volumen de publicaciones y, por otro lado, las revistas han establecido altos
estándares para la aceptación de manuscritos. Sin embargo, la cantidad no va de la mano con
la calidad, y los análisis estadísticos subyacentes con frecuencia se han considerado
subóptimos. Este problema es persistente, grave y desconocido para el nuevo investigador, a
pesar de que la mayoría de los errores se refieren a conceptos estadísticos sicos y pueden
evitarse fácilmente con la formación adecuada. Solo unos pocos autores tienen un
conocimiento profundo de los diversos diseños de estudio y los conceptos estadísticos
subyacentes.
Una parte sustancial del problema se explica por la amplia disponibilidad de software
estadístico y su amplio uso por parte de los no iniciados. Cabe señalar que los errores
estadísticos en la investigación clínica no son éticos, son costosos en términos de tiempo y
recursos y son perjudiciales para la humanidad y la ciencia.
CONCLUSIONES
El uso adecuado de las estadísticas sicas permite al clínico sentirse más confiado en los
resultados de la investigación y así implementar nuevas intervenciones o rmacos en la
práctica clínica. La mayoría de los problemas estadísticos en la literatura dica se atribuyen a
la pobre formación estadística de los autores. Se debe hacer hincapié en la selección del diseño
de estudio adecuado, la estimación del tamaño de muestra de estudio requerido antes de la
inscripción del primer paciente, evitando la categorización de variables continuas y el
tratamiento adecuado de los datos faltantes. Los supuestos estadísticos son obligatorios para
la selección de la prueba estadística adecuada y deben informarse en el manuscrito. Un
objetivo claro del estudio es útil para evitar múltiples comparaciones innecesarias.
12
Ya es hora de pasar del valor p a la estimación del tamaño del efecto. Se requiere especial
cuidado al informar la distribución alrededor de la media y al mostrar los datos en gráficos y
tablas. Se invita a los investigadores a actualizar sus conocimientos con la participación en
cursos de estadística. Además, cada grupo de investigación debe incluir o colaborar con un
experto en bioestadística desde el diseño del estudio hasta la comunicación de los resultados.
REFERENCIAS BIBLIOGRAFICAS
1. Mandrekar J, Mandrekar S. Biostatistics: a toolkit for exploration, validation, and interpretation of
clinical data. J Thorac Oncol. Vol.4(12):1447-9. doi: 10.1097/JTO.0b013e3181c0a329. PMID:
20009908; PMCID: PMC2796575. 2009.
2. Sprent P. Statistics in medical research. Swiss Med Wkly. Vol.133(39-40):522-9. PMID: 14655052.
2003.
3. Hayashi C. What is the role of statistics in medical science?--a critical essay. Gan To Kagaku Ryoho.
Vol.19(2):143-59. Japanese. PMID: 1736827. 1992.
4. Hamada C, Ono H. The role of biostatistics in pharmacological studies (randomization and
statistical evaluation). Nihon Yakurigaku Zasshi. Vol.116(1):4-11. Japanese. doi: 10.1254/fpj.116.4.
PMID: 10976446. 2000.
5. Zapf A, Rauch G, Kieser M. Why do you need a biostatistician? BMC Med Res Methodol.
Vol.20(1):23. Published 2020 Feb 5. doi:10.1186/s12874-020-0916-4. 2020.
6. Albert A. Contribution de la biostatistique au développement des Sciences biomédicales
[Biostatistics contribution to the development of biomedical sciences]. Bull Mem Acad R Med Belg.
Vol.159(5-6):317-24; discussion 324-6. French. PMID: 15693541. 2004.
7. Zelen M. Biostatisticians, biostatistical science and the future. Stat Med. Vol.25(20):3409-14. doi:
10.1002/sim.2658. PMID: 16927436. 2006.
8. Lee K, Moreno-Betancur M, Kasza J, Marschner I. Biostatistics: a fundamental discipline at the core
of modern health data science. Med J Aust. Vol.211(10):444-446.e1. doi:10.5694/mja2.50372.
2019.
9. Zapf A, Huebner M, Rauch G, Kieser M. What makes a biostatistician? Stat Med. Vol.38(4):695-701.
doi: 10.1002/sim.7998.PMID: 30294934. 2019.
13
10. Tsiamalou P, Brotis A. Biostatistics as a Tool for Medical Research: What are we Doing Wrong?
Mediterr J Rheumatol. Vol.30(4):196-200. doi: 10.31138/mjr.30.4.196. PMID: 32467869; PMCID:
PMC7241663. 2020.
11. Indrayan A. Medical Biostatistics as a Science of Managing Medical Uncertainties. Indian J
Community Med. Vol.46(2):182-185. doi: 10.4103/ijcm.IJCM_763_20. PMID: 34321722; PMCID:
PMC8281839. 2021.
12. Zahir H, Javaid A, Rehman R, Hussain Z. Statistical concepts in biology and health sciences. J Ayub
Med Coll Abbottabad. Vol.26(1):95-7. PMID: 25358229. 2014.
13. Wellek S. A critical evaluation of the current "p-value controversy". Biom J. Vol.59(5):854-872. doi:
10.1002/bimj.201700001. 2017.
14. Wissing D, Timm D. Statistics for the nonstatistician: Part I. South Med J. Vol.105(3):126-30. doi:
10.1097/SMJ.0b013e3182498ad5. PMID: 22392207. 2012.
15. De Muth J. Overview of biostatistics used in clinical research. Am J Health Syst Pharm. Vol.66(1):70-
81. doi: 10.2146/ajhp070006. PMID: 19106347. 2009.
16. Cash E, Boktor S. Understanding Biostatistics Interpretation. 2022 Mar 18. In: StatPearls [Internet].
Treasure Island (FL): StatPearls Publishing; 2022 Jan. PMID: 28613710. 2022.
17. Tenny S, Abdelgawad I. Statistical Significance. 2021 Nov 23. In: StatPearls [Internet]. Treasure
Island (FL): StatPearls Publishing; 2022 Jan. PMID: 29083828. 2021.
18. Romano R, Gambale E. Statistics and medicine: the indispensable know-how of the researcher.
Transl Med UniSa. Vol.5(2):28-31. 2013.
19. Januszyk M, Gurtner G. Statistics in medicine. Plast Reconstr Surg. Vol.127(1):437-444. doi:
10.1097/PRS.0b013e3181f95dd2. PMID: 21200241. 2011.
20. Narayanan R, Nugent R, Nugent K. An Investigation of the Variety and Complexity of Statistical
Methods Used in Current Internal Medicine Literature. South Med J. Vol.108(10):629-34. doi:
10.14423/SMJ.0000000000000354. PMID: 26437199. 2015.
14
21. Karran J, Moodie E, Wallace M. Statistical method use in public health research. Scand J Public
Health. Vol.43(7):776-82. doi: 10.1177/1403494815592735. PMID: 26163023. 2015.
22. Hazra A, Gogtay N. Biostatistics Series Module 1: Basics of Biostatistics. Indian J Dermatol.
Vol.61(1):10-20. doi: 10.4103/0019-5154.173988. PMID: 26955089; PMCID: PMC4763618. 2016.
23. Barkan H. Statistics in clinical research: Important considerations. Ann Card Anaesth. Vol.18(1):74-
82. doi: 10.4103/0971-9784.148325. PMID: 25566715; PMCID: PMC4900305. 2015.
24. Rodrigues C, Lima F, Barbosa F. Importância do uso adequado da estatística básica nas pesquisas
clínicas [Importance of using basic statistics adequately in clinical research]. Rev Bras Anestesiol.
Vol.67(6):619-625. Portuguese. doi: 10.1016/j.bjan.2017.01.003. 2017.