La estadística médica ¿entra en un paquete?
Dr. Jorge Pouso
Médico intensivista, experto en estadística médica
[email protected]
Nihil temere crediteris (No creas nada a la ligera)
Marco Porcio Catón (234-149 AC)
La medicina - arte milenario -ha recibido, no sin cierta desconfianza, a mediados del siglo XX el aluvión de la bioestadística moderna y, a fines del mismo, el de la informática. Esta ha incidido singularmente en aquella colaborando en el desarrollo de procesos de cálculo iterativos y por tanto poniendo al alcance de prácticos e investigadores métodos y modelos de alta complejidad.
Desde que Richard Doll y Austin Bradford Hill (1) demostraron la asociación significativa entre tabaquismo y cáncer de pulmón con una simple prueba de chi cuadrado, la presencia de la estadística en las publicaciones científicas médicas se ha incrementado de modo tal que hoy la gran mayoría de las investigaciones publicadas contienen un capítulo de métodos estadísticos. Estos se han hecho progresivamente más sofisticados intentando reflejar la realidad clínica a través del análisis y control de las múltiples variables potencialmente incidentes en el resultado final.
Paquetes y métodos estadísticos
Para ejecutar completamente un método estadístico en un ordenador es necesario un programa que cumpla paso a paso con el mismo. Cubrir la amplia gama de métodos estadísticos hace necesario colecciones de programas o paquetes que suelen constituir la forma en que se presenta el software estadístico.
Conceptualmente, un paquete estadístico es un conjunto de programas informáticos específicamente diseñados para el análisis estadístico de datos con el objetivo de resolver problemas de estadística descriptiva, inferencial o ambos.
Esta tarea suele estar en manos de organizaciones empresariales comerciales, universitarias o gubernamentales que facilitan los manuales, periódicamente crean nuevas versiones revisadas, ampliadas y actualizadas a las disponibilidades de hardware y sistemas operativos, los hacen más fáciles de usar, presentando los resultados en forma más clara. Estos paquetes, debido a su extensa utilización suelen estar exentos de errores de cálculo - aunque no siempre conceptuales- y suelen incluir herramientas gráficas.
Aunque los paquetes abarcan la mayoría de los métodos estadísticos, es imposible que se encuentren siempre completamente actualizados o que incluyan métodos muy especializados. Por esta razón existen programas desarrollados por autores de nuevos métodos, como por ejemplo Breslow y Day (para casos y controles, en 1980) o Coleman (mortalidad en sujetos-año , en 1990).
Paquetes extensamente usados como SPSS - Statistical Package for the Social Sciences, BMDP, SAS- Statistical Analysis Systems, Minitab, Genstat y GLIM fueron diseñados inicialmente para mainframes , pero actualmente los ordenadores personales o PC o microordenadores son la forma más común de ordenador usada en la ejecución de estos programas , conservándose únicamente los mainframes para conjuntos muy grandes de datos.
Todos los análisis estadísticos implican algún cálculo, cuya complejidad puede ir desde una simple operación mental hasta una regresión logística que requiere el uso de un ordenador.
Considerar el ordenador como calculadora programable grande y rápida, apta para grandes conjuntos de datos y capaz de almacenar todos los pasos de cálculo y sus resultados en archivos es un punto de vista restringido, pues un ordenador tiene otras ventajas: puede almacenar, comprobar y clasificar datos, contar individuos y categorizar variables. Estas últimas tareas forman parte sustancial de muchos procesos estadísticos. La simple construcción de una tabla de contingencia de 2x2 en un conjunto grande de datos contabilizando los individuos que cumplen con las condiciones requeridas en las cuatro celdas, o una prueba de rangos cuyo primer paso es ordenar los datos, requieren procesos no realizables con una calculadora y que resultan - excepto para número pequeño de datos - tediosas, costosas en tiempo y no exentas de error si se llevan a cabo a mano.
Aunque la accesibilidad a estos programas ha significado un gran beneficio a los investigadores en los últimos años, no debe perderse de vista que se trata de simples herramientas para llevar a cabo un trabajo. Resulta fácil aplicar métodos complejos a datos, pero no es tan sencillo luego interpretar los resultados si el método no era el adecuado a los objetivos de la investigación.
A pesar de todo las calculadoras siguen cumpliendo su papel en cálculos subsidiarios o en el análisis de tablas como la prueba de chi cuadrado, Odds Rato y Riesgo Relativo univariados, Fisher o el cálculo de Mantel-Haenszel.
¿Quién le teme a los métodos estadísticos?
El ingreso de la bioestadística en las ciencias biomédicas ha sido justificadamente bienvenido pero ha tenido y tiene algunos inconvenientes, no poco de los cuales derivan de una magnificación de su papel en relación con la importancia crucial de la metodología de la investigación. La estadística no corrige, sino que suele empeorar todos aquellos errores que se cometen en los métodos, y éstos son el 90% de la labor del investigador. La necesidad creciente y profesional por investigar genera preguntas a contestar cada vez más complejas, diferencias a detectar más pequeñas, mayor necesidad de contemplar el error beta (no poder demostrar una hipótesis cierta, en general debido a un tamaño muestral inadecuado), la importancia de controlar las variables confundentes , determinan diseños con números grandes de individuos - en general multicéntricos e internacionales- y a considerar las estadísticas de multivariables. Esto conlleva procedimientos de cálculo y desarrollos matemáticos complejos que hacen imprescindible el uso de computadoras, así como transformaciones de los datos crudos originales que dejan de estar visibles durante su procesamiento estadístico al investigador tal como él los tomó y los tiene en cuenta en la realidad clínica. Por otra parte los recursos informáticos se han centuplicado, los paquetes estadísticos se han popularizado (no todos, algunos siguen siendo muy caros, poco amigables o francamente engorrosos) y por lo tanto el resultado es que para el común de los lectores de las revistas científicas médicas resulta bastante complicado comprender que métodos estadísticos se aplicaron, y si eran o no adecuados a la pregunta y al diseño de la investigación. Entonces el subcapítulo "Statistical Analysis" o "Statistical Methods" o "Metodología Estadística" pudiera ser leído sin una razonable capacidad crítica imprescindible a toda lectura científica. Debido a que la mayor parte de las conclusiones del artículo y su "verdad" se basan en estas consideraciones ¿cómo podemos juzgar un artículo en cuestión? ¿creeremos todo lo que dice porque una p es igual o menor a 0.05? .
La proliferación,a veces abusiva, de los métodos estadísticos y en especial de los multivariados agrava esta situación. Más allá del alcance de este sencillo artículo debe tenerse en cuenta que algunos de estos métodos tienen limitaciones e inconvenientes matemáticos y clínicos. Finalmente no todos los trabajos científicos médicos publicados suelen especificar el software empleado y si lo hacen no siempre se menciona la versión utilizada (las hay con errores, o con métodos de cálculo disímiles o polémicos) lo que es especialmente importante en pruebas donde éstos no pueden realizarse con lápiz, papel y una calculadora de mano.
Por otra parte ¿todo lo que se publica es la verdad?. De ser así y habida cuenta del enorme número de investigaciones realizadas en los últimos 50 años, publicadas o no , ya no quedaría casi ninguna pregunta por contestar. Todos sabemos que ello no es así. Aunque la estadística ocupa un lugar central en la estructura y función de un diseño de investigación es incapaz de resolver los problemas generados por la metodología empleada. Lo inverso también es cierto: un diseño impecable puede no dar los resultados esperados por mala elección de las estadísticas a utilizar. El uso de hardware y paquetes estadísticos costosos -algunos de los cuales tienen errores y limitaciones - tampoco garantiza nada.
Sin embargo debemos reconocer la repercusión y la importancia que disponer de programas estadísticos para ordenadores significa como impacto cultural, recurso práctico y estímulo para clínicos e investigadores científicos.
Pruebas y programas estadísticos en algunas publicaciones biomédicas. Una estadística de los métodos estadísticos
Con la finalidad de determinar los métodos y programas estadísticos más frecuentemente utilizados en algunas publicaciones norteamericanas y europeas procedimos a revisar todos los artículos científicos originales publicados durante el año calendario 1999 en las siguientes publicaciones: American Journal of Medicine , British Medical Journal , Circulation , European Heart Journal , New England Journal of Medicine y The Lancet. (en el apéndice se incluye a demás una lista de paquetes estadísticos no mencionados en los artículos estudiados). Para el ingreso y procesamiento de los datos se utilizó el paquete Epi Info 6.04b. En total se consideraron 784 artículos que utilizaron 1702 pruebas estadísticas, cuyas distribuciones se muestran en la Tabla 1, junto con la media aritmética (+/- 1 desvío estándar) de pruebas utilizadas por publicación.
Tabla 1. Promedios de pruebas estadísticas empleadas en 784 artículos originales de seis revistas médicas europeas y norteamericanas durante el año calendario 1999
| N artículos | Pruebas usadas |
American Journal of Medicine | 90 | 2.1 +/- 1.2 |
British Medical Journal | 195 | 1.7 +/- 1.2 |
Circulation | 227 | 2.2 +/- 1.5 |
European Heart Journal | 122 | 2.6 +/- 1.5 |
New England Journal of Medicine | 104 | 2.7 +/- 1.6 |
The Lancet | 46 | 2.0 +/- 1.6 |
Total | 784 | 2.2 +/- 1.5 |
Los promedios de pruebas estadísticas usadas en todos los artículos originales para cada revista y para el total de las mismas están expresados como la media aritmética +/- 1 desvío estándar (1ds)
La mayoría de estos artículos disponía de un subcapítulo "análisis estadístico" o "métodos estadísticos" Algunos de ellos no tenían métodos estadísticos; se trataba en general de artículos de métodos diagnósticos o de descripción de técnicas y constituyeron el 9.2% (72/784), 225 artículos (28.7%) tenían una prueba estadística, 199 (25.4) tenían dos, 144 (18.4%) tenían tres y los 144 restantes (18.4%) cuatro o más.
De las 1702 pruebas estadísticas las 10 más frecuentemente utilizadas, que en conjunto constituyen el 74.6% de las mismas, se muestran en la Tabla 2.
Tabla 2. Las diez pruebas estadísticas más frecuentemente empleadas en 784 artículos originales de seis revistas médicas europeas y norteamericanas durante el año calendario 1999
Pruebas | n (%) |
de Student | 241 (14.2) |
Chi cuadrado | 204 (12.0) |
ANOVA* | 158 ( 9.3) |
Regresión Logística binaria | 140 ( 8.2) |
Prueba de Fisher | 106 ( 6.2) |
Modelo de Cox | 104 ( 6.1) |
U test de Mann-Whitney | 89 ( 5.2) |
Método de Kaplan-Meier | 87 ( 5.1) |
Prueba de Wilcoxon | 71 ( 4.2) |
Correlación-regresión lineales | 70 ( 4.1) |
| 1270 (74.6) |
Cuatro de las cinco pruebas más frecuentemente utilizadas son las clásicas para variables categóricas (chi cuadrado y Fisher) y contínuas (t de Student y ANOVA) , alternando con ella una de multivariables como la regresión logística binaria.
*Análisis de varianza de una o dos vías.
Conceptualmente los tests utilizados pueden agruparse como: 1) Comparaciones de promedios (media , mediana) o medidas de dispersión (varianza) , 630 (37.0%) , 2) Pruebas univariadas de asociación-independencia entre variables categóricas , 421 (24.7%) , 3) Modelos multivariados de asociación-independencia para variables categóricas y continuas con estimación de Odds-Ratio y Riesgo Relativo , 323 (18.9%) , 4)Estadísticos de sobrevida y ocurrencia de eventos , 138 (8.1%) , 5) Modelos bivariados de correlación-regresión para variables continuas o de rangos , 90 (5.3%). El resto corresponde a metodologías como comparaciones interindividuos en métodos de diagnóstico, metaanálisis, etc.
De los 712 artículos que utilizaron métodos estadísticos descriptivos o inferenciales , en 233 (32.7%) se dejó constancia de la utilización de software estadístico específico. En total fueron mencionadas 269 aplicaciones de esta clase: en 198 artículos se menciona un único programa (85%), en 34 artículos 2 programas (14.6%) y en un trabajo 3 programas (0.4%). Existió constancia de la versión del programa o paquete estadístico utilizado en 144 (53.5%) de los mencionados. Una aplicación era para computadora tipo mainframe , el resto para computadoras personales.
Los paquetes empleados se muestran en la Tabla 3.
Tabla 3. Paquetes estadísticos citados como utilizados en el procesamiento de datos de 233 artículos originales de seis revistas médicas europeas y norteamericanas durante el año calendario 1999
Programa | n (%) |
SAS | 89 (33.1) |
SPSS | 64 (23.8) |
STATA | 20 ( 7.4) |
EPI INFO | 14 ( 5.2) |
STAT VIEW | 11 ( 4.1) |
EXCEL | 8 ( 3.0) |
BMDP | 6 ( 2.2) |
S-PLUS | 6 ( 2.2) |
JMP | 6 ( 2.2) |
STATISTICA | 5 ( 1.9) |
SIGMASTAT | 3 ( 1.1) |
STATXACT | 3 ( 1.1) |
MINITAB | 3 ( 1.1) |
REVIEW MANAGER | 3 ( 1.1) |
STAT SOFT | 2 ( 0.7) |
EGRET | 2 ( 0.7) |
MLN | 2 ( 0.7) |
OTROS* | 22 ( 8.2) |
| 269 |
Frecuencias absolutas y relativas porcentuales de los paquetes citados como empleados en el procesamiento de datos. La lista es encabezada por paquetes comerciales clásicos como SAS y SPSS, pero también aparecen con cierta frecuencia otros paquetes con características y accesibilidad diferente como Epi Info y Stat View.
*Figuran una sola vez, se detallan en el apéndice de paquetes estadísticos.
Este estudio, aunque limitado, muestra algunas tendencias interesantes: las pruebas clásicas, que suelen estar en todos los programas, son las más utilizadas. Los modelos multivariados, que no suelen estar en todos los paquetes, también lo son. Es muy amplia la variedad de paquetes empleados pero dos de los "clásicos " figuran en los primeros lugares junto con paquetes muy amigables de la década del 90, como Epi Info , Stat View y Stata. Tal vez esto sea expresión de algún cambio en las preferencias generacionales de expertos e investigadores, ya que todos nos inclinamos más al uso de lo que ya conocemos bien.
Sin embargo, a nuestro entender el hecho más relevante es que en 67% de los artículos no se especificó el paquete utilizado aunque resultaba evidente que por el tipo de prueba utilizada o el tamaño muestral se había empleado alguno, y que cuando se hizo mención del o los paquetes estadísticos empleados en casi la mitad no se hizo referencia a la versión empleada. Estos hechos no tienen significación en pruebas que se calculan habitualmente de la misma manera y con escasas variantes matemáticas, pero si lo tienen en tests complejos donde conocer sus detalles y variantes permiten interpretar mejor los resultados.
Criterios útiles en la selección de un programa estadístico
Como acabamos de ver se dispone de muchos programas para ingresar datos y analizarlos estadísticamente. Revisiones periódicas de estos paquetes se publican en revistas informáticas como PC Magazine o PC World
Así como en aquellas especializadas en estadística como American Statistician . Applied Statistics o Statistcs.
Como guía general pueden darse algunos elementos básicos a tener en cuenta al elegir un programa estadístico:
- Facilidad de uso para el estadístico novicio o el usuario ocasional. No utilizarán lenguajes de programación complejos. Deben tener menúes y pantallas de ayuda como guías a través del programa y un manual legible, bien organizado y comprensible. No siempre se disponen de versiones en español. Hay que resignarse a que la informática se ha desarrollado en inglés, como la medicina y su terminología lo hizo en griego y latín.
-
Contar con funciones de importación y exportación de datos. Estas capacidades son esenciales. Los datos pueden encontrarse en registros computarizados de enfermedades o en bases de datos de registros médicos desde los cuales debemos contar con la facilidad de transferirlos (importar) a nuestro programa. La mayoría de los paquetes pueden leer textos ASCII, planillas electrónicas como Excel y Lotus, o bases de datos tipo DBF. Algunos paquetes son capaces de importar datos desde otros paquetes estadísticos muy utilizados como SPSS o SAS. Por lo menos nuestro paquete deberá poder importar textos ASCII , Excel o archivos DBF pues la mayoría de las bases de datos y los paquetes estadísticos son capaces de generar archivos de estas clases. También es importante la capacidad de exportar datos a esta variedad de formatos o por lo menos a una de ellos.
-
Capacidad para entrar , editar y manejar datos en forma apropiada .El 80% del trabajo de análisis de datos consiste en crear y validar los archivos de datos por medio de entrada de datos y su control, edición, selección de casos de acuerdo a criterios opcionales y transformación de variables. Por lo tanto estas funciones son esenciales a cualquier programa estadístico. Estos procesos otorgan confiabilidad a los datos. Específicamente destacamos las siguientes facilidades o funciones:
-
Capacidad de prevenir el ingreso de valores incorrectos o inválidos. Procesos de validaciones por ejemplo a través del ingreso por duplicado de todos los registros para identificar y corregir errores de digitación. Verificación de datos a través de procesos estadísticos y lógicos que a través de la constatación de valores imposibles o poco probables obliguen a una verificación desde las fuentes.
- Capacidad de saltear campos automáticamente cuando una variable toma un determinado valor (en general "No").
- Relación lógica entre campos de código y su descripción en lenguaje natural (evita gran parte de los errores de digitación de estos últimos).
- Campos que se repiten automáticamente cuando ciertas respuestas son comunes a muchos sujetos.
- Procesos de recodificación sencillos que permitan transformar una variable continua en categorías o rangos de valores contenidos en otra variable discreta.
- Creación de nuevas variables a partir de valores ya existentes en otras. La nueva variable tomará un valor de cálculo o un valor lógico de acuerdo a la o las variables preexistentes. Estos procesos son imprescindibles en determinados tests estadísticos.
- Seleccionar subconjuntos de variables o de casos que cumplan determinados criterios y generar con ellos nuevos archivos de datos.
- Tratamiento racional de datos perdidos o faltantes (missing values). Este tema es importante y debe considerarse la posibilidad de codificar las opciones de datos no disponible o ausente.
-
Capacidad estadística. El clínico no suele requerir un paquete estadísticamente poderoso con rutinas estadísticas sofisticadas, en general llamadas "estadísticas avanzadas" como contraposición y complemento de las "básicas". El agregado de aquellas suele incrementar significativamente la complejidad y el costo de los programas y en general solamente resultan útiles a los estadísticos profesionales. Por otra parte la disponibilidad de esta clase tests constituye una tentación para su uso inapropiado.
Para los clínicos o usuarios ocasionales con conocimientos estadísticos básicos es adecuado disponer de los siguientes elementos estadísticos y gráficos:
-
Estadística Descriptiva: media, mediana, modo, intervalos de confianza, pruebas de normalidad para un conjunto de datos continuos, distribuciones de frecuencias absolutas, relativas, acumuladas y porcentajes con sus correspondientes intervalos de confianza para proporciones.
-
Estadística inferencial: Datos categóricos: cruzamiento de variables a través de tablas y estadísticos de tablas de contingencia: chi cuadrado, probabilidad exacta de Fisher , Odds Ratio y Riesgo Relativo univariados (en tablas de 2x2).
- Datos continuos: test de t apareado y no apareado, análisis de varianza y correlación.
- Gráficos : gráficos x-y, de barras, histogramas y de líneas
- Facilidad de programación: Si bien contar con lenguajes de programación complejos no es lo deseable, si lo es disponer de la capacidad de generar programas sencillos tipo "batch files" que permitan realizar tareas de transformación, cálculo de datos, realización de pruebas estadísticas, generación de nuevos archivos y documentos conteniendo resultados sin necesidad de estar digitando cada vez los comandos correspondientes, con el consiguiente ahorro de tiempo y esfuerzo.
Algunas sugerencias
Varios de los paquetes estadísticos que se ofrecen tienen las capacidades que hemos señalado. Sus costos varían desde unos pocos cientos a unos pocos miles de dólares dependiendo de las facilidades y pruebas disponibles. Como ya vimos es innecesario e incluso poco recomendable para el clínico que ocasionalmente se encuentra conduciendo una investigación adquirir un costoso y sofisticado programa, pues gran parte del costo se debe a la inclusión en el mismo de tests avanzados cuando en realidad para el estudio en cuestión solamente son necesarias pruebas más simples.
Algunos programas no tienen prácticamente costo o solamente tienen el costo de los manuales. Entre estos se encuentra Epi Info utilizado por el CDC (Centers for Disease Control, Atlanta, USA) para la estadística epidemiológica de todo el país y cuyo uso es recomendado cada vez con más frecuencia, aunque debe tenerse en cuenta que carece de estadísticas de multivariables y análisis de supervivencia. Otros como Minitab o Stat View son muy atractivos pues se aprenden rápidamente a operar aunque también carecen de estadísticas muy avanzadas.
En instituciones donde la investigación es frecuente, exista un departamento de estadística médica y se utilizan con cierta frecuencia métodos estadísticos avanzados será conveniente disponer además de paquetes del tipo de SAS o SPSS u otros similares, que justifiquen el costo que tienen. Uno muy reciente y potente es Prophet del NIH (National Institutes of Health) que se encuentra en sus primeras y prometedoras versiones y cuenta con un excelente y didáctico manual.
Un usuario con buen conocimiento práctico de un paquete que se adapte a sus necesidades habituales podrá realizar la mayoría de sus tareas, pero podría tener necesidad de algún otro paquete para alguna parte de su análisis que no se encuentre contemplada en aquel. Otros prefieren usar paquetes diferentes para partes diferentes de un análisis, lo que en general se vincula a un mayor acuerdo conceptual con los métodos utilizados por los autores del programa en cuestión o simplemente a la facilidad de su uso. Esto se hace posible a través de archivos de salida de un paquete como entrada para otro. Esta transferencia puede operacionalizarse a través de programas como dmbs/copy y Stat/Transfer. Estos programas son especialmente útiles para transferir desde un conjunto de paquetes estadísticos a hojas de cálculo, promoviendo la estandarización de tablas.
Finalmente, algunos programas tienen un "consejero estadístico" como el "statistic coach" de SPSS o "compare samples" de Prophet. En general se trata de programas que asesoran a través de algoritmos sencillos al usuario en la elección de la prueba apropiada para sus datos. Suelen ser útiles y conviene utilizarlos si no se es experto en estadística.
Lo que no debería hacerse
Algunos usuarios se sienten tentados de seleccionar todas las estadísticas y luego tratan de encontrar algún significado para aquellas que no son las apropiadas para una determinada tarea o hipótesis. Esta es una conducta poco científica, no pocas veces impulsada por la facilidad que otorgan los programas y la necesidad de encontrar "alguna diferencia significativa" pues los trabajos que no las muestran tienen poca chance de ser aceptados por revistas médicas y publicar es una necesidad para algunos. La exclusión de resultados "estadísticamente no significativos" y la aceptación de aquellos "a cualquier costo" son uno de los males contemporáneos de las publicaciones biomédicas, pues solamente muestran una parte de la evidencia o introducen errores al cuerpo de conocimiento.
Apéndice
Hay paquetes que fueron escritos originalmente para ordenadores tipo mainframe : SPSS , BMDP , SAS , Minitab , Genstat y GLIM. Los tres primeros se volvieron muy populares en ese entorno. Actualmente pueden usarse en PC todos ellos.
Otros paquetes se han desarrollado específicamente para PC, sin haber paso por la etapa de los mainframes.
Describiremos con cierto detalle aquellos paquetes en que tengamos experiencia personal, el resto sólo serán enumerados. Las versiones que se mencionan son las que fueron citadas en la revisión de algunas publicaciones biomédicas del año 1999.
Paquetes estadísticos mencionados en los artículos biomédicos revisados (orden alfabético)
Arcus Quickset Biomedical (Research Solutions , Cambridge , England)
http://www.researchsolutions.com/arcus_quickstat/index.html
BMDP
http://www.spssscience.com/Bmdp/ Es el más antiguo de los paquetes. El primer manual para BMD Biomedical Computers Programs se publicó en 1961.En 1975 pasó a denominarse BMDP.
Cubre un amplio abanico de métodos estadísticos pero su capacidad para manejar datos es limitada.
Desventajas: sus programas se ejecutan por separado: solo puede accederse a uno de ellos en cada ejecución.
Los resultados de cada programa se pueden guardar en un archivo de BMDP y utilizarse como entrada en otros programas.
Cricket Graph III (Islandia , NY)
http://www.cjs.cadmus.com/da/instructions/cricket_mac.html
CSS Statistical Software (Statsoft Inc)
EGRET . Epidemiologycal Graphics and Testing Package (Statistic and Research Corporation , Washington,1988)
http://www.cytel.com/products/egret
Epicure Peanuts (Hirosoft International Corporation , Seattle, Washington,1993)
http://www.hirosoft.com/index.html
Epi Info (Center for Diseases Control/WHO, Dean et al).
http://www.cdc.gov/epiinfo
Introducido en 1990 el último manual fue publicado en 1994 por Andrews G. Dean.
Posee un excelente manejo de cuestionarios y entrada de datos. Posee escasos pero muy potentes comandos para el análisis estadístico y funciona prácticamente en cualquier computadora y sus utilitarios más importantes requieren escasos recursos informáticos. Es ideal para epidemiología de campo.
No posee métodos multivariados ni estadísticas de supervivencia. No tiene costo. Las versiones actuales "corren" en DOS. Se está implementando una versión para Windows.
Versiones mencionadas en la revisión: 6 .0, 6.03, 6.04b
Exact Statistic Software
GRAPHROC.Maximatti Oy , Xerttulink , Finland
http://www.saunalahti.fi/~maxim
Graphpad Instat software
http://www.graphpad.com
HLM V4.0 (Scientific Software International , Chicago , Illinois)
http://www.ssicentral.com/hlm/hlm.htm
JMP Software V3.01, V3.15, V3.2 (SAS Institute,Cary,NC)
http://www.jmpdiscovery.com/
LISREL V8. Scientific Software International , Chicago , 1993
http://www.ssicentral/com/lisrel/mainlix/htm
Lotus (Lotus Development Corporation)
http://www.lotus.com
Microsoft Excel
http://www.microsoft.com/office/excel/default.htm
Versión mencionada en la revisión: 5.0
Minitab Statistical Software (State College , Pa)
http://www.minitab.com
Se desarrolló originalmente en 1972 en la Universidad de Pennsylvania. Ultimo manual publicado en 1991.
Permite uso interactivo y es popular entre estudiantes y usuarios no especializados aunque no contempla tantos métodos estadísticos como SPSS,SAS o BMDP, incluye regresión múltiple.
No es adecuado para conjuntos de datos pequeños
Versiones mencionadas en la revisión: 8.0
MLn. Multilevel Statistical Models , London
MLWIN (Multilevel Modeling for Windows).Institute of Education , London , 1998
http://ioc.ac.uk/mlwin
NUD*IST V4.0 . Qualitative Solution and Research , Victoria , Australia
http://www.qsr.com.au
Report V6.0.08 (IDV , Munich , Germany)
Review Manager. RevMan.The Cochran Collaboration , Oxford)
Versiones 3.1, 4.0
http://hiru.mcmaster.ca/cochrane/cochrane/revman.htm
ROC Analyzer V09B (Centrosoft , Birmingham , Alabama)
SAS, Statistical Analysis System (SAS Institute Inc., Cary , NC)
http://www.sas.com
Primer manual editado en 1972.Libros dedicados al paquete en 1991 de Cody y Smith
Comprende amplias posibilidades de procedimientos estadísticos (métodos multivariados, regresión múltiple con posibilidades diagnósticas , análisis de supervivencia con riesgos proporcionales y regresión logística) y permite cálculos exactos para tablas r x c y contiene potentes posibilidades gráficas.
Todos los procedimientos pueden emplearse de una sola ejecución.
Los resultados pueden guardarse como archivos y usarse como entradas para futuras ejecuciones.
Es particularmente útil en la gestión de datos y en la redacción de informes.
Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual antes de seleccionar la opción deseada.
SAS ofrece la mayor flexibilidad para personalizar el manejo y análisis de datos, sin embargo su principal inconveniente es que no resulta fácil aprender a usarlo.
Versiones mencionadas en la revisión: 5.0, 6.0, 6.03, 6.07, 6.1, 6.09, 6.11, 6.12, 6.13, V para IBM 370 systems
Sigmastat V2.0 (Jandel Scientific)
http://www.spssscience.com/sigmastat
Simstat V3.5
http://www.kovcomp.co.uk
S-Plus Statistical Package (Stat Sci , Seattle and Europe)
Versiones mencionadas en la revisión: 3.1, 3.3, 4.0
SPSS, Statistical Package for the Social Sciencies (SPSS Inc. , Chicago)
Primer manual editado en 1970.Dispone de un amplio conjunto de métodos estadísticos (multivariados, series temporales, regresión logística y análisis de supervivencia).Todos los procedimientos pueden emplearse de una sola ejecución.
Algunos procedimientos tienen varias opciones por lo cual debe examinarse cuidadosamente el manual antes de seleccionar la opción deseada.
SPSS es el más fácil de aprender para los investigadores principiantes y tiene un manual que explica la filosofía y los mecanismos de las técnicas estadísticas.
Versiones : 4.0, 5.0, 6.0, 6.01, 6.1, 6.13, 7.0, 7.5, 7.52, 8.0.
Stata Statistical Package (Stata Corporation ,Computing Resource Center ,College Station , Texas)
http://www.stata.com
Introducido en 1992 existen actualmente versiones para Windows, DOS, Mcintosh y Unix. El último manual de referencia fue editado en 1999.Tiene muy amplias capacidades estadísticas aplicables a áreas biológicas, del comportamiento y económicas. Ultima versión 6.0
Versiones mencionadas en la revisión: 3.1, 5.0
Statigraphics (Manigistics)
Statistica (Statsoft, Tulsa Ok)
Versiones mencionadas en la revisión: 4.2ª , 5.0, 5.1
http://www.statsofinc.com
Statprobe (Ann Arbor, Mich)
http://www.statprobetechnologies.com
Stat Soft (Tulsa, Okl)
http://www.statsoftinc.com
Stat View Software (Abacus Concepts INC, Berkeley)
http://www.statview.com
Fácil de aprender y operar y dispone de tests básicos y capacidades gráficas, pero no es capaz de manejar grandes conjuntos de datos ni dispone de estadísticas de análisis de sobrevida ni regresión logística.
Existen versiones para Windows 3.1, NT´95, Macintosh y Power Macintosh
Ultima versión 5.0
Versiones mencionadas en la revisión: 4.0, 4.1, 4.5, 4.57
StatXact 3 (V3 Cytel Software Corporation , Cambridge , Massachussetts)
http://www.cytel.com
Introducido en 1991.Por primera vez pone a disposición en forma práctica cálculos exactos para datos discretos, como por ejemplo el test exacto para una tabla r x c, test de tendencia exacta para tabla r x 2 y el test exacto para la combinación de tablas 2 x 2 cuando falla el test de Mantel-Haenszel.
También permite el cálculo para niveles de significación semi-p , uso recomendado por Armitage para datos discretos.
SUDAAN. Analysis with Complex Samples , Lavange LM
http://www.rti.org./patents/sudaan/sudaan.html
Survey Data Analysis
SYSTAT Software (Wilkinson, 1990, SYSTAT Inc)
http://www.spssscience.com/systat
Podemos hacer iguales comentarios que en Stat View.
Testimate V5.2ª (IDV, Munich, Germany)
True Epistat (Epistat Services)
http://www.true_epistat.com
Paquetes estadísticos no presentes en la revisión realizada
Clinfo Systems (Southern California School of Medicine)
EaSt
Para ensayos clínicos secuenciales de grupos con datos de supervivencia
Egret (Statistics and Epidemiology Research Corporation)
Introducido en 1988
GBSTAT
http://www.gbstat.com/index1.htm
Genstat, General Statistic Program
Se introdujo en 1972.Ultimo manual publicado en 1987 (Genstat 5 Committee).
Se le considera uno de los paquetes más difíciles de aprender. Es al mismo tiempo un lenguaje y un paquete de modo que el tipo de operaciones algebraicas usadas habitualmente en estadística pueden programarse facilmente lo que permite la ejecución de métodos nuevos. Por ello es popular entre los estadísticos que se encuentran desarrollando nuevos métodos o variantes de métodos existentes.
Tiene buenos recursos para analizar experimentos diseñados.
GLIM, Generalized Linear Interactive Modelling
http://www.nag.com/stats/GDGE.html
Se introdujo en 1974.Se han escrito libros introductorios en 1989 (Aitken) y 1993 (Francis et al).
Fue escrito para ajustar modelos lineales en forma interactiva lo que permite al investigador avanzar mediante la prueba y ajuste de diferentes modelos, con lo que puede agregar o descartar variables y apreciar el efecto de estos cambios antes de decidir el siguiente paso.
Es más útil en tamaños pequeños a medianos de datos
LogXact
http://www.cytel.com/new.pages/LX.2.html
Para regresión logística
NCSS V6.0 (J.L. Hintze , Kaysville , Utah)
http://www.ncss.com
Prophet (National Center for Research Resources , National Institutes of Health. BBN Systems and Technologies , 1997)
http://www-prophet.bbn.com
Es un paquete aún en etapa de prueba. Es bastante semejante en sus disponibilidades a SPSS, pero pensamos que es superior en la presentación de los resultados. Tiene un excelente y didáctico manual en línea por medio de Internet.
SIP - Sistema Informático Perinatal
http://www.clap.hc.edu.uy
A pesar de ser también un sistema de historia clínica, funciona como un paquete estadístico con las pruebas básicas, aplicadas a la evaluación de datos recogidos rutinariamente en las historias clínicas (Odds ratios y sus intervalos de confianza, Riesgo relativo, Chi cuadrado, etc.) (N.del E.)
SPIDA (Gebski et al, 1992)
Statistix (NH Analytical Software)
http://www.statistix.com
Bibliografía
-
1. Doll R, Hill B A. Smoke habit and the pulmonary carcinoma. Preliminary Report
BMJ September : 739-748 , 1950.
-
2. Breslow NE, Day NE. Statistical methods in cancer research. Volume I - The analysis of case-control studies. IARC Sci Pub (32) :5 - 338, 1980.
-
3. Coleman ??????? 1990.
-
4. American Journal of Medicine 106 (1-6), 107 (1-6), 1999.
-
5. British Medical Journal 318 (7175 - 7200), 319 (7201 - 7225), 1999.
-
6. Circulation 99 (12 - 22), 100 (1 - 11), 1999.
-
7. European Heart Journal 20 (1-24), 1999.
-
8. Lancet 34 (1- 6), 35 (1 - 6), 1999.
-
9. New England Journal of Medicine 340 (1-52), 1999.
Garb JL. Understanding Medical Research. A practitioner´s guide. Boston, Lippincott Williams & Wilkins, 1996.
Pardell H, Cobo E, Canela J. Manual de Bioestadística. Barcelona, Masson, 1968.
Armitage P, Berry G. Statistical Methods in Medical Research. 3rd. Ed. Oxford, Blackwell, 1994.
Hulley S B and Cummings S R Designing Clinical Research. Baltimore, Lippincott Williams & Wilkins , 1988.
< Volver
|