Tablas y gráficos

Una vez recolectados los datos, éstos pueden consolidarse y resumirse para mostrar la información en tablas y gráficos.

Las preguntas básicas son:
• ¿Qué valores de la variable han sido medidos?
• ¿Con qué frecuencia se presenta cada uno de los valores?

Para este fin, se puede construir una tabla estadística que se puede usar para mostrar la distribución de datos.

Posteriormente, para facilitar su visualización se puede hacer una gráfica. El tipo de gráfica que se escoja dependerá del tipo de variable que se haya medido.

Tablas

Variable (Edad) Frecuencia absoluta Frecuencia relativa Frecuencia absoluta acumulada Frecuencia relativa acumulada
17 años 5 13.9% 5 13.9%
18 años 12 33.3% 17 47.2%
19 años 7 19.4% 24 66.6%
20 años 4 11.1% 28 77.7%
21 años 6 16.7% 34 94.4%
22 años 2   5.6% 36 100%
Total  36 100% 36 100%

La frecuencia absoluta es el número de veces que aparece un determinado valor.

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.

Gráficos

  • De barras

  • De pastel

grafica_como_se_reparte_el_pastel_de_los_ingresos_en_mx

  • De líneas

  • De tallo y hojas

Interpretación de gráficas

Una vez creada la gráfica, ¿qué se debe buscar al tratar de describir los datos?

  1. Verificar las escalas horizontales y verticales, de manera que haya claridad respecto a lo que se mide.
  2. Examinar el lugar de la distribución de datos. ¿Dónde está el centro de distribución del eje horizontal? Si se comparan dos distribuciones, ¿están centradas en
    el mismo lugar?
  3. Examinar la forma de la distribución. ¿La distribución tiene un “pico”, un punto
    que es más alto que cualquier otro? Si es así, ésta es la medición o categoría que
    se presenta con más frecuencia. ¿Hay más de un pico? ¿Hay un número aproximadamente igual de mediciones a la izquierda y derecha del pico?
  4. Buscar cualesquiera mediciones poco comunes o resultados atípicos. Esto es,
    ¿hay mediciones mucho mayores o menores que todas las otras? Estos resultados
    atípicos pueden no ser representativos de los otros valores del conjunto.

Tipos de distribuciones 

  • Una distribución es simétrica si los lados izquierdo y derecho de la distribución, cuando se divide en el valor medio, forman imágenes espejo.
  • Una distribución está sesgada a la derecha si una proporción más grande de las mediciones se encuentra a la derecha del valor pico.
  • Una distribución está sesgada a la izquierda si una proporción mayor de las mediciones está a la izquierda del valor pico. 
  • Una distribución es unimodal si tiene un pico; una distribución bimodal tiene dos
    picos; o distribución multimodal si tiene más de dos picos.

Límites de las gráficas

Las gráficas son sumamente útiles para la descripción visual de un conjunto de datos, pero no siempre son la mejor herramienta cuando se desea hacer inferencias acerca de una población a partir de la información contenida en una muestra. Para este propósito, es mejor usar medidas numéricas para construir una imagen mental de los datos; aquí entran las medidas de localización, de dispersión, de posición, de forma.

Las mediciones descriptivas numéricas asociadas con una población de mediciones se llaman parámetros; las calculadas a partir de mediciones muestrales reciben el nombre de estadísticas.

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Límites de la clase

Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.

Amplitud de la clase

La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.

Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.

Referencias:

“Introducción a la Probabilidad y Estadística” William Mendenhall, Robert J. Beaver and Barbara M. Beaver.
Decimotercera edición. Cengage Learning. México. 2010.

Mexicano, universitario y emprendedor que está en búsqueda de soluciones que, poco a poco, puedan mejorar el mundo. En mi blog comparto reflexiones, críticas y propuestas de lo que leo, veo y escucho.

Deja un comentario