Licencia Creative Commons
Ambiente de aprendizaje construido por Diana Gisela Pérez, sin fines comerciales, bajo una Licencia Creative Commons Atribución-NoComercial 4.0 Internacional.

Variables Estadísticas


VARIABLES ESTADÍSTICAS


¡Hola!


En esta ocasión, aprenderemos el elemento más importante de una investigación estadística.


Generalmente, cuando deseamos saber más acerca de un fenómeno o proceso, recojemos datos para después analizar la información.  

Este proceso de recolección de datos se llama observación.



Datos

Los datos son una serie de hechos, representados en forma de números, palabras, medidas, observaciones o simplemente descripciones de cosas.  Estos pueden ser de tipo Cualitativo o Cuantitativo. Los de tipo cualitativo ofrecen información descriptiva de algo, mientras los cuantitativos ofrecen cantidades numéricas.


Los datos recolectados serán registrados bajo una variable, sobre la cual se desea hacer el estudio. Esta variable, representará las propiedades o características de un evento, un objeto o persona, y  como su nombre lo indica puede tomar diferentes valores o cantidades.  Por ejemplo, puedo estudiar la preferencia del chocolate de acuerdo a la edad y el sexo de un grupo de personas. 

 
Recuerda que si en los datos encontrados, se encuentra el mismo valor, este dato ya no será una variable sino una constante.


Por ejemplo, si realizo una investigación estadística canina, puedo definir varias variables de estudio: ALTURA, PESO, COLOR DEL PELO, LARGO DEL PELO, FORMA DE LA CABEZA y al recolectar los datos, me encuentro con distintos valores para CADA variable:




Para este estudio canino, las variables cualitativas serán COLOR DEL PELO (blanco, miel, negro, gris...), FORMA DE LA CABEZA (mas larga que ancha, igual de larga que de ancha, intermedia entre las dos anteriores) y, las variables cuantitativas serán medidas numericamente: ALTURA (cm), PESO (Kg), LARGO DEL PELO (cm).


Una vez, encontrados los datos, estos deberán organizarse en una Base de Datos. Volviendo al ejemplo del chocolate, durante el estudio se organizaron los siguientes datos:

Persona Edad Sexo   Preferencia del chocolate
    1        18        M       Con leche
    2        21        M       Oscuro
    3        25        F        Blanco
    4        45        F        Con leche
    5        21        M       Con leche

Cada fila (horizontal) corresponderá a una sola observación -en el ejemplo hay 5 observaciones, que corresponden a 5 personas diferentes-.
Cada columna (vertical) es una variable - en el ejemplo hay 4 variables definidas: persona, edad, sexo, preferencia del chocolate-.



Niveles de medida de los datos


En las variables cualitativas, existen 3 niveles de medida: Nominal, Ordinal, Intervalos. Estos niveles nos determinarán cómo resumir y presentar la información en gráficas estadísticas y el tipo de análisis que se hará.



Variable Cualitativa Nominal

Es el nivel más básico. Indica una categoría o cualidad como: sexo, color, religión, partido político, preferencia del chocolate. 
En este nivel no se requiere un orden específico para presentar la información.

Los valores pueden estar representados bajo una palabra o un código numérico:  
Para el caso de la variable sexo: Masculino (0), Femenino (1).
Para el caso del color: azul (1), amarillo(2), verde(3), rojo(4)...
Sin embargo, el hecho de que cada variable tenga designado un número, este no implica un orden específico, es simplemente un código.

Para presentar el resumen de los datos generalmente se usa una FRECUENCIA o un PORCENTAJE. Por ejemplo:

azul (1):       40%
amarillo(2):  20% 
verde(3):     10% 
rojo(4):        50%





Variable Cualitativa Ordinal


Este tipo de datos, generalmente se presenta en forma de rangos, niveles de satisfacción, o de deseos.

Ejemplo: 
1. La diferencia entre el primero y el segundo en llegar a la meta en una carrera de atletismo, puede ser muy pequeña, pero esta diferencia puede ser más grande frente a un tercer corredor:

1er corredor (1s) --2do corredor (2s) ------3er corredor (5s)

2. El grado de satisfacción por un servicio recibido puede tener grandes diferencias entre el nivel Satisfecho y el Insatisfecho y, muy poca diferencia entre Insatisfecho y Muy insatisfecho:

Muy satisfecho - - Satisfecho - - - - - - Insatisfecho -Muy insatisfecho

Tal como en las variables nominales, las variables ordinales, pueden presentarse con frecuencias:


Nivel

Frecuencia absoluta

Frecuencia relativa (%)

Desacuerdo (1)

7

35%

Neutral (2)

4

20%

ALgo de acuerdo (3)

3

15%

Muy de acuerdo (4)

6

30%


A este tipo de información nunca se le puede sacar un promedio.





Intervalos

Este tipo de datos es más preciso y pueden ser más factible de ser ordenados, ya que son datos de tipo cuantitativos.  Ejemplo: número de clientes, peso, edad o talla.

Los números en los datos cuantitativos, pueden ser números discretos (números enteros) o números continuos (números decimales).

Discretos:
5 clientes
17 sedes
12 almacenes
24 puntos de venta

Continuos:  La estatura dada en metros de un grupo de 4 personas en el intervalo (1.5 - 1.8].
1.6 m
1.56 m
1.75 m
1.8 m

El análisis de este tipo de datos es más versátil. Puede sacársele el promedio, la mediana o la desviación estándar  




Variables Continuas

Pueden tomar cualquier valor dentro de un rango en una escala definida.

Por ejemplo:
* El tiempo que toman los estudiantes en resolver el quiz de matemáticas:


1 hora

1.5 horas

0.5 horas

0.95 horas










Variables Discretas

Este tipo de variables pueden tomar solo ciertos valores.

Por ejemplo:
* Número de niños con cabello castaño oscuro.
* Cantidad de televisores vendidos.

Los números son Enteros. No creo conveniente decir "le di pastel a un niño y medio" o "vendí 2 televisores y medio" 😉


Continúa estudiando DISTRIBUCIÓN DE FRECUENCIAS




AYÚDANOS A SALVAR EL PLANETA" 

TEN CONCIENCIA AMBIENTAL

Árboles - GIFMANIA

PAPERLESS