Técnicas Estadísticas para las Ciencias de la Documentación/Descripción/Tabulación

De Wikilibros, la colección de libros de texto de contenido libre.
Saltar a: navegación, buscar

Tabulación de datos[editar]

El proceso de tabulación consiste en el recuento de los datos que están contenidos en los cuestionarios. En este proceso incluimos todas aquellas operaciones encaminadas a la obtención de resultados numéricos relativos a los temas de estudio que se tratan en los cuestionarios. Se requiere una previa codificación de las respuestas obtenidas en los cuestionarios. Realizamos tabulación, codificación y diseño de gráficos con datos biográficos, de consumo o de opinión. Los resultados serán presentados en tablas y/o mapas gráficos que expliquen las relaciones existentes entre las diversas variables analizadas. Esta presentación se adecuará a la petición de nuestros clientes mediante análisis estadísticos de datos, grabados por nosotros o por terceros, análisis bivariantes, análisis multivariantes, tests de contraste de hipótesis

Tras la recogida de información en una investigación, nos encontraremos con una serie de datos sobre diferentes variables de los individuos de una muestra. El primer paso para comenzar a analizar los datos es el de organizarlos de manera que podamos ver las características de los diferentes valores que han tomado las observaciones. El tipo de organización de los datos depende del tipo de variable. A continuación se describen las técnicas de organización más habituales para cada tipo de variable.

Variables cualitativas[editar]

Las variables cualitativas (ordinales o no) toman valores no numéricos. Para tener una idea de los datos recogidos, pueden contabilizarse las diferentes ocurrencias de los distintos valores, dando lugar a los tres conceptos siguientes.

Frecuencia absoluta[editar]

La frecuencia absoluta es el número de apariciones en una muestra de un determinado valor de una variable. Si la variable puede tomar valores en el conjunto {v_1, \dots, v_k}, la frecuencia absoluta del valor o categoría i se denota por f_i

La suma de las frecuencias de todos los valores de la variable equivale a una cuenta de los elementos en la muestra, por lo que esa suma debe ser igual al tamaño muestral.

\sum_{i=1}^n f_i = n

Frecuencia relativa[editar]

La frecuencia relativa nos indica las ocurrencias de un valor determinado, pero no nos indica la proporción o tamaño relativo respecto a los otros valores. Para esto se utilizan las frecuencias relativas, que no son otra cosa que la relación entre la frecuencia absoluta de cada valor y el tamaño muestral n. Estas frecuencias se denotan como h_i.

h_i = \frac{f_i}{n}

La suma de las frecuencias relativas de los valores de una muestra son tantos por uno, y en consecuencia su suma tiene que ser la unidad.

\sum_{i=1}^n h_i = 1

Porcentajes[editar]

Otra forma de representar la misma información que proporciona la frecuencia relativa es utilizar porcentajes, es decir, tantos por cien en lugar de tantos por uno.

En este caso, la suma de los porcentajes deberá ser el 100%.

\sum_{i=1}^n \%_i = 100

Variables cualitativas ordinales[editar]

En las variables cualitativas ordinales se pueden utilizar los mismos conceptos de frecuencia absoluta, relativa o porcentajes, pero además se pueden utilizar tres conceptos relacionados que incluyen una acumulación.

La frecuencia absoluta acumulada para una variable con valores {v_1, \dots, v_k} se define para cada valor i de la variable de la siguiente forma:

F_i = \sum_{j=1}^i f_i

Es decir, para el valor de posición i, se consideran (se suman) las frecuencias de todos los valores menores, además de la del propio valor. La frecuencia absoluta acumulada del mayor valor coincide con el tamaño muestral n, ya que se consideran las frecuencias de todos los valores.

De manera similar, la frecuencia relativa acumulada para una variable con valores {v_1, \dots, v_k} se define para cada valor i de la variable de la siguiente forma:

H_i = \sum_{j=1}^i h_i

Las frecuencias relativas acumuladas se pueden calcular alternativamente a partir de las frecuencias absolutas acumuladas:

H_i = \frac{F_i}{n}


Este tipo de medidas no tiene una interpretación clara si no hay un orden en los valores de la variable.

Variables cuantitativas discretas

Para las variables cuantitativas discretas se pueden utilizar las mismas técnicas de tebulación de las variables cualitativas ordinales. No obstante, cuando el número de valores numéricos de la variable es muy grande, pueden agruparse las medidas en intervalos, tal y como se hace con las variables cuantitativas continuas, que se ven a continuación.

Variables cuantitativas continuas[editar]

Aunque los datos de las variables cuantitativas continuas se pueden tabular al igual que en los casos anteriores, el gran número de valores posibles que suelen tener aconseja agruparlas en intervalos contiguos denominados intervalos de clase. Cada intervalo de clase tiene un valor representativo, que es el valor intermedio, al que se denomina marca de clase.

Los intervalos deben cumplir las siguientes normas:

  • Cada dato debe pertenecer solo a un intervalo.
  • Todos los datos deben estar incluidos en algún intervalo.

NOTA: La tabulación en intervalos es útil para la representación y comprensión de los datos. No obstante, a la hora de hacer cálculos de medidas como medias o varianzas y en general para análisis de tipo matemático, deben utilizarse los datos originales, sin la tabulación.

Nota: cálculo del número de intervalos de clase[editar]

El número de intervalos de clase que se utilizan en un determinado estudio es una decisión del investigador. No obstante, hay reglas para ayudarnos a orientarnos en un número apropiado.


Una de las técnicas es la regla de Sturges, que calcula el número de intervalos por la siguient fórmula.

k = 1 + 3.332 \log n