1.3 DISTRIBUCION DE FRECUENCIA
Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o categorías y determinar el número de individuos que pertenecen a cada categoría, a lo que se le llama frecuencia de clase. A una disposición tabular de los datos por clases, con sus correspondientes frecuencias de clase, se le conoce como distribución de frecuencia o tabla de frecuencias.
INTERVALOS DE CLASE Y LÍMITES DE CLASE
El símbolo que define una clase, como el 60–62 se llama intervalo de clase. A los números 60 y 62 se les conoce como limites de clase; el numero mas pequeño (60) es el limite inferior de clase, mientras que el numero mas grande (62) es el limite superior de clase. Se acostumbra usar los términos clase e intervalo de clase indistintamente, aunque el intervalo de clase es en realidad un símbolo de la clase.
A un intervalo de clase que, por lo menos teóricamente, no tiene límite de clase inferior o límite de clase superior se le llama intervalo de clase abierto. Por ejemplo, en grupos de edades de individuos, el intervalo de clase “65 años a mas” es un intervalo de clase abierto”
FRONTERAS DE CLASE
Si se miden estaturas con exactitud de 1 pulg., en teoría el intervalo de clase 60–62 incluye todas las medidas desde 59.5000 hasta 62.5000 pulg. Estos números, indicados brevemente por los números exactos 59.5 y 62.5 se llaman fronteras de clase o limites verdaderos de clase; el numero menor (59.5) es la frontera inferior de clase y el numero mayor (62.5), la frontera superior de clase.
En la práctica, las fronteras de clase se obtienen promediando los límites superior e inferior de un intervalo de clase. Algunas veces se emplean las fronteras para simbolizar clases. Por ejemplo, las clases en la primera columna de la tabla 2–1 se podrían indicar mediante 59.5–62.5, 62.5–65.5, etcétera.
TAMAÑO O AMPLITUD DE UN INTERVALO DE CLASE.
El tamaño o la amplitud de un intervalo de clase es la diferencia entre las fronteras de clase inferior y superior y se le conoce como amplitud, tamaño o longitud de clase. Si todos los intervalos e una distribución de frecuencia son de la misma amplitud, a esta amplitud común se le denota por c. En tal caso, c es igual a la diferencia entre dos limites inferiores (o superiores) de clases sucesivas. Para los datos de la tabla 2–1, por ejemplo, la amplitud del intervalo de clase es c = 62.5–59.5=65.5–62.5=3.
MARCA DE CLASE
La marca de clase, que es el punto medio del intervalo de clase, se obtiene promediando los límites inferior y superior de clase. De este modo, la marca de clase del intervalo 60–62 es (60+62)/ 2 = 61. A la marca de clase también se le denomina punto medio de clase.
REGLAS GENERALES PARA CONSTRUIR DISTRIBUCIONES DE FRECUENCIA.
1. Determinar el número mayor y el menor en los datos sueltos con el fin de especificar el rango (la diferencia entre ambos). 2. Dividir el rango en un número adecuado de intervalo de clase del mismo tamaño. Si esto no es posible, usar intervalos de clase de distintos tamaños o intervalos de clase abiertos. Se suelen tomar entre 5 y 20 intervalos de clase, según los datos. Los intervalos de clase se eligen también de modo tal que las marcas de clase (o puntos medios) coincidan con los datos realmente observados. Ello tiende a disminuir el llamado error de agrupamiento que se produce en análisis matemáticos posteriores. No obstante, las fronteras de clase no debieran coincidir con los datos realmente observados. 3. Determinar el número de observaciones que corresponden a cada intervalo de clase; es decir, hallar las frecuencias de clase.