Apuntes, Tareas, Monografias, Trabajos, Ensayos

Webscolar » MatemÃ¡ticas y EstadÃstica » La distribuciÃ³n de Frecuencia

INTRODUCCIÃ“N

Desde el inicio de la civilizaciÃ³n han existido formas sencillas de estadÃstica, puesto que en la antigÃ¼edad se utilizaban representaciones grÃ¡ficas y otros sÃmbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nÃºmero de personas, animales o ciertas cosas que eran de importancia en aquellas civilizaciones. El tÃ©rmino estadÃstico es ampliamente percibido y pronunciado a diario desde diversos sectores activos de la sociedad. No obstante, hay una gran diferencia entre el sentido del termino cuando se utiliza en el lenguaje corriente, generalmente al anteceder una citaciÃ³n de carÃ¡cter numÃ©rico, y lo que la estadÃstica significa como ciencia.

La razÃ³n o razones que motivaron al hombre en un momento de su desarrollo a tomar en cuenta datos con propÃ³sitos estadÃsticos, posiblemente se encuentra si se toma en cuenta que es difÃcil suponer un organismo social, sea cual fuere la Ã©poca, sin la necesidad, casi instintiva, de recoger aquellos hechos que aparecen como actos esenciales de la vida; y asÃ, al ubicarnos en una etapa del desarrollo de la estadÃstica podemos especular que se convirtiÃ³ en una aritmÃ©tica estatal para asistir al gobernante que necesitaba conocer la riqueza y el nÃºmero de los sÃºbditos entre otros, con el objeto de recaudar impuestos o presupuestar la guerra.

Desde los comienzos de la civilizaciÃ³n han existido formas sencillas de estadÃstica, pues ya se utilizaban representaciones grÃ¡ficas y otros sÃmbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nÃºmero de personas, animales o cosas. Hacia el aÃ±o 3000 a.C. los babilonios usaban pequeÃ±as tablillas de arcilla para recopilar datos sobre la producciÃ³n agrÃcola y sobre las especies vendidas o cambiadas mediante trueque.

El uso de la EstadÃstica es de gran importancia en la investigaciÃ³n cientÃfica y de finanzas. Casi todas las investigaciones aplicadas requieren algÃºn tipo de anÃ¡lisis estadÃstico para que sea posible evaluar sus resultados.

En algunos casos, para resolver un problema de carÃ¡cter empÃrico, es preciso llevar a cabo un anÃ¡lisis bastante complejo; otras veces, basta con efectuar un anÃ¡lisis muy simple y directo.

La elecciÃ³n de uno u otro tipo de anÃ¡lisis estadÃstico depende del problema que se plantee en el estudio asÃ como de la naturaleza de los datos. Desde este punto de vista, la EstadÃstica constituye un instrumento de investigaciÃ³n y no un producto finalde esta Ãºltima.

El presente trabajo, que las estadÃsticas deben ser dominadas y practicadas para obtener satisfactorios resultados, sobre todo siguiendo las reglas para evitar errores mayores del 5% o el 10%, en otras palabras, el verdadero diagnÃ³stico de la realidad han de ser prÃ¡cticas permanentes en el accionar del investigador y el estadÃstico aplicado.

La estadÃstica es una ciencia o mÃ©todo cientÃfico que en la actualidad es considerada como un poderoso auxiliar en las investigaciones cientÃficas, que le permite a Ã©sta aprovechar el material cuantitativo.

DISTRIBUCIÃ“N DE FRECUENCIA

A menudo en una investigaciÃ³n ya sea de finanzas o cientÃfica se recogen grandes cantidades de datos numÃ©ricos. Cuando esto ocurre es difÃcil visualizar un orden o estructura que ayude a analizarlos. Para lograrlo es necesario condensar los datos en grupos de acuerdo a ciertas divisiones de la recta numÃ©rica (intervalos o clases). Aunque con esta agrupaciÃ³n la informaciÃ³n inicial sobre cada dato individual se pierde, es mÃ¡s fÃ¡cil visualizar rÃ¡pidamente las caracterÃsticas principales del grupo total de datos.

La frecuencia de un intervalo es el nÃºmero de datos que corresponden a ese intervalo.

Una distribuciÃ³n de frecuencia es una tabla en la que aparecen todos los intervalos y las frecuencias de datos correspondientes a cada intervalo. Esta agrupaciÃ³n de datos numÃ©ricos por intervalos o clases se llama una distribuciÃ³n de frecuencia porque en ella se indica cuan frecuentemente aparecen datos en cada intervalo.

2. Aspectos importantes que se deben tener en cuenta cuando se crea una distribuciÃ³n de frecuencia

2.1. NÃºmero de intervalos

El nÃºmero de intervalos en una distribuciÃ³n de frecuencia depende del nÃºmero total de observaciones.

Se recomienda que en una distribuciÃ³n de frecuencia no haya mÃ¡s de 15 ni menos de 5 intervalos. Si hay muy pocos no se pueden observar las caracterÃsticas importantes de la distribuciÃ³n y si hay muchos no se obtiene un resumen adecuado de la distribuciÃ³n.

2.2. LÃmites de los intervalos

El lÃmite inferior de un intervalo corresponde al valor mÃnimo que puede incluirse en el intervalo. El lÃmite superior de un intervalo corresponde al valor mÃ¡ximo que puede incluirse en el intervalo.

Ejemplo:

Puntuaciones	frecuencia
200-299	2
300-399	8
400-499	6

En el ejemplo anterior 200 es el lÃmite inferior y 299 el lÃmite superior del primer intervalo.

Algunos autores agrupan los datos de variables continuas en clases o intervalos que incluyen todos los valores desde un nÃºmero dado hasta (pero excluyendo) otro nÃºmero.

Ejemplo:

Peso	frecuencia
100-bajo 120	5
120-bajo 130	3
130-bajo 140	10

2.3. Amplitud de los intervalos

La amplitud de un intervalo se obtiene al restar el lÃmite inferior de una clase al lÃmite inferior de la clase superior.

Todos los intervalos de una distribuciÃ³n de frecuencia deben tener la misma amplitud, aunque a veces se encuentran tablas en las que el Ãºltimo intervalo es diferente.

Para determinar la amplitud de los intervalos de una distribuciÃ³n se divide la amplitud o alcance de la distribuciÃ³n entre el nÃºmero de intervalos deseados y se redondea.

El conjunto de intervalos debe incluir todos los datos.

No debe haber traslapo (overlapping) de intervalos.

2.4. DistribuciÃ³n de frecuencia absoluta

En la tabla de frecuencia absoluta se seÃ±ala, para cada intervalo o clase, la cantidad de datos cuyos valores pertenecen al intervalo.

2.5. DistribuciÃ³n de frecuencia relativa

La frecuencia relativa es la razÃ³n que se obtiene al dividir la frecuencia absoluta de un intervalo entre el nÃºmero total de datos en la distribuciÃ³n.

La frecuencia relativa se puede expresar como una proporciÃ³n o como un porciento.

La distribuciÃ³n de frecuencia relativa es esencial para comparar datos de dos distribuciones diferentes.

Si la frecuencia relativa del intervalo se multiplica por 100 se obtiene el porciento correspondiente a dicho intervalo.

Por lo general, en las publicaciones no especializadas, se utiliza mÃ¡s la frecuencia relativa expresada en porcientos que en proporciones.

2.6. DistribuciÃ³n de frecuencia absoluta acumulada

La frecuencia absoluta acumulada de una clase se obtiene al sumar las frecuencias de todas las clases que representan valores menores que los del lÃmite superior de la clase dada.

En la frecuencia absoluta acumulada de un intervalo se incluyen los datos del intervalo mÃ¡s los datos de todos los intervalos inferiores.

Ejemplo:

Puntuaciones	frecuencia	frec.acum.
200-299	2	2
300-399	8	10
400-499	6	16

2.7. DistribuciÃ³n de frecuencia relativa acumulada

La frecuencia relativa acumulada de una clase se obtiene al dividir la frecuencia acumulada del intervalo entre el total de datos de la distribuciÃ³n. Se expresa como una proporciÃ³n o un porciento.

Ejemplo:

Puntuaciones	frecuencia	frec.acum.	frec.relativa acum.
200-299	2	2	0.125
300-399	8	10	0.625
400-499	5	16	1

Nota: A menudo la frecuencia absoluta, la frecuencia relativa y la frecuencia acumulada aparecen en la misma tabla.

DistribuciÃ³n de Frecuencia:

En estadÃstica existe una relaciÃ³n con cantidades, nÃºmeros agrupados o no, los cuales poseen entre sÃ caracterÃsticas similares. Existen investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombre de variable. La representaciÃ³n numÃ©rica de las variables se denomina dato estadÃstico.

La distribuciÃ³n de frecuencia es una disposiciÃ³n tabular de datos estadÃsticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase.

DistribuciÃ³n de frecuencia para datos no Agrupados:

Es aquella distribuciÃ³n que indica las frecuencias con que aparecen los datos estadÃsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificaciÃ³n al tamaÃ±o de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despuÃ©s que la distribuciÃ³n de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lÃ³gico con sus respectivas frecuencias.

DistribuciÃ³n de frecuencia de clase o de datos Agrupados:

Es aquella distribuciÃ³n en la que la disposiciÃ³n tabular de los datos estadÃsticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuÃ¡ndo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nÃºmero total de datos (N) es igual o superior 50 y ademÃ¡s el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizarÃ¡ la distribuciÃ³n de frecuencia para datos agrupados, tambiÃ©n se utilizarÃ¡ este tipo de distribuciÃ³n cuando se requiera elaborar grÃ¡ficos lineales como el histograma, el polÃgono de frecuencia o la ojiva.

La razÃ³n fundamental para utilizar la distribuciÃ³n de frecuencia de clases es proporcionar mejor comunicaciÃ³n acerca del patrÃ³n establecido en los datos y facilitar la manipulaciÃ³n de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informaciÃ³n obtenida de una investigaciÃ³n sea manejable con mayor facilidad.

Componentes de una distribuciÃ³n de frecuencia de clase

1.- Rango o Amplitud total (recorrido).– Es el lÃmite dentro del cual estÃ¡n comprendidos todos los valores de la serie de datos, en otras palabras, es el nÃºmero de diferentes valores que toma la variable en un estudio o investigaciÃ³n dada. Es la diferencia entre el valor mÃ¡ximo de una variable y el valor mÃnimo que Ã©sta toma en una investigaciÃ³n cualquiera. El rango es el tamaÃ±o del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribuciÃ³n de frecuencia se designa con la letra R.

2.- Clase o Intervalo de clase.- Son divisiones o categorÃas en las cuales se agrupan un conjunto de datos ordenados con caracterÃsticas comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites.

Para organizar los valores de la serie de datos hay que determinar un nÃºmero de clases que sea conveniente. En otras palabras, que ese nÃºmero de intervalos no origine un nÃºmero pequeÃ±o de clases ni muy grande. Un nÃºmero de clases pequeÃ±o puede ocultar la naturaleza natural de los valores y un nÃºmero muy alto puede provocar demasiados detalles como para observar alguna informaciÃ³n de gran utilidad en la investigaciÃ³n.

TamaÃ±o de los Intervalos de Clase

Los intervalos de clase pueden ser de tres tipos, segÃºn el tamaÃ±o que estos presenten en una distribuciÃ³n de frecuencia: a) Clases de igual tamaÃ±o, b) clases desiguales

de tamaÃ±o y c) clases abiertas.

3.-Amplitud de Clase, Longitud o Ancho de una Clase

La amplitud o longitud de una clase es el nÃºmero de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo mÃ¡s importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la practica.

4.-Punto medio o Marca de clase

El centro de la clase, es el volar de los datos que se ubica en la posiciÃ³n central de la clase y representa todos los demÃ¡s valores de esa clase. Este valor se utiliza para el calculo de la media aritmÃ©tica.

5.-Frecuencia de clase

La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nÃºmero total de valores de las variables que se encuentran presente en una clase determinada, de una distribuciÃ³n de frecuencia de clase.

6.- Frecuencia Relativa

La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribuciÃ³n de frecuencia de clase entre el nÃºmero total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras fr; si cada fr se multiplica por 100 se obtiene la frecuencia relativa porcentual (fr %).

7.-Frecuencias acumuladas

Las frecuencias acumuladas de una distribuciÃ³n de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribuciÃ³n de frecuencia de clase, esto se logra cuando la acumulaciÃ³n de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acumuladas pueden ser menor que (fa< que) y frecuencias acumuladas mayor que (fa>que).

8.- Frecuencia acumulada relativa

La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribuciÃ³n de frecuencia de clase entre el nÃºmero total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen las frecuencias acumuladas relativas porcentuales y las mismas se designan asÃ: far %.

Mediciones de tendencia central

Hay tres medidas matemÃ¡ticas de la tendencia central, usadas frecuentemente. La primera es la conocida mediaaritmÃ©tica, que es la suma aritmÃ©tica de todos los valores de una distribuciÃ³n dividida por el numero de casos. En tÃ©rminos matemÃ¡ticos es:

M = SUMATORIA X

M representa la media aritmÃ©tica, la letra griega â€œsuma deâ€, X los valores individuales y N el nÃºmero de casos.

La segunda medida de tendencia central es la moda, es el puntaje mÃ¡s comÃºn, el puntaje obtenido por el mayor nÃºmero de personas.

La tercera medida se llama mediana que es simplemente el puntaje intermedio de una distribuciÃ³n, o el nÃºmero que representarÃa un punto entre las dos mitades.

Por consiguiente, el significado de hombre medio o de inteligencia media puede referirse a cualquiera de estas tres medias diferentes de tendencia central, cada una con distinto valor y las tres matemÃ¡ticamente correctas. Cada media tiene ciertas ventajas e inconvenientes. La media aritmÃ©tica estÃ¡ muy influida por los valores de los elementos extremos, en tanto que la moda y la mediana no. A veces los valores extremos son innaturales y no se puede dejar que ejerzan toda su influencia.

Para tener un promedio que refleje todas las puntuaciones, incluyendo las extremas, se usa la media aritmÃ©tica; para que no estÃ© influido por las puntuaciones extremas, se usa la moda o la mediana.

Si todo lo que se conoce acerca de un grupo es su promedio, las mejores conjeturas de sus caracterÃsticas tendrÃan que expresarse basÃ¡ndose en el mismo; pero ello da lugar, a veces, a serios errores.

La mediana

La mediana (Md) es una medida de posiciÃ³n que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parÃ¡metro que esta en el medio del ordenamiento o arreglo de los datos organizados, entonces, la mediana divide la distribuciÃ³n en una forma tal que a cada lado de la misma queda un nÃºmero igual de datos.

Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posiciÃ³n que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar, luego el nÃºmero que se obtiene indica el lugar o posiciÃ³n que ocupa la mediana en la serie de valores, luego la mediana serÃ¡ el nÃºmero que ocupe el lugar de lo posiciÃ³n encontrada.

La moda

La moda es la medida de posiciÃ³n que indica la magnitud del valor que se presenta con mÃ¡s frecuencia en una serie de datos; es pues, el valor de la variable que mÃ¡s se repite en un conjunto de datos. De las medias de posiciÃ³n la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observaciÃ³n de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo.

Desviacion tipica o estandar

Es la medida de dispersiÃ³n mÃ¡s utilizada en las investigaciones por ser la mÃ¡s estable de todas, ya que para su calculo se utilizan todos los desvÃos con respecto a la media aritmÃ©tica de las observaciones, y ademÃ¡s, se toman en cuenta los signos de esos desvÃos. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minÃºscula s (Sigma) cuando se trabaja con una poblaciÃ³n. Es importante destacar que cuando se hace referencia a la poblaciÃ³n Ã©l nÃºmero de datos se expresa con N y cuando se refiere a la muestra Ã©l nÃºmero de datos se expresa con n. La desviaciÃ³n tÃpica se define como:

Interpretacion de la desviacion estandar

La desviaciÃ³n tÃpica como medida absoluta de dispersiÃ³n, es la que mejor nos proporciona la variaciÃ³n de los datos con respecto a la media aritmÃ©tica, su valor se encuentra en relaciÃ³n directa con la dispersiÃ³n de los datos, a mayor dispersiÃ³n de ellos, mayor desviaciÃ³n tÃpica, y a menor dispersiÃ³n, menor desviaciÃ³n tÃpica.

Varianza

Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviaciÃ³n tÃpica; viene expresada con las mismas letras de la desviaciÃ³n tÃpica pero elevadas al cuadrado, asÃ S2 y s2. Las formulas para calcular la varianza son las mismas utilizadas por la desviaciÃ³n tÃpica, exceptuando las respectivas raÃces, las cuales desaparecen al estar elevados el primer miembro al cuadrado

Errores de medida

El error se debe a un instrumento de medida inexacto, a un mÃ©todo imperfecto de aplicar el instrumento, a nuestra manera inadecuada de leerlo o registrarlo o a cualquier otro factor.

En la ciencia, por depender en gran parte del raciocinio de las mediciones, se tiene mucho cuidado con los errores de medida y se ha aprendido mucho acerca de su naturaleza, origen y control. En los casos que se ha sido incapaz de eliminarlos, se han desarrollado tÃ©cnicas que permiten estimar el grado de error. Sabiendo la magnitud del error se puede enunciar el grado de confianza en las conclusiones basadas en las medidas. El estudio de los errores de medida es uno de los bÃ¡sicos de la estadÃstica.

Fiabilidad

No existe un instrumento de medida absolutamente perfecto. Hasta el instrumento de medida mÃ¡s simple, la regla, no estÃ¡ libre de error. Algunos instrumentos de medida nos dan errores mayores que otros.

La fiabilidad de un aparato de medida(incluido su mÃ©todo de aplicaciÃ³n) puede definirse como el grado en que medidas repetidas de la misma cantidad, con el mismo instrumento de medida, dan las mismas lecturas.

La fiabilidad medida por correlaciÃ³n: el coeficiente de correlaciÃ³n nos da un Ãndice numÃ©rico que expresa el grado de fiabilidad de una prueba. Cuando se usa con este fin, el coeficiente de correlaciÃ³n recibe el nombre de coeficiente de fiabilidad.

Veracidad de las formas comparables: La mayorÃa de las pruebas psicolÃ³gicas constan de gran nÃºmero de elementos, problemas y preguntas. La correlaciÃ³n de las dos formas comparables nos darÃa la fiabilidad de una y otra forma.

El mÃ©todo de las formas comparables evita el problema de la memoria y quizÃ¡s el de fastidio, pero deja intacto el del tiempo. Las dos formas se aplican en tiempos diferentes, y durante el intervalo pueden suceder muchas cosas que dificultan la interpretaciÃ³n de la correlaciÃ³n entre las dos formas comparables.

Fiabilidad compartida: la base del mÃ©todo de fiabilidad bipartida es idÃ©ntica a la del de formas comparables. Este mÃ©todo suele llamarse del â€œ coeficiente de pares-imparesâ€ y cuenta con dos ventajas: primera, las dos subpruebas(pares y nones) se hacen a la vez, en las mismas condiciones de motivaciÃ³n, idÃ©nticas condiciones de examen y con el mismo grado de atenciÃ³n. Segunda, por haber divido la prueba de pares-impares, hemos garantizado la comparabilidad de formas, no sÃ³lo en cuanto al contenido, sino tambiÃ©n en cuanto al contenido, sino tambiÃ©n en cuanto al modo de administraciÃ³n.

Estos y otros mÃ©todos pueden proporcionarnos una valiosa informaciÃ³n sobre la utilidad de una prueba como instrumento de medida. Sin embargo, saber que una prueba es fiable no basta para permitirnos apreciar su valor como instrumento de mediciÃ³n Puede ser muy fiable y por el contrario, constituir un mal instrumento de medida, por carecer de validez.

Validez

Los tÃ©rminos de â€œfiabilidadâ€ y â€œvalidezâ€ se usan indistintamente en el lenguaje vulgar. No obstante, en la teorÃa de la mediciÃ³n, tienen un significado distinto. El estadÃstico preocupado por el problema de la fiabilidad e un instrumento con lo que mide. Cuando le interesa la cuestiÃ³n de la validez, pregunta si el instrumento mide lo que Ã©l quiere medir. Un instrumento puede hacer medidas acordes(puede tener fiabilidad), pero acaso no mide lo que se quiere medir(acaso tiene poca validez). Pero a la mayorÃa de los tests que tratan de medir fenÃ³menos mÃ¡s complejos no se les adscribe la validez con tanta facilidad. En primer lugar, la validez, lo mismo que la fiabilidad, no es asunto de todo nada. Una prueba tiene grados de validez. El grado de validez de las preguntas de clase sÃ³lo estarÃa influido por la comprensiÃ³n por parte del alumno de los principios psicolÃ³gicos. En este caso dirÃamos que las preguntas tienen validez perfecta como medida de la comprensiÃ³n de principios psicolÃ³gicos; pero, mÃ¡s probablemente, la puntuaciÃ³n en las preguntas es la resultante de la comprensiÃ³n psicolÃ³gica, mÃ¡s la aptitud memorista. La prueba tiene alguna validez para la comprensiÃ³n psicolÃ³gica y alguna otra para la capacidad memorista, pero no es una prueba â€œpuraâ€ de ninguna de las dos. Como en la fiabilidad, necesitamos algÃºn medio para expresar el grado de validez de un instrumento de medida de un instrumento de medida y, de nuevo como en aquella, el coeficiente de correlaciÃ³n nos facilita ese medio.

La validez medida por correlaciÃ³n: Es evidente que una prueba es vÃ¡lida en el grado en que sus medidas se correlacionan con lo que mide. Cuando se usa de este modo el coeficiente de correlaciÃ³n se llama coeficiente de validez.

El principio general para determinar la validez de una prueba es bastante simple, correlacionamos sus puntuaciones con su criterio. La dificultad consiste en que, frecuentemente, no podemos hallar un criterio con el que compararlas. Por ejemplo se quiere medir la validez de una prueba de inteligencia. Se pude obtener las puntuaciones del test con mucha facilidad, pero quÃ© servirÃ¡ de criterio de â€œinteligenciaâ€ Â¿Las calificaciones escolares? Â¿El dinero ganado en la vida real? Â¿La originalidad y creatividad? Â¿La primacÃa en cuestiones sociales? Personas diferentes sugerirÃan distintos criterios y algunos de ellos plantearÃan, por sÃ mismos, problemas e medida.

Se han hecho muchos intentos de resolver el problema del criterio. Entre las tÃ©cnicas mÃ¡s corrientes estÃ¡ el llamado mÃ©todo del â€œgrupo conocidoâ€.

Grupos conocidos y validez: No hay puntuaciones-criterio de originalidad y creatividad fÃ¡cilmente disponibles.

Una prueba puede tener gran fiabilidad y poca validez, en el sentido que no mida lo que intentÃ¡bamos que midiese. En cambio, una prueba de mucha validez no puede tener poca fiabilidad. Las pruebas poco fiables no pueden compararse consecuentemente con n conjunto de puntuaciones-criterio, porque sus medidas son, en gran parte, errÃ³neas y por consiguiente deben tener poca validez.

Fiabilidad y validez conciernen a errores de medida y de conceptualizaciÃ³n; por eso surgen de la inadecuaciÃ³n del instrumento de medida, pero, completamente aparte de ello, aÃºn hay otra fuente mayor de error en las investigaciones que utilizan medidas. Se puede cometer un error de selecciÃ³n.

Normalmente en la secciÃ³n de resultados de una publicaciÃ³n cientÃfica debemos incluir algÃºn tipo de grÃ¡fico que ilustre en forma clara nuestros principales hallazgos. Un grÃ¡fico no sÃ³lo debe ser agradable a la vista, sino que tambiÃ©n debe ser sencillo y autoexplicativo, y reflejar lo mÃ¡s fielmente posible los hechos. Es bien sabido que un grÃ¡fico dice mÃ¡s que muchas palabras y permite en forma clara establecer una relaciÃ³n o cuantificar el grado de diferencia entre dos grupos, o alguna otra relaciÃ³n de acuerdo a nuestros datos. Hoy en dÃa, con la ayuda de algunos softwares computacionales tales como:Â Systat, Excel, Lotus, etc., es relativamente fÃ¡cil realizar grÃ¡ficos tales como de:

torta (“pie”),
barras,
histogramas,
cajas,
tallo y hoja,

Siempre debe pensar si vale la pena colocar un grÃ¡fico o si serÃ¡ mejor colocar una frase que simplifique mÃ¡s las cosas. No serÃ¡ que a veces nos encontramos con grÃ¡ficos para llenar espacio, o quizÃ¡s para impresionar?

De acuerdo a los propÃ³sitos y a los datos serÃ¡ el tipo de grÃ¡fico que podamos realizar:

Para mostrar distribuciÃ³n de frecuencia de variables nominales, ordinales o discretas utilizamos grÃ¡ficos de barras simples. Para graficar distribuciÃ³n de frecuencia de variables continuas o intervalares, histogramas o polÃgonos de frecuencia.
Para mostrar relaciÃ³n entre variables nominales, ordinales o discretas, usamos grÃ¡ficos de barras pareadas o agrupadas. Con el fin de mostrar asociaciÃ³n entre dos variables continuas, grÃ¡ficos de correlaciÃ³n.
Para graficar la relaciÃ³n de una parte de la informaciÃ³n respecto al total podemos utilizar grÃ¡ficos sectoriales o barras subdivididas, independientemente de las variables.
Para mostrar variaciÃ³n conjunta de dos variables continuas usamos plots o grÃ¡ficos lineales.

SegÃºn las variables que tengamos nominales u ordinales, realizamos normalmente grÃ¡ficos de barras separada y grÃ¡ficos sectoriales, donde cada porciÃ³n “de la torta” corresponde a una categorÃa. Para variables intervalares normalmente se utiliza el histograma y el grÃ¡fico de barras, que demuestran promedio y desviaciÃ³n estÃ¡ndar. En cuanto a asociaciones entre variables podemos utilizar los plots.

En resumen la representaciÃ³n grÃ¡fica de datos nos permite o serÃa deseable que tengan, segÃºn Gnanadesikan, 1980:

Capacidad descriptiva
Versatilidad
OrientaciÃ³n de los datos
Potencial para posibles comparaciones internas
Ayuda en focalizar la atenciÃ³n
Permiten autocrÃtica de posibles presunciones
Adaptabilidad para grandes volÃºmenes de datos.

GRAFICOS SECTORIALES Y DEÂ BARRAS

Este tipo de grÃ¡ficos fundamentalmente se utilizan para variables nominales u ordinales, en las cuales tenemos categorÃas que difieren en la proporciÃ³n o tamaÃ±o en que se han presentado en la muestra analizada. El grÃ¡fico de torta o “pie” debe tener identificado cada sector; es muy conveniente colocar, ademÃ¡s, el nÃºmero de observaciones y la frecuencia en porcentaje, adyacente a cada categorÃa.

En un grÃ¡fico de barras se despliega cada barra separada por categorÃa, donde el alto de cada barra puede representar:

Cuentas de cada categorÃa,
El promedio de los casos en cada categorÃa,
El porcentaje de casos en cada categorÃa, o
Alguna otra medida o estadÃstico ingresado por cada categorÃa.

[image]

Fig. 1. Barras en que se presenta promedio de estatura de hombres y mujeres, y su desviaciÃ³n estÃ¡ndar (Dato de X. Haro).

HISTOGRAMA

Un histograma es una presentaciÃ³n de una distribuciÃ³n de frecuencia y se realiza por medio de barras o rectÃ¡ngulos para cada intervalo de clase, de tal forma que cada barra es proporcional a la frecuencia de cada clase. La variable intervalar es la que normalmente debe tener un histograma, el cual va a servir para demostrar la normalidad en cuanto a la distribuciÃ³n de la muestra examinada. Al igual que en otros tipos de grÃ¡ficos el eje X debe corresponder a la variable examinada, incluyendo el valor mÃnimo y mÃ¡ximo; en el eje Y se ubica la cantidad de individuos o muestras, o sea la frecuencia. AdemÃ¡s como cualquier grÃ¡fico debe acompaÃ±arse de un tÃtulo.

No debe llamar histograma a un grÃ¡fico de barras de variables nominales u ordinales. En muchas ocasiones vemos grÃ¡ficos de barras que se les denomina histogramas; en estos casos se ha ubicado en el eje Y una variable nominal u ordinal (ver Rimm, pag. 46, fig. 2), y el largo de la columna representa la frecuencia observada de cada categorÃa. Estos son grÃ¡ficos de barra y no histogramas.

Fig. 2. Histograma de la Edad. El sÃmbolo indica el promedio de la edad, y los parÃ©ntesis ( ) marcan una desviaciÃ³n estÃ¡ndar.

[image]

Fig. 3. Histograma de la Estatura, grupo 1= Hombres, 2= Mujeres. Datos de X. Haro, 45 hombres y 45 mujeres, chilenos. Observe la distribuciÃ³n para los hombres, entre 1.6 y 1.8 mt. estÃ¡ la mayorÃa, en cambio en las mujeres, entre 1.5 y 1.7 mt.

PolÃgono de frecuencia

En el polÃgono de frecuencia como en el histograma, el valor de la variable aparece en el eje horizontal y la frecuencia absoluta o relativa en el vertical.

La diferencia con respecto al histograma es que el polÃgono de frecuencia sÃ³lo toma en consideraciÃ³n el punto medio como representativo de cada clase o intervalo.

El punto medio de un intervalo se puede obtener de varias formas. Posiblemente la mÃ¡s fÃ¡cil consiste en sumar los lÃmites inferiores de dos intervalos consecutivos y dividir entre dos. Ejemplo:

Puntuaciones	frecuencia
200-299	2
300-399	8
400-499	6

En el ejemplo anterior 200 es el lÃmite inferior del primer intervalo y 300 el lÃmite inferior del segundo intervalo. Por lo tanto el punto medio del primer intervalo es (200+300)/2 = 250

De igual forma el punto medio del segundo intervalo es 350.

Nota:

Algunos autores definen el punto medio como el punto que se encuentra a mitad de camino entre los llamados lÃmites exactos de cada intervalo. Por lo tanto calculan el punto medio sumando los lÃmites exactos del intervalo y dividiendo entre 2. (VÃ©ase Hinkle capt.2)

ConstrucciÃ³n

Para construir el polÃgono de frecuencia es necesario:

a. Determinar los puntos medios de cada intervalo

b. Determinar dos puntos medios adicionales correspondientes a un primero y Ãºltimo intervalo inexistentes (no siempre se aÃ±aden estos dos puntos).

c. Graficar un punto sobre cada punto medio, a la altura de la frecuencia absoluta o relativa de cada intervalo.

d. Conectar todos los puntos que aparecen a la altura de la frecuencia del intervalo.

[image] Nota: Cuando se construye un histograma o un polÃgono de frecuencia jamÃ¡s se debe cortar el eje vertical de la frecuencia. Si se hace, la grÃ¡fica puede resultar engaÃ±osa. Sin embargo el eje horizontal sÃ se puede cortar y hasta el cero se puede excluir, siempre que todas las clases o intervalos aparezcan.

Uno de los usos de los polÃgonos de frecuencia es poder comparar datos de dos distribuciones diferentes en un mismo eje.

GrÃ¡ficos de tallo y hojas [image]

Es una representaciÃ³n en la que los dÃgitos se dividen entre la parte troncal (izquierda denominada tallo) y la parte marginal (derecha denominada hoja). Los dÃgitos del tallo se ordenan de arriba abajo y las hojas de izquierda a derecha. Como en el histograma, la longitud de cada hoja corresponde al nÃºmero de casos que contiene un determinado intervalo.

GrÃ¡ficos de tallo y Hojas

BIBLIOGRAFIA

http://odontologia.uchile.cl/servicios/estadistica/graf.html

http://www.cca.org.mx/dds/cursos/estadistica/html/m7/distribuciones_frecuencias_relativas.htm

http://rrpac.upr.clu.edu:9090/~amenend/tabdistrfrec.htm

http://html.rincondelvago.com/metodologia-de-la-investigacion_1.html

http://aldocgh.tripod.com/

www.unav.es/…/practica_ 2/practica_2.html

Apuntes del Cuadernos Dictados en clase

Apuntes de aÃ±o Anteriores

Libro de Estadistica

Citar este texto en formato APA: _______. (2013). WEBSCOLAR. La distribuciÃ³n de Frecuencia. https://www.webscolar.com/la-distribucion-de-frecuencia. Fecha de consulta: 28 de julio de 2026.

La distribuciÃ³n de Frecuencia

Relacionado

Comentarios

Escribir Comentario

Categorías

Recientes

Buscar Tareas sobre...

La distribuciÃ³n de Frecuencia

Relacionado

Comentarios

Escribir Comentario

Suscríbete a Webscolar

Categorías

Recientes