Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Ebook de Estadistica con el Spss.

Ebook de Estadistica con el Spss.

Texto de

hamlet mata mata

December 21, 2011
Tweet

Other Decks in Education

Transcript

  1. 1.- LA ESTADISTICA DESCRIPTIVA Y SU METODOLOGIA OBJETIVO: Describir la

    Estadística y su metodologia, sus tipos, su historias, la distribución de frecuencia de clases, los diferentes gráficos y la aplicación de la estadística en las Ciencias Administrativas. CONTENIDO: Definición y tipos de estadística, aplicación, Historia de la Estadística, Cuadros Estadisticos, propiedades, tipos. Diagramas o graficos, tipos de gráficos Estadísticos: de barras, de puntos, circulares, histogramas, polígonos de frecuencia, polígono de frecuencia acumulado. Distribución de frecuencia, Clase, Rango, Intervalo de Clase, histograma, polígono de frecuencia, Ojiva. Resolución de problemas. 2.- MEDIDAS DE POSICION OBJETIVO: Aplicar las características y propiedades de la media aritmética, la mediana, la moda, los cuartiles, percentiles como principales medida de tendencia central de una distribución de frecuencia de clase. CONTENIDOS: Describir las propiedades de la media aritmética, la mediana, la moda, los cuartiles y los percentiles. Resolución de problemas. 3.- MEDIDAS DE DISPERSION OBJETIVO: Aplicar las características y propiedades de la desviación típica y la varianza como principales medidas de dispersión de una distribución de frecuencia. CONTENIDOS: Descripción de las características de la desviación típica, la varianza y los momentos estadísticos. La Asimetria y Curtosis de una distribución de frecuencia de clase. Resolución de problemas. 4.- TEORIA DE PROBABILIDADES OBJETIVO: Desarrollar las propiedades de la teoría de probabilidades. CONTENIDOS: Definición y propiedades de las probabilidades, tipos y característica de cada una, solución de problemas. 5.-EL PROGRAMA INFORMATICO SPSS 15 Y EL ANALISIS ESTADISTICO OBJETIVO: Aplicar los principios básicos del programa computacional de Estadística SPSS 15.0 en la resolución de problemas relacionados con la Estadística Descriptiva. CONTENIDO: Definición de SPSS. Características del SPSS. Instalar el programa SPSS. Estructura del SPSS. Archivos de datos del SPSS. Editor de Datos del SPSS. Transformar datos mediante el SPSS. Modificar Archivos de datos en el SPSS.El Visor del SPSS. Archivos de síntesis del SPSS. Análisis Estadístico con el SPSS. Aplicación del SPSS en estadística descriptiva. Solución de problemas estadísticas con el SPSS.
  2. INTRODUCCION La estadística es una ciencia (otros investigadores la consideran

    como un conjunto de métodos) que se encarga de la recolección, clasificación, presentación, organización, análisis e interpretación de un conjunto de fenómenos, (naturales, económicos, políticos o sociales) de manera metódica y numérica, que permitan extraer conclusiones de un hecho, en un momento determinado y así poder tomar decisiones valederas. En tal sentido, La estadística es una ciencia que se encarga de recopilar, organizar, presentar, analizar e interpretar un conjunto de datos naturales, político, económico, o sociales, para tomar una decisión de incertidumbre en un momento determinado, mediante una investigación determinada. En consecuencia para realizar un estudio estadístico es necesario presentar el métodos para su estudio, los elementos básicos de mismo son los siguientes: 1) Recopilación, 2) Organización, 3) Presentación, 4) Análisis e 5), Interpretación. El análisis estadístico de una serie de valores se construye mediante el cálculo de diferentes parámetros y / o estadísticos. Un dato estadístico, es un conjunto de valores numéricos que tienen relación significativa entre sí. Los Cuadros estadísticos, son esquemas organizados donde se registran los datos estadísticos en forma organizada con la frecuencia de cada uno de estos, los cuales se disponen en columnas y filas con el propósito de presentar la información recopilada de una investigación o estudio determinado. Las gráficas son expresiones en forma de figura, de información originada de un conjunto de datos estadísticos, que explican un fenómeno determinado entre los cuales se encuentran los de Líneas, de Barras, de Pastel, Histograma, Polígono de Frecuencia y Polígono Acumulativo. La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pueden ser para datos no agrupados y para datos agrupados o de intervalos de clase. El análisis estadístico de una serie de datos se elabora mediante el cálculo de diferentes parámetros y / o estadísticos. Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de calcular un número único, que represente o resuma todos los datos. Por lo general, las frecuencias de los intervalos centrales de una serie de datos son mayores que el resto, ese número se le denomina medida de posición. Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas, entre las que se encuentran los parámetros y los estadígrafos. Una medida de posición es un número que se escoge como orientación para hacer mención a un grupo de datos. Uno de los problemas fundamentales que presenta un análisis estadística, es el de buscar el valor más representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una larga serie de valores u observaciones, es el de resumir los datos en una distribución de frecuencia; esto no es suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en especial cuando se requiere comparar dos o más serie estadísticas. Es necesario continuar el proceso de reducción hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma que permita una interpretación global del fenómeno en estudio; para que ese valor sea representativo debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie con estas características recibe el nombre de promedio, media o medida de posición, esto es debido a su ubicación en la zona central de la distribución. Las medidas de posición son de gran importancia en el resumen estadístico, ya que representan un gran número de valores individuales por uno solo.
  3. Las medidas de posición central son los valores que de

    una manera condensada representan una serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promedio de una distribución de frecuencia. La dispersión puede ser mayor o menor, tomando en cuenta esas diferencias. La variabilidad es la esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de valores entre observaciones individuales. Casi siempre en una distribución de frecuencia el promedio obtenido difiere de los datos de la serie; por esto es importante determinar el grado de variación o dispersión de los datos de una serie de valores con respecto al promedio. Se llama Variación o Dispersión de los datos, el grado en que los valores de una distribución o serie numérica tiende a acercarse o alejarse alrededor de un promedio. Cuando la dispersión es baja indica que la serie de valores es relativamente homogénea mientras que una variabilidad alta indica una serie de valores heterogénea. Cuando los valores observados de una serie están muy concentrados alrededor del promedio, se dice que ese promedio es o será muy representativo; pero si están muy dispersos con relación al promedio, es decir muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o distribución, puesto que no representan adecuadamente los datos individuales de esa distribución. Es importante obtener una medida que indique hasta qué punto las observaciones de una serie de valores están variando en relación con el valor típico de la serie. LA TEORÍA COMBINATORIA es la rama del Álgebra que se encarga del estudio y propiedades de los grupos que se pueden formar con un conjunto de elementos dado, diferenciándose entre sí por el número de elementos que entran en cada grupo, por la clase de esos elementos y por el orden de colocación de esos elementos. Los ARREGLO DE OBJETOS es la acción de arreglar, componer u ordenar objetos determinados en los estudios de probabilidades. Una forma útil de contar todos los posibles arreglos de un conjunto de datos es por medio de un DIAGRAMA DE ÁRBOL, que es una gráfica en donde se presentan todos los posibles arreglos de uno ó varios eventos en forma de árbol. Los procedimientos de cálculo para hallar el número de arreglos probables de objetos de un conjunto, son indispensables en el estudio de probabilidades. Al enumerar los arreglos, es útil contar todos los posibles arreglos en la forma de un árbol, llamado diagrama de árbol; también se puede aplicar el método de la REGLA MULTIPLICATIVA o principio multiplicativo del conteo ó también aplicando las técnicas de la teoría combinatoria (variación y combinación). De la misma forma la teoría de probabilidades es muy extensa y sus aplicaciones han adquirido mucha importancia en la administración pública y empresarial. Las probabilidades son de gran importancia en la estadística. Para iniciar el estudio de las probabilidades es necesario definir una serie de términos básicos para su mejor comprensión. La Teoría de la Probabilidad es una rama de las matemáticas que se encarga de los eventos que se realizan al azar o fenómenos aleatorios, como a menudo se les denominan. Se define la probabilidad como un número comprendido entre 0 y 1, que se le asigna a un evento para señalar su posibilidad de ocurrencia. Por lo general las probabilidades se expresan en porcentajes, también se pueden expresar con números decimales. Es una condición de esta cátedra que siempre sé resuelvan las fracciones con que se expresan las
  4. probabilidades de un problema dado; los resultados de esos cocientes

    deben tener por lo menos 4 decimales y el mismo se representa en porcentaje. La probabilidad de cualquier evento se representa con la letra P. El SPSS es un poderoso paquete para el análisis estadístico y la gestión de datos, fue diseñado en un principio para las ciencias sociales en la década de los 70’s. Con el pasar del tiempo se observo que su aplicación se extendía a la mayoría de las ramas de la ciencia que utilizan la estadística para el análisis de datos y se fueron agregando nuevos módulos para pruebas estadísticas especializadas. El objetivo de este curso es capacitar al participante, en el manejo del paquete estadístico SPSS, inculcando los conceptos y forjando los conocimientos necesarios para que pueda realizar diversos análisis estadísticos desde el punto de vista descriptivo de datos, empleando gráficos, tablas o estadísticos y que a su vez esté en capacidad de interpretar los resultados extrayendo sus respectivas conclusiones.
  5. LA ESTADISTICA Y SU METODOLOGIA (CAPÍTULO 1) OBJETIVO: Describir la

    Estadística y su metodologia, sus tipos, su historias, la distribución de frecuencia de clases, los diferentes gráficos y la aplicación de la estadística en las Ciencias Administrativas. CONTENIDO: Definición y tipos de estadística, aplicación, Historia de la Estadística, Cuadros Estadisticos, propiedades, tipos. Diagramas o graficos, tipos de gráficos Estadísticos: de barras, de puntos, circulares, histogramas, polígonos de frecuencia, polígono de frecuencia acumulado. Distribución de frecuencia, Clase, Rango, Intervalo de Clase, histograma, polígono de frecuencia, Ojiva. Resolución de problemas. INTRODUCCIÓN A LA ESTADÍSTICA (Hamlet Mata Mata Prof. Del TECNOLÓGICO DE EL TIGRE - VENEZUELA) www.mipagina.cantv.net/hamletmatamata ¿QUÉ ES LA ESTADÍSTICA? Según Allen (1996), Chao (1996), Yule y Kendal ( 1986) y Rivas González ( 1993) la estadística es una ciencia ( otros investigadores la consideran como un conjunto de métodos) que se encarga de la recolección, clasificación, presentación, organización, análisis e interpretación de un conjunto de fenómenos, (naturales, económicos, políticos o sociales) de manera metódica y numérica, que permitan extraer conclusiones de un hecho, en un momento determinado y así poder tomar decisiones valederas. De acuerdo con la definición anterior la estadística se encarga de la recolección, clasificación, análisis e interpretación de un conjunto de datos en una investigación determinada. Según, algunos investigadores la estadística, es una rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones. También, se puede decir que es una rama de las matemáticas que utilizando un conjunto de métodos y técnicas se encarga de la recolección, organizar, presentación, analizar e interpretación de datos naturales, económicos, políticas, sociales, etc, para presentar los resultados obtenidos y sacar conclusiones válidas basadas en dicho análisis y así poder tomar una decisión. La función principal de la estadística es elaborar principios y métodos que ayuden a tomar decisiones frente a la incertidumbre. En realidad, muchos autores definen la estadística actualmente como un método de toma de decisiones frente a la incertidumbre. La estadística puede presentar conclusiones referentes únicamente al grupo estudiado, o puede generalizarlas para grupos mayores. El gran número de información estadística que se ofrece al público, por una razón u otra, escapa al entendimiento, y una incertidumbre colectiva radica en que porción de la estadística es buena y cual es mala. Indudablemente, no se puede aceptar toda la información sin emitir crítica. Algunas veces, conclusiones totalmente erróneas se basan
  6. en datos fehacientes. Por ejemplo, en alguna ocasión cierto alcalde

    afirmó que la ciudad x era la más sana de la nación, ya que su índice de mortalidad era el más bajo del país. Aunque concordamos con su afirmación de que ser sano significa no estar muerto, existen otros factores que no se tomaron en consideración: cómo la ciudad no tenía hospital, sus habitantes tenían que ser hospitalizados en otra ciudad y si el enfermo moría el fallecimiento se registraban en el lugar donde ciertamente ocurrió la muerte y no en la ciudad de origen del difunto. Los siguientes son algunos de los otros casos errónea basada en datos estadísticos, en otra información que eran fidedigna: la estadística señala que hubo menos accidentes de aviación en 1920 que 1990, por lo tanto, era más seguro volar en 1920 que 1990, análisis estadístico erróneo aunque la estadística es verdad. Como existen más accidentes de automóviles en el día que en la noche es más seguro conducir de noche, otro error al realizar tal afirmación, como se puede observar no siempre con las estadísticas se pueden hacer afirmaciones tomando en cuenta algunos datos estadísticos valederos, si antes no se analizan otras variables relacionadas con las estadísticas. Hay que hacer una explicación antes de comenzar un estudio formal aplicando las técnicas estadística; se pondrá en claro que los procedimientos estadísticos acertado de un problema implican mucho más que hacer algunas observaciones en la elaboración, realizar algunas operaciones y llegar a cierto tipo de conclusiones. Existen muchas incógnitas en la elaboración de un estudio estadístico tales como: la forma en que se recolectan los datos y como se planifica una investigación o es un estudio en su totalidad, es de importancia primordial. Como en cualquiera otra ciencia, en la estadística hay que tener la precaución adecuada en todo la fase de cualquiera investigación, desde la concepción y planteamiento del problema, que algunas veces es el trabajo más dificultoso, hasta la planificación y el diseño, pasando por las etapas de recolección, organización, tabulación, análisis e interpretación de los datos, si no se toman en cuenta estas etapas no se podrá llegar a una conclusión útil o valedera. En términos generales, ni siquiera un prolongado y elegante manejo matemático o estadístico de los datos, aun con el equipo de computación más costoso y sofisticado del mundo, pueden salvar los estudios o experimentos mal diseñado. En realidad, los estadísticos profesionales insisten en que hasta los estudios de muestreo más simple deben llevarse a cabo con estricto apego a reglas bien definidas; de tal forma que, no existe una justificación para llamar estadístico a un estudio que no se ajuste a estas normas. Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos numéricos presentados de forma ordenada y sistemática. Esta idea es la consecuencia del concepto popular que existe sobre el término y que cada vez está más extendido debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier medio de difusión, periódico, radio, televisión, etc., no nos tope diariamente con cualquier tipo de información estadística sobre accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc. La palabra estadística ha sido frecuentemente referida a la información cuantitativa o numérica. También ha sido referida ampliamente a los métodos que tratan con la información. Sin embargo, esto debería aclararse y llamar a la información datos estadísticos y a los métodos utilizados para su recolección, técnicas estadísticas. Cuando un lector tiene pocos hechos numéricos, puede utilizar la información numérica en su máxima extensión sin perder
  7. mucho tiempo o pensar demasiado en analizar los hechos. Ejemplo:

    Luis tiene 25 años y Luisa tiene 18. Un lector puede fácilmente interpretar la información anterior de muchas maneras diferentes. Por ejemplo, Luis es un hombre joven de 25 años de edad, pero es 5 años mayor que Luisa; sin embargo, cuando un lector tiene un gran volumen de hechos numéricos, puede encontrar que la información le es de poco valor, puesto que no puede interpretar la duda al mismo tiempo. Ejemplo, Luis tiene 25años, Luisa tiene18 años, María tiene 16 años, Jaime tiene 26 años, Pedro tiene 19 años, y así sucesivamente hasta llegar al estudio de 1000 alumnos seleccionados en un momento determinado. El gran volumen de información numérica origina la necesidad de métodos sistemáticos, los cuales pueden ser utilizados para organizar, presentar, analizar e interpretar la información efectivamente. De esta manera pueden extraerse conclusiones válidas y tomarse decisiones razonables mediante el uso de los métodos. Los métodos estadísticos son desarrollados primeramente para llenar esta necesidad. Sólo cuando nos introducimos en un mundo más específico como es el campo de la investigación de las Ciencias Sociales, Administración, Contaduría, Medicina, Biología, Psicología, etcétera, empezamos a percibir que la Estadística no sólo es algo más, sino que se convierte en la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas. Podríamos, desde un punto de vista más amplio, definir la estadística como la ciencia que estudia cómo debe emplearse la información y cómo dar una guía de acción en situaciones prácticas que entrañan incertidumbre. La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. La estadística puede ser definida como un método de investigación de los fenómenos que se producen masivamente. Intenta establecer el enlace, formación o estructura de una serie, así como su desarrollo temporal o la relación entre varios de estos fenómenos; por consiguiente, su objetivo es el análisis e interpretación de los datos numéricos. La estadística es una ciencia auxiliar moderna que facilita el estudio de datos masivos, para así sacar conclusiones valederas y efectuar predicciones razonables de ellos; permitiendo una visión de conjunto clara y de más fácil apreciación, así como describirlos y compararlos. La estadística también es definida como parte de la matemática que se ocupa del estudio, análisis y clasificación de los datos recogidos en una experiencia, cuando los resultados de esta no son explicables por una ley natural conocida, es decir, cuando del hecho estudiado no se tiene un conocimiento cierto, o cuando el mismo fenómeno es aleatorio. Otras definiciones que se le da a la estadística que es una técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos entendiendo por tales aquellos fenómenos de masa, naturales, económicos, sociales, etc., cuya medición requiere una masa de observaciones de otros fenómenos más simples llamados individuales o particulares. En una forma práctica, la estadística proporciona los métodos científicos para la recopilación, organización, resumen, representación y
  8. análisis de datos o hechos, que se presten a una

    evaluación numérica; tales como: fenómenos sociales, económicos, políticos, culturales, etc. Ya que solo a través del empleo de los métodos estadísticos es posible el ordenamiento, clasificación, presentación y estudio preciso de datos, hechos y ocurrencia masivas; que están sujetas a la explicación de dicha ciencia, la cual permite un mejor entendimiento del estudio que sé está realizando. Se puede por tanto clasificar la Estadística en descriptiva, cuando los resultados del análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio. Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Se puede definirse como aquel método que contiene la recolección, organización, presentación y resumen de una serie de datos. El mencionado resumen puede ser tabular, gráfico o numérico. El análisis que se realiza se limita en sí mismo a los datos recolectados y no se puede realiza inferencia alguna o generalizaciones alguna, acerca de la población de donde provienen esos datos estadísticos. Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. La Estadística Descriptiva es la parte de la estadística que conocemos desde los cursos de educación secundaria, que se enseña en los siguientes niveles y que, por lo general, no pasa a ser un análisis más profundo de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerar para así evitar malentendidos, tergiversaciones o errores. La estadística descriptiva analiza, estudia y describe a la totalidad de los individuos de una población, su finalidad es obtener información, analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda utilizarse eficazmente para el fin que se desee. El proceso que sigue la estadística descriptiva para el estudio de una cierta población consta de los siguientes pasos: • Selección de caracteres dignos de ser estudiados. • Mediante encuesta o medición, obtención del valor de cada individuo en los caracteres seleccionados. • Elaboración de tablas de frecuencias, mediante la adecuada clasificación de los individuos dentro de cada carácter. • Representación gráfica de los resultados (elaboración de gráficos estadísticos).
  9. • Obtención de parámetros estadísticos, números que sintetizan los aspectos

    más relevantes de una distribución estadística. • Por ejemplo: si un investigador aplica un test de aptitud a un grupo de graduados de un instituto superior recientemente contratados por una empresa; entre lo que puede hacer con las puntuaciones que resultan del test valiéndose de la estadística descriptiva, están los aspectos siguientes: arreglar las puntuaciones o clasificarlas de manera que con solo dar un vistazo a los datos se pueda obtener una imagen general de los mismos, construir tablas, gráficas y cuadros estadísticos para visualizar el comportamiento de los datos o bien convertir las puntuaciones brutas en rangos o en percentiles para realizar comparaciones, etc. Estadística inferencial: Es aquella rama de la estadística que apoyándose en el cálculo de probabilidades y a partir de datos muéstrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Puede definirse como aquella rama de la estadística que hace posible la estimación de una característica de una población o la toma de una decisión referente a una población, fundamentándose sólo en los resultados de la muestra. La estadística Inferencial, por otro lado, se refiere a la rama de la estadística que trata de los procesos inferenciales, la que a su vez vislumbra la teoría de estimación y prueba de hipótesis. Uno de los primordiales aspectos de la inferencia estadística es el proceso que radica en utilizar estadísticos muéstrales para adquirir conclusiones sobre los verdaderos parámetros de la población. Los requerimientos de los métodos de la inferencia estadística se originan de la necesidad del muestreo. Al tornarse muy grande una población, comúnmente resulta demasiado costoso, prolongado en el tiempo y complicado obtener información de la población completa. Las decisiones con respecto a las características de la población se deben basar en la información contenida en una muestra de esa población. La teoría de la probabilidad suministra él vínculo, determinando la probabilidad de que los resultados provenientes de la muestra reflejen los resultados que se obtendrían de la población. Se pueden observar con albor estas ideas en el ejemplo de una encuesta política. Si el encuestador desea estimar el porcentaje de votos que un candidato obtendrá en una elección específica, no entrevistaría a cada uno de los millares (o inclusive millones) de votantes. Más bien, seleccionaría una muestra de los votantes. Tomando como base el resultado de la muestra, obtendría conclusiones acerca de la población total de votantes. A estas conclusiones se les asociaría un planteamiento de probabilidad que específica la esperanza o la confianza que se tiene de que los resultados de la muestra reflejen la verdadera conducta de los votantes de toda la población. La fidelidad de cualquier estimación tiene una importancia enorme. Esta precisión depende en gran parte de la forma de tomar la muestra y de la atención que se ponga en que esta muestra suministre una imagen fiable de la población, pero casi nunca la muestra representa la población en toda su plenitud, y de ello resultará un error muestral.
  10. La estadística inferencial complementa a la descriptiva y a través

    de ella se puede inferir el comportamiento de un grupo grande (población) a partir del estudio de una pequeña parte de esa (muestra). La estadística inferencial nos permite, entre otras cosas, analizar el comportamiento de los mercados a partir de las tendencias de la oferta y de la demanda, y permite también visualizar el futuro comportamiento de una empresa, permitiendo el análisis de la eficiencia de las empresas. También se entiende por estadística inferencial aquella que trata de los procesos inferenciales, la que a su vez comprende la teoría de estimación y prueba de hipótesis. Esta, también provee conclusiones o inferencia, en base a los datos simplificados y analizados; detectando las interrelaciones que puedan unirlos, las leyes que los rigen y eliminando las influencias al azar; llegando más allá de las verificaciones físicas posibles. Basándose, en la muestra estudiada saca conclusiones, o sea, hace inferencia o inducción, en cuanto al universo o población, de donde se obtuvo dicha muestra. Para su estudio son necesarios conocimientos más profundos de la teoría de probabilidades y análisis matemáticos, ya que parte de los conocimientos resultantes en el proceso descriptivos, para deducir nuevos hechos o relaciones del conjunto observado con otros conjuntos. Un ejemplo, en el cual se aplica la estadística inferencial es en la predicción de los resultados de unas elecciones antes de que haya concluido el recuento de votos. ETIMOLOGÍA DE LA PALABRA ESTADÍSTICA La noción de “estadística” procedió primitivamente del vocablo “estado”, porque ha sido ocupación tradicional de todos los gobiernos de la civilización llevar registros de las poblaciones que dominaban o gobernaban, entre eso registros se pueden mencionar: los nacimientos, las defunciones, los censos poblacionales, cosechas, impuestos y muchas otras clases de cosas y actividades que eran y son de importancia para un gobernante. Contar y medir estos hechos generan muchas clases de datos numéricos. Esta se ha convertido en un instrumento cotidiano de todos los tipos de profesionales que se ponen en contacto con datos cuantitativos o extraen conclusiones de ellos. Tales técnicos requieren con urgencia familiarizarse con los principios básicos de los métodos estadísticos para poder evaluar los informes numéricos y otro gran cúmulo de información para así evitar malos usos comunes de la estadística como lo es la generalización e inferencia que es básica en el razonamiento estadístico. Los estudiantes de diversas áreas del conocimiento deberían tener un conocimiento práctico de los métodos estadísticos. Son heterogéneos los vocablos que se citan como antecedentes del término estadística. Sin intentar ser exhaustivos, pero si indagando para describir los de mayor mención, se pueden nombrar los siguientes: STATUS (latín), que significa situación, posición, estado. STATERA (griego), que quiere decir balanza, ya que la estadística mide o pesa hechos. STAAT (alemán), que se refiere a estado como expresión de unidad política superior. FINALIDAD DE LA ESTADÍSTICA La estadística es una ciencia o método científico que en la actualidad es considerada como un poderoso auxiliar en las investigaciones científicas, que le permite a ésta
  11. aprovechar el material cuantitativo. No existen ciencias cuyos fenómenos no

    puedan ser tratados estadísticamente; por tal razón, la estadística la denominan algunos investigadores (Rivas González) como el lenguaje científico. La misma es indispensable en la formación de cualquier profesional universitario o técnico medio, ya que, por medio de esta se pueden realizar diagnósticos de cualquiera investigación que se desee realizar. Esta es indispensable para realizar cualquier trabajo de investigación que requiera una recolección de información. Ella permite resumir los resultados de una investigación en una forma significativa y cómoda. La misma permite deducir conclusiones generales y así afirmar hasta donde se puede ampliar una generalización de una investigación determinada. De la misma forma permite predecir que sucederá algo tomando en cuenta ciertas condiciones que se han analizado con datos anteriores. En las ciencias sociales, administrativas, políticas, medicas, en educación y en otras ciencias permite analizar algunos de los factores casuales en sucesos complejos y que de alguna manera confundirían a un investigador determinado. De acuerdo a lo antes planteado los métodos estadísticos son por lo tanto los compañeros constantes de los que realizan investigación. La estadística y su aplicación, ha avanzado de tal forma en los últimos años, que hoy día se ha hecho imprescindible en todas las investigaciones científicas sea cual fuere el carácter de esta última. HISTORIA DE LA ESTADÍSTICA Desde el inicio de la civilización han existido formas sencillas de estadística, puesto que en la antigüedad se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o ciertas cosas que eran de importancia en aquellas civilizaciones. El término estadístico es ampliamente percibido y pronunciado a diario desde diversos sectores activos de la sociedad. No obstante, hay una gran diferencia entre el sentido del termino cuando se utiliza en el lenguaje corriente, generalmente al anteceder una citación de carácter numérico, y lo que la estadística significa como ciencia. La razón o razones que motivaron al hombre en un momento de su desarrollo a tomar en cuenta datos con propósitos estadísticos, posiblemente se encuentra si se toma en cuenta que es difícil suponer un organismo social, sea cual fuere la época, sin la necesidad, casi instintiva, de recoger aquellos hechos que aparecen como actos esenciales de la vida; y así, al ubicarnos en una etapa del desarrollo de la estadística podemos especular que se convirtió en una aritmética estatal para asistir al gobernante que necesitaba conocer la riqueza y el número de los súbditos entre otros, con el objeto de recaudar impuestos o presupuestar la guerra. Hay evidencias del uso de la estadística a un nivel rudimentario por organizaciones sociales antiguas. Así por ejemplo, en los monumentos egipcios hay testimonios de que los movimientos de poblaciones eran seguidos por medio de censos. La Biblia cita que Moisés hizo un censo de los Israelita en el desierto, como también que David llevó un censo. En China, Confucio narra como un rey llamado Yao, unos 3.000 años a.C., hizo levantar un recuento agrícola, industrial y comercial del país. Desde los comienzos de la civilización han existido formas sencillas de estadística, pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el número de personas, animales o cosas. Hacia
  12. el año 3000 a.C. los babilonios usaban pequeñas tablillas de

    arcilla para recopilar datos sobre la producción agrícola y sobre las especies vendidas o cambiadas mediante trueque. En el siglo XXXI a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos de la población y la renta del país. Los libros bíblicos de Números y Crónicas (Números, texto sagrado, cuarto libro del Antiguo Testamento, así llamado porque los capítulos iníciales se refieren al censo, o numeración, de las tribus israelitas. La primera sección está dedicada casi en exclusiva a asuntos estadísticos. Los Libros de las Crónicas, dos libros del Antiguo Testamento que interpretan la historia de Israel y Judea desde la creación de Adán hasta mediados del siglo VI a.C. Considerados por los cristianos como libros históricos de La Biblia, son los dos últimos del canon hebreo, en el que se hallan incluidos los Hagiográficos) incluyen, en algunas partes, trabajos de estadística. El primero contiene dos censos de la población de Israel y el segundo describe el bienestar material de las diversas tribus judías; El libro concluye con disposiciones para el reparto de la tierra. En China existían registros numéricos similares con anterioridad al año 3000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar impuestos. Apolonio de Perga, matemático griego, llamado el 'Gran Geómetra', que vivió durante los últimos años del siglo III y principios del siglo II a.C. Nació en Perga, Panfilia (hoy Turquía), escribió sobre cálculos aritméticos y estadísticos. El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la población, superficie y renta de todos los territorios bajo su control. Servio Tulio (578 – 534 a.C), el sexto monarca de Roma giró instrucciones para que se realizaran censos cada 5 años, con la finalidad de planificar los impuestos, alistamiento militar, entre otros. La Biblia, cuenta que San José y la Virgen Maria viajaban a Belén a inscribirse en el segundo censo romano, cuando nació JESÚS, siendo la época del Emperador romano Augusto. Claudio, Apio (siglo IV-siglo III a.C.), oficial, orador y escritor romano, llamado el Ciego (Caecus), ejerció el cargo de censor desde el 312 hasta el 307 a.C. Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve (714 - 768) y Carlomagno ( 742 – 814) ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó la realización de un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. EL Domesday Book, a veces llamado simplemente Domesday, es el texto de un estudio estadístico de Inglaterra, cuya realización ordenó Guillermo I el Conquistador. Esta encuesta, realizada en 1086, tenía como objetivo inventariar de modo sistemático la riqueza rústica del país y determinar las rentas que los propietarios de las tierras tenían que pagar al rey. Este inventario se realizó a una escala sin precedentes en la Europa medieval. Los sistemas anteriores de tasación eran muy antiguos y habían quedado obsoletos.
  13. Al quedar registradas todas las propiedades feudales, tanto de la

    Iglesia como de los laicos, el Domesday Book hizo posible que Guillermo I fortaleciera su autoridad al exigir un juramento de fidelidad a todos los propietarios de tierras, al igual que a la nobleza y al clero, en cuyas tierras vivían los arrendatarios. La labor fue ejecutada por grupos de funcionarios llamados legati, quienes visitaban cada condado y realizaban una encuesta pública. Las preguntas que esos funcionarios realizaban a los representantes de los distintos pueblos y condados constituyeron la Inquisitio Eliensis; las respuestas aportaban la información que se compiló en el Domesday Book. Domesday es el vocablo resultante de la deformación de la palabra doomsday (el día del Juicio Final o Universal) la obra fue llamada de este modo por sus dictámenes relativos a las imposiciones y a las tasaciones, que eran irrevocables. El manuscrito original estaba formado por dos volúmenes. El primero y más grande, el Gran Domesday, incluía información de toda Inglaterra con la excepción de tres condados orientales (Essex, Suffolk, y Norfolk), algunos condados septentrionales, Londres (de la cual no ha sobrevivido ningún registro) y algunas otras ciudades. Los datos de esos tres condados del este formaban el segundo volumen, que fue conocido como el Pequeño Domesday. Estos documentos fueron usados frecuentemente en los tribunales medievales, y los textos publicados son empleados ocasionalmente hoy día en litigios relativos a cuestiones de topografía o genealogía. Los dos volúmenes se publicaron por vez primera en 1783; en 1811 se publicó un índice en un volumen independiente; un volumen adicional, que contenía la Inquisitio Eliensis con los datos de las tierras de Ely, se editó en 1816. En América Latina, en la época de los monarcas Borbones Carlos III y Carlos IV, movidos por un impulso de control burocrático y administrativo, procedieron al levantamiento de censos de población en los virreinatos. En 1482 los Reyes Católicos (España) realizaron un censo de sus reinos al que siguió otro después de la conquista de Granada. En el reinado de Felipe II (1527 – 1578), se emprendió bajo la dirección de Ambrosio de Morales una gran obra estadística que al cabo de siete años reunió solamente 636 relaciones de los 13.000 pueblos que existían a la sazón en la península y que se conservan en la biblioteca del monasterio de El Escorial. De la misma forma se ordena levantar un censo de población en las colonias dominadas por el reinado, en él Nuevo Mundo. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado Observations on the London Bills of Mortality (Comentarios sobre las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad se inició en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund Halley como base para realizar la primera tabla de mortalidad. En el siglo XIX, con la generalización del método científico para estudiar todos los fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad
  14. de reducir la información a valores numéricos para evitar la

    ambigüedad de las descripciones verbales. A principios del siglo XVII en Alemania comenzó a tomar fuerza una disciplina orientada a la descripción de las cosas notables de Estado; esta disciplina gozaba de una sistematización orgánica y respondía a principios doctrinales. Ajustada a esta estructura, Hermann Coring (1.600–1.681) la introduce en un curso de ciencia política con el propósito de describir y examinar los casos sobresalientes del Estado. Posteriormente Godofredo Achewald (1.719-1.772) entra a considerarla como disciplina independiente y la introduce como una asignatura universitaria con el nombre de ESTADÍSTICA, encargada de la descripción de las cosas del Estado. Paralela y contemporánea con la escuela Alemana, en Inglaterra se desarrolla la escuela conocida con el nombre de los aritméticos políticos y en Francia la escuela probabilística. La escuela de los “Aritméticos Políticos” tenia como propósito fijar en números aquellos fenómenos sociales y políticos buscados por los empíricos. Tienen como hecho meritorio sus creadores el intento de buscar leyes cuantitativas que regulan los comportamientos sociales. Uno de sus miembros fue Graunt (1.620-1.674), quien realizó investigaciones estadísticas sobre población y por ello se le señala como el iniciador de la tendencia conocida con el nombre de estadística investigadora, la cual se oponía a la postura universitaria Alemana que se conocía con el nombre de estadística descriptiva. La escuela probabilística, conocida también como enciclopedicotemática, fundamentó su desarrollo en el empleo de la matemática particularizada en el cálculo de probabilidades como instrumento de investigación. El cálculo de probabilidades nace con Blas Pascal (1.623-1.662) y Pedro de Fermat (1.601-1.665) al tratar de dar soluciones a problemas relacionados con juegos de azar propuestos por Antonio Gambaud, más conocido con el titulo nobiliario de Caballero de Meré. A partir de Pascal fueron numerosos los matemáticos ilustres que al apoyarse en la teoría de la probabilidad formularon la teoría estadística y su aplicación práctica. Pascal, fue un filósofo, matemático y físico francés, considerado una de las mentes privilegiadas de la historia intelectual de Occidente; Pascal formuló la teoría matemática de la probabilidad, que han llegado a ser de gran importancia en estadísticas actuariales, matemáticas y sociales. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. Sin pretender rescindir los nombres de todos aquellos que han contribuido al desarrollo de los métodos estadísticos, es significativo indicar los aportes de Adolph Quetelet a quien se le reconoce como el padre de la estadística moderna por su persistencia en insistir sobre la importancia de aplicar métodos estadísticos. En este espacio es justo reconocer la labor desarrollada por Antonio Cournout (1.801-1.877), tendiente a integrar las leyes de la teoría de la probabilidad al análisis estadístico; esto le dio prestancia a la estadística al tiempo que la dotó de un rigurosísimo hasta ese momento ausente en sus procedimientos.
  15. Ahora bien, si se tuviese que señalar un hecho que

    haya contribuido más al desarrollo de lo que se pudiera llamar estadística moderna, tal vez la mayoría de los estudiosos del tema, por no decir todos, estarían de acuerdo en señalar la aparición de la distribución normal. La ecuación de la curva asociada a esta distribución fue publicada por vez primera en 1.733 por De Moivre, pero debido a su incapacidad para aplicar sus resultados a observaciones experimentales; su trabajo permaneció inédito hasta cuando Karl Pearson lo encontró en una biblioteca en 1.924. Sin embargo, Laplace (1.749- 1.827) y Gauss, Carl Friedrich (1.777-1.855) obtuvieron cada uno por su lado el mismo resultado que había conseguido De Moivre. Gauss, fue un matemático alemán conocido por sus muy diversas contribuciones al campo de la física. En la teoría de la probabilidad, desarrolló el importante método de los mínimos cuadrados y las leyes fundamentales de la distribución de la probabilidad. El diagrama normal de la probabilidad se sigue llamando curva de Gauss o Curva Normal, también denominada Distribución Normal o Campana de Gauss, en su honor; es la distribución media o promedio de las características de una población, cuya gráfica produce una figura tipo acampanada. Su importancia y su gráfica asociada se debe a la enorme frecuencia con que aparece en todo tipo de situaciones Entre los contemporáneos a Quetelet y Gauss que contribuyeron al avance de la estadística como ciencia estaba Florence Nightingale (1.820-1.910) y Galton, Sir Francis (1.822-1.911). Nightingale afirmaba que los políticos y legisladores fracasaban a menudo porque sus conocimientos estadísticos eran deficientes. Galton, fue un científico británico famoso por su trabajo en los campos de la antropología y la herencia, considerado el fundador de la ciencia de la eugenesia; se interesó por la herencia y la biometría. Recopiló estadísticas sobre la estatura, dimensiones, fuerza y otras características de un gran número de personas. También desarrolló técnicas fundamentales para las mediciones estadísticas, especialmente respecto al cálculo de la correlación entre pares de atributos. Galton fue nombrado sir en 1909. El científico británico sir Francis Galton y su alumno Karl Pearson fueron dos de los principales fundadores de la biometría. Esta proporcionó una forma de analizar la herencia de caracteres en la población sin recurrir al empleo de experimentos de reproducción. La obra de Galton estimuló a Karl Pearson (1.857-1.936) para que profundizara en sus investigaciones y fundó así el periódico Biométrica, el cual influyó profundamente en el desarrollo de la estadística. Pearson, matemático y filósofo de las ciencias británico, se le conoce por haber desarrollado algunas de las técnicas centrales de la moderna estadística, y por aplicar estas técnicas a los problemas de la herencia biológica. Pearson nació en Londres y se graduó en la Universidad de Cambridge en 1879. Estudió derecho poco después de su graduación, pero ocupó la mayor parte de su vida laboral en enseñar matemáticas aplicadas, mecánica y genética en el University College de Londres. A principios de 1900, Pearson se interesó por el trabajo de Francis Galton, que intentaba encontrar relaciones estadísticas para explicar cómo las características biológicas iban pasando a través de sucesivas generaciones. Las investigaciones de Pearson colocaron en gran medida las bases de la estadística del siglo XX, definiendo los significados de correlación, análisis de la regresión y desviación típica. En 1911 Pearson alcanzó el cargo de profesor de Eugenesia en el University College, examinó la recopilación y análisis de la información de las características como inteligencia, criminalidad, pobreza y creatividad y su relación genética a través de generaciones. Pearson confiaba en aplicar estas intuiciones con el fin de mejorar la raza
  16. humana. Fue un autor muy prolífico sobre gran cantidad de

    temas científicos y matemáticos, y escribió un libro, muy influyente, sobre los métodos de la ciencia, llamado La gramática de las ciencias (1892) Muchos métodos que forman parte del glosario del análisis estadístico son obra de Pearson y su obra cumbre fue la creación de la distribución de Chi cuadrado. Davenport, Charles Benedict (1866-1944), zoólogo y eugenista estadounidense, quien desempeñó un importante papel en la introducción de métodos estadísticos en el campo de la biología y en la aplicación de los mismos a los problemas de la herencia. También intentó aplicar estas ideas a la mejora de la raza humana mediante la eugenesia. Posteriormente se licenció por la Universidad de Harvard en 1889 y obtuvo el doctorado en zoología en 1892. Dio clases en Harvard hasta 1899, año en que publicó la obra Métodos estadísticos con referencia especial a la variación biológica, basada en los trabajos del matemático británico Karl Pearson sobre estadística biológica. Debido a que Pearson se ocupó fundamentalmente de muestra grande, la correspondiente teoría no se ajustaba para el estudio basado en muestras pequeñas. Entre los experimentadores que vivían este problema estaba William Gosset (1.876- 1.937), quien estudiaba con Pearson. Gosset, quien escribía con el seudónimo de “Student”, dedujo la distribución T y con ello solucionó el problema para el estudio de pequeñas muestras. Laplace, Pierre Simon, marqués de (1749-1827), astrónomo y matemático francés, conocido por haber aplicado con éxito la teoría de la gravitación de Newton a los movimientos planetarios en el Sistema Solar. También trabajó sobre la teoría de la probabilidad en su Teoría analítica de las probabilidades (1812) y en Ensayo filosófico sobre la probabilidad. (1814) Poisson, Siméon Denis (1781-1840), Fue un físico matemático francés nacido en Pithiviers (Loiret). Se le conoce, sobre todo, por sus contribuciones teóricas a la electricidad y al magnetismo, aunque también publicó varias obras sobre otros temas, como el cálculo de variaciones, la geometría diferencial y la teoría de la probabilidad. La distribución de Poisson es un caso especial de la distribución binomial en estadística. Babbage, Charles (1792-1871), inventor y matemático británico que diseñó y construyó máquinas de cálculo basándose en principios que se adelantaron al moderno ordenador o computador electrónica. . Ingresó en la Real Sociedad en 1816 y participó activamente en la fundación de la Sociedad Analítica, la Real Sociedad de Astronomía y la Sociedad de Estadística. Hollerith, Hermann (1860-1929), inventor estadounidense nacido en Buffalo (Nueva York), estudió en la Universidad de Columbia. Inventó un método de codificación de datos en fichas o tarjetas en las que mediante perforaciones se inscriben datos numéricos o alfabéticos. Este sistema resultó ser de gran utilidad en trabajos estadísticos y fue muy importante en el desarrollo de los ordenadores o computadoras digitales. La máquina de Hollerith, fue utilizada en 1890 para realizar el censo de los Estados Unidos, leía la información a través de unos contactos eléctricos. Booth, Charles (1840-1916), armador, estadista y sociólogo británico. Nació en Liverpool y se le conoce principalmente por su informe Life and Labour of the people in
  17. London (Vida y trabajo de los londinenses, 17 volúmenes, 1891-1903),

    en el que revelaba la enorme pobreza existente en la ciudad. Fue presidente de la Royal Statistical Society (Real Sociedad de Estadística) británica de 1892 a 1894. Fisher, Sir Ronald (1890-1962), matemático británico, recibió influencia de Karl Pearson y de Student, e hizo numerosas e importantes contribuciones a la estadística, sobre todo en su aplicación para el estudio de situaciones propias de la agricultura, biología y genética. Sus teorías estadísticas hicieron mucho más precisos los experimentos científicos. Sus proyectos estadísticos, primero utilizados en biología, rápidamente cobraron importancia y fueron aplicados a la experimentación agrícola, médica e industrial. Fisher también contribuyó a clarificar las funciones que desempeñan la mutación y la selección natural en la genética, particularmente en la población humana. Es el autor de la Distribución F, aplicable a pruebas de hipótesis y de las varianzas de las pequeñas muestras. Gallup, George Horace (1901-1984), analista de la opinión pública y estadista estadounidense. En 1935 fundó el Instituto Americano de Opinión Pública, del que fue director, y en 1936 creó el Instituto Británico de Opinión Pública. Gallup fue un pionero en la utilización de métodos estadísticos para medir el grado de interés que los consumidores ponían en la lectura de anuncios de revistas y periódicos, y para determinar el estado de la opinión pública sobre temas generales. Gallup dirigió trabajos de investigación en muchas organizaciones, ganó numerosos galardones y escribió varios libros. El tipo de sondeo que lleva su nombre (una Encuestadora de opinión pública en el ámbito político) ha alcanzado gran celebridad. Abrahan Wald (1.902-1.950), quien en sus libros Sequential Analysis y Statistical Decisión Functions, presenta conquistas estadísticas orientadas en el campo de la genética. Neumann, John von (1903-1957), matemático estadounidense nacido en Hungría, que desarrolló la rama de las matemáticas conocida como teoría de juegos. Viajó a Estados Unidos en 1930 para unirse al claustro de la Universidad de Princeton. A partir de 1933 se incorporó al Instituto de Estudios Avanzados de Princeton (Nueva Jersey). Von Neumann fue un gran matemático. Destacó por sus aportaciones fundamentales a la teoría cuántica, especialmente el concepto de anillos de operadores (actualmente conocido como álgebra de Neumann) y también por su trabajo de iniciación de las matemáticas aplicadas, principalmente la estadística y el análisis numérico. También es conocido por el diseño de computadoras electrónicas de gran velocidad y en 1952 diseñó la primera computadora que utilizaba un programa archivado flexible, el MANIAC I. J. Neyman, 1.894 y E.S. Pearson, 1.895, presentaron una teoría sobre la verificación o prueba de hipótesis estadística, entre 1.936 y 1.938. La teoría estimuló la investigación y fueron varios los resultados de uso práctico. LA ESTADÍSTICA EN NUESTROS DÍAS Hoy en día, la estadística se ha convertido en un método efectivo para describir con exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
  18. experto estadístico no consiste ya sólo en reunir y tabular

    los datos, sino sobre todo en el proceso de “interpretación” de esa información. El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. La Probabilidad, es una rama de las matemáticas que se ocupa de medir o determinar cuantitativamente la posibilidad de que ocurra un determinado suceso. La probabilidad está basada en el estudio de la combinatoria y es fundamento necesario de la estadística. Numerosas colecciones de datos se pueden aproximar con gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadístico. En la actualidad la estadística ha alcanzado tal grado de perfeccionamiento y especialización, que podría decirse, que no existe disciplina científica en la cual no se apliquen los métodos estadísticos como herramienta indispensable para iniciar cualquiera investigación de envergadura. Todo lo que hasta apartadamente tiene que ver con la recolección, procesamiento, análisis e interpretación de datos numéricos pertenece al dominio de la estadística, comprende, por ejemplo, el cálculo del aumento, en promedio, de las utilidades de una importante compañía de ventas de artículos por Internet los últimos tres años; la recolección y presentación anual de la deuda a corto plazo de tres compañías de electricidad, así como un porcentaje de su deuda a largo plazo; la evaluación de la eficacia de dos diferentes programas de computación, destinado reducir el número de accidentes personales en una empresa, el tiempo perdido en trabajo de alto riesgo; y el análisis de las variaciones que ocurren de cuando en cuando en serie de datos económicos, ventas al menudeo, precios al consumidor y al mayoristas, y distribución de dinero, precios de productos comunes, productividad del sector agrícola, etcétera. La palabra estadística, por sí sola se utiliza en varias formas. En un contexto, significa un conjunto de datos como los que se pueden encontrar en las páginas financieras de los diarios o en el compendio estadístico de Venezuela. Pero, en otro ámbito, se refiere a la totalidad de los métodos que se aplican en la recolección, organización, presentación, análisis e interpretación de cualquier tipo de datos. En este último sentido, la estadística es una rama de las matemáticas aplicadas, y es este campo de las matemáticas el que constituye el tema central de este curso. Una de las manifestaciones más comentado en los últimos años del pasado siglo y del presente milenio, ha sido el desarrollo de métodos y conceptos estadísticos. Durante muchos años, a la estadística le concernían principalmente la recolección de datos y su presentación en tablas y gráfica; hoy día ha evolucionado hasta el punto en que su impacto se percibe en casi todas las áreas de trabajo del ser humano. Esto es debido a que la estadística posmoderna está relacionada directamente con el problema de la toma decisiones en condiciones de incertidumbre. Sin necesidad de entrar en detalles, existen elemento de incertidumbre en casi todo lo que el ser humano realiza actualmente. La característica más trascendental del reciente avance de la estadística ha sido el cambio de los métodos meramente descriptivo por otros que sirven para hacer generalizaciones o, dicho lo otra manera, un cambio de la estadística descriptiva a la deductiva o inferencia estadística. Por estadística descriptiva se entiende a cualquier tratamiento de datos que este diseñado para ser resumido o describir algunas de sus propiedades más importantes sin intentar deducir nada que escape al alcance de los
  19. datos. Por ejemplo, si el gobierno de Venezuela informa, con

    base en el censo decenal, que la población del país fue de 22 millones de habitantes para 1990, esto pertenece al campo de estadística descriptiva. Este sería también el caso si calculamos el crecimiento % correspondiente de una década a la siguiente. Sin embargo; éste no sería el caso si empleáramos tales datos para percibir la población de Venezuela en el año 2003 o el crecimiento porcentual de 1980 al año 2003. La estadística descriptiva es una rama importante de la estadística y se siguen empleando ampliamente en el área comercial y en otras áreas de la actividad administrativa. Sin embargo, en la mayor parte de los casos, la información estadística surge de muestras, de observaciones realizadas sólo en algunos elementos de un conjunto grande, o de la observación de acontecimientos pasados. El tiempo, el costo o la imposibilidad de hacer lo contrario suele requerir un procedimiento de este tipo, aunque nuestro interés real yace en todo el conjunto de elementos de los cuales provino la muestra y los acontecimientos futuros, no en el pasado. Las generalizaciones de cualquier tipo escapan al contenido de la estadística descriptiva; se nos induce al uso de la diferencia estadística para resolver muchos problemas de operaciones cotidianas y para la elaboración de planes a corto y largo plazo. Por Ejemplos los métodos de la inferencia estadística son necesarios para decidir si un lote grande de acumuladores de nueve voltios para equipos de sonido cumplen en promedio con la vida útil garantizada por el fabricante; para determinar la dosis mínima eficaz y la máxima seguridad de un nuevo medicamento anti-inflamatorio en el tratamiento de inflamaciones locales dolorosa; para estimar la demanda de nuevas cauchos para vehículos rústicos en la época de lluvia, o bien para predecir la demanda total de fibras de madera requerida en Venezuela para todos los usos, durante el 2000. No obstante, siempre que se haga una inferencia estadística (una generalización que escape a los límites de nuestras observaciones) se debe proceder con mucha precaución. De hecho, hay que considerar concienzudamente si resulta posible hacer algunas generalizaciones válidas del todo y, si lo es, hasta donde se puede generalizar. Sin embargo, algunas veces aunque se actué cautelosamente al generalizar, se puede errar por completo en las generalizaciones y encontrarse con algunas dificultades. En realidad, uno de los problemas básicos de la inferencia estadística es el de la apreciación de los riesgos que representa hacer generalizaciones equivocadas y quizás hacer algo incorrecto, tomando como base los datos analizados de una muestra. El hecho de que aquí se solicite que se preste atención a los errores estadísticos puede parecer una manera negativa de dar comienzo a un estudio pero, en realidad, la constante advertencia de que existe la posibilidad de hacer conclusiones y acciones equivocadas, y el deseo de controlarla, permiten dirigir correctamente el curso de la investigación en estadística. La realidad es dura e inflexible y se debe enfrentar en sus propios términos. Se vive hoy, en un mundo lleno de incógnitas y no existe manera de eliminar por completo los riesgos de tomar decisiones equivocadas. Siendo éste el caso, el verdadero problema no consiste ahora en cómo eliminarlos, sino como vivir con ellos de manera inteligente. Cuanto más pronto se comprenda esto, más seguros se estará y tanto mejo se entenderá por qué la estadística es una disciplina que vale la pena estudiarla. Una de las razones principales para estudiar estadística es que se consagra en forma directa al problema universal de cómo tomar decisiones inteligentes en condiciones de incertidumbre o
  20. bien, en forma más breve, al problema de la toma

    de decisiones con incertidumbre lo cual es muy común para aquel profesional de la contaduría o administración comercial.. LA ESTADÍSTICA EN LA ADMINISTRACIÓN Y LA CONTADURÍA La estadística posmoderna es altamente refinada y ahora esta produciendo una contribución importante a la solución de muchos problemas de toma de decisiones en condiciones de incertidumbre. Más aún, se está logrando un progreso sustancial y continúo en la creación de nuevos métodos que satisfacen las urgentes necesidades prácticas de muchas áreas de actividad. Por ejemplo, en los campos de la medicina y la salud pública, la ciencia de la bioestadística, recientemente creada y el rápido desarrollo, está aplicando eficaces métodos matemáticos y estadístico al estudio de ciertos problemas fundamentales, relacionado con el crecimiento, el desarrollo, las enfermedades y los decesos en las poblaciones humanas, como son los efectos perjudiciales de la contaminación del aire, la relación entre la dieta y la muerte por afecciones cardiacas, y entre el tabaquismo y el cáncer pulmonar. En estas áreas, como en muchas otras, los métodos estadísticos ofrecen un marco para observar los problemas en forma sistemática lógica. En realidad, estos métodos posmodernos son, en muchos casos, absolutamente esenciales para el progreso ordenado y continuo hacia el logro de metas importantes. Difícilmente se halla un área en done el impacto de los métodos estadística se haya sentido con mayor eficacia que en el medio comercial y administrativo donde, de una forma ordinaria, deben tomarse decisiones que afectan el beneficio y la continuidad en todos los niveles de todo los tipos de organizaciones. En realidad, sería difícil sobrestimar las contribuciones que los métodos estadísticos han provocado en la planificación, la organización, la operación y el control efectivo de todas las actividades administrativas y comerciales. En los últimos 20 años, la aplicación de los métodos estadísticos ha traído consigo cambios radicales en todas aquellas áreas importantes de la administración de empresa: administración general, contaduría, investigación y desarrollo, finanzas, producción, ventas, publicidad y todo lo demás. Naturalmente, no todos los inconvenientes de éstas áreas son de naturaleza estadística, pero es muy amplia la lista de aquellos que logran tratarse parcial o totalmente por medio de los métodos estadísticos. Para establecerlos, se referirán algunas de las dificultades que podrían enfrentar algunos empresarios importantes: En el área de la administración general, donde la planificación y administración a largo plazo es de mayor interés, deben pronosticarse las tendencias poblacionales de diversos países y deben analizarse sus efectos en los mercados de consumidores de un mundo globalizado. En la investigación e ingeniería, deben estimarse los costos de diverso proyectos y se deberán anticiparse los requisitos de mano de obra, capacidad, equipo tiempo. En el área de las finanzas, se deberán determinar los potenciales de aprovechamiento del capital, deben proyectarse todos los requisitos financieros y deben estudiarse los mercados de capitales, de manera que puedan elaborarse adecuados planes de financiamiento de inversión a largo plazo. En la producción, brotan dificultades de naturaleza estadística en relación con aspectos como la disposición y estructura de las plantas, el tamaño y la ubicación de las mismas, el inventario, la programación y el control de la producción, el mantenimiento, el tránsito y el manejo de materiales, y el control de calidad. En los últimos años se han
  21. alcanzado grandes avances con la diligencia de la estadística a

    estas últimas áreas, es decir, a la inspección por muestreo y al control de calidad. En el área de las ventas, se exteriorizan muchas dificultades que requieren soluciones estadísticas. Por ejemplo deben predecirse las ventas de productos actuales y nuevos, para los mercados existentes y para los que se originen posteriormente; deben establecerse los canales de distribución y deben valorarse los requisitos de la fuerza de ventas. En la publicidad, la instauración de campañas triunfales puede ser una labor insegura. Deben establecerse presupuestos, es necesario crear asignaciones a diversos medios y debe calcularse o predecirse, las eficacias de las campañas con estudio muéstrales de la respuesta del público y otra técnica estadísticas. Hasta ahora se han tratado dificultades de naturaleza estadística con los que podría enfrentarse un empresario o industrial importante. No obstante, problemas análogos se plantean por ejemplo, a un empresario ferrocarrilero que intenta optimizar el uso de miles de vagones de carga; a un ganadero que intenta decidir cómo alimentar a su ganado de manera que sus necesidades nutricionales se satisfagan al más bajo costo posible; a una empresa de inversiones abiertas que desea decidir qué cantidad de sus activos totales deben mantenerse en los saldos de efectivos funcionales y cuantos se deben invertir en acciones comunes y bonos a corto plazo; y a una industria integrada de gas, que produce y procesa gas natural, petróleo crudo y productos derivados del petróleo, que planea sus prácticas de expansión para el futuro, y también sus sistema de transporte y la creación de fuente de energía . No es necesario, hacer referencias a grandes organizaciones para encontrar aplicaciones comerciales de la estadística. En relación con las empresas pequeñas, los problemas suelen diferir más en grado que en clase de los que tienen sus competidores grandes. Por ejemplo, ni el supermercado más grande, ni las tiendas más pequeñas tienen un limitado capital o espacio en el almacén, y tampoco pueden darse el lujo comprometer estos activos con productos inadecuados. El problema de utilizar el capital y el espacio de almacenamiento de la manera más eficaz es tan vital para la tienda pequeña como para la grande, y sólo una persona muy miope puede pensar que las modernas herramientas de administración, entre ellas, las técnicas estadística moderna, son útiles solamente para las empresas grandes. Efectivamente, difícilmente se llegaría a necesitar en otra parte con más urgencia que en las empresas pequeñas, donde cada año fracasan miles de las unidades en operaciones y donde miles de las nuevas unidades que entran en funcionamiento, están destinadas a fallar en virtud de capital inadecuado, crédito excesivo, inundación del mercado con el producto equivocado, y en términos generales, falta de conocimiento del mercado o de la competencia, que solo es posible vislumbrar si se utilizan las herramientas que proporciona la estadística. Aunque en este curso la intención está dirigida principalmente a la estadística comercial y administrativa las metas específicas consisten en presentar los métodos y conceptos básicos de la estadística al estudiante que egresará de esta institución; con estas herramientas el nuevo profesional estará en capacidad de tomar decisiones racionales. Es bueno destacar que los empleados y ejecutivo de las empresas no son las únicas personas que deben tomar decisiones en las que intervienen incertidumbres y riesgo. Todo el mundo debe tomar decisiones de este tipo en el terreno profesional o, simplemente, como parte de la vida cotidiana. Es cierto que alguna de las decisiones que
  22. se deben tomar se relaciona sólo con aspecto de preferencia

    personal; por ejemplo, optar entre navegar por Internet o leer un libro. No obstante, en muchos casos engloba la probabilidad de equivocarnos en el sentido de que existe una verdadera pérdida o penalidades, posiblemente sólo sea una incomodidad menor, pero tal vez se trate de algo tan grave como perder toda una fortuna, o hasta la vida, o algo entre estos extremos, cuando se toma una decisión que no es la más adecuada. Los métodos de la estadística moderna tienen que ver con problemas o decisiones que implican riesgo, no sólo en el comercio, la industria y la vida cotidiana, sino también en otros campos como la medicina, la física, la química, la agricultura, los alimentos de la nutrición, la economía, la psicología, la educación, la política, el gobierno, la ecología, etcétera. LOS ORDENADORES Y LA ESTADÍSTICA Los ordenadores han hecho factible que las empresas, el gobierno y otras organizaciones modernas almacenen y procesen una gran colección de datos. Por ejemplo la Oficina Recaudadora de los impuestos pagados en la nación venezolana por los venezolanos utilizan computadoras para compilar lo correlativo a millones de contribuyente; los abogados utilizan los ordenadores para revisar los expedientes de miles de casos legales que pueden ofrecer antecedentes útiles en los casos que están preparando; los investigadores emplean las computadoras para obtener información de cientos de bases de datos, que ofrecen estadísticas actuales e históricas concernientes al comercio, la economía y el gobierno, y los estadísticos obtienen beneficios por la capacidad de los ordenadores para ejecutar millones de operaciones de cálculo con gran velocidad y exactitud, abreviando a menudo las soluciones con llamativos gráficos y tablas a todo color. ¿CUÁL ES EL PROPÓSITO DE UN ESTUDIO ESTADÍSTICO? El propósito de un estudio estadístico es extraer conclusiones de la naturaleza de una población. Al ser la población grande y no poder ser estudiada en su integridad en la mayoría de los casos, las conclusiones obtenidas deben basarse en el examen de solamente una parte de ésta, lo que nos lleva a la justificación, necesidad y definición de las diferentes técnicas de muestreo. ¿CÓMO SE RELACIONAN LA ESTADÍSTICA Y EL MÉTODO CIENTÍFICO? Se relacionan en los siguientes aspectos: Formulación de hipótesis: Es la obtención de datos que sean relevantes al problema. Obtención de datos: Se trata de adquirir información de manera que: La información sea relevante al problema, conclusiones que de ella se obtengan cierto grado de confiabilidad. La cantidad de información necesaria, la forma de recolección y las técnicas de adquirirla, de manera que se cumplan con los objetivos anotados, todos los problemas en e dominio de los métodos estadísticos.
  23. Confrontación de la información obtenida con la consecuencia de las

    hipótesis postuladas: Una vez obtenidos los datos el papel de la Estadística se vuelve más importante puesto que llega la hora de analizarlos. El primer paso en este análisis consiste en ordenar los mismos, en su presentación gráfica y en su descripción de resaltando los aspectos más característicos, en otras palabras, el uso de las técnicas de la estadística descriptiva. ¿QUÉ ES LA ESTADÍSTICA Y EL MANEJO DE DATOS? Las primeras técnicas de la estadística consistían esencialmente en la organización de datos, en su presentación gráfica y en el cálculo de cantidad representativas del conjunto, con el objeto de que los aspectos sobresalientes del mismo fueran rápidos y fácilmente aprehensibles. Esta parte de la materia es lo que en terminología moderna se conoce como Estadística Descriptiva. El papel de la estadística en este proceso es cuantificar la incertidumbre que es indispensable para las conclusiones finales. ETAPAS DEL MÉTODO ESTADÍSTICO El método estadístico, parte de la observación de un fenómeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que actúen libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planteamiento de una investigación, por norma general, se siguen las siguientes etapas: PLANTEAMIENTO DEL PROBLEMA Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y teórica del problema. FIJACIÓN DE LOS OBJETIVOS Luego de tener claro lo que se pretende investigar, debemos presupuestar hasta dónde queremos llegar; en otras palabras, debemos fijar cuáles son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre los objetivos generales y los específicos. FORMULACIÓN DE LAS HIPÓTESIS Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su formulación depende del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística debe ser susceptible de dominar, esto es, debe poderse probar para su aceptación o rechazo. Una hipótesis que se formula
  24. acerca de un parámetro (media, proporción, varianza, etc.), con el

    propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su hipótesis contraria se le llama Hipótesis Alternativa (H1). DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE MEDIDA La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de cuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja. El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la información. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes; una población puede estar constituida por los habitantes de un país o por lo peces de un estanque, así como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado como infinito. Muestra: Es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades del conjunto del cual es obtenida. Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos que la conforman, la muestra debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación. LA RECOLECCIÓN Una de las etapas más importantes de la investigación es la recolección de la información, la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de los parámetros con la precisión establecida. Descubrir dónde está la información y cómo y a qué “costo” se puede conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado.
  25. CRÍTICA, CLASIFICACIÓN Y ORDENACIÓN Después de haber reunido toda la

    información pertinente, se necesita la depuración de los datos recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario. Separado el material de “desecho” con la información depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces necesarios entre las preguntas, se orden las respuestas y se preparan los modelos de tabulación de las diferentes variables que intervienen en la investigación. LA TABULACIÓN Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Un título adecuado el cual debe ser claro y conciso. La tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes items de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los créditos a la fuente de la información. LA PRESENTACIÓN Una información estadística adquiere más claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos redundantes que, antes que claridad, crean confusión. Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el informe. EL ANÁLISIS La técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisión. PUBLICACIÓN Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acerca de él.
  26. METODOLOGÍA DE LA ESTADÍSTICA La estadística es una ciencia que

    se encarga de recopilar, organizar, presentar, analizar e interpretar un conjunto de datos naturales, político, económico, o sociales, para tomar una decisión de incertidumbre en un momento determinado, mediante una investigación determinada. Tomando en cuenta lo anterior para realizar un estudio estadístico es necesario presentar el métodos para su estudio, los elementos básicos de mismo son los siguientes: 1) Recopilación, 2) Organización, 3) Presentación, 4) Análisis e 5), Interpretación. Sí un investigador desea realizar un estudio de la edad de un grupo estudiantes de una universidad determinada, lo primero que deberá hacer es, recopilar los datos estadísticos de una muestra de las edades de los estudiantes de la universidad procurando que la misma sea representativa de la población objeto de la investigación. El tamaño apropiado de una muestra debe estar acorde con las técnicas del muestreo. Segundo puede organizar las edades recopiladas clasificándolos en diferentes grupos de edades tercero, puede presentar los datos organizados en forma tabular para su mejor estudio, 4º, puede analizar las edades presentadas en la tabla para obtener la información deseada. Por ejemplo el puede encontrar que el grupo de edades típica de los estudiantes de esa universidad está comprendida entre 18 y veinte años puesto que allí se encuentra el mayor número de estudiantes. Finalmente el investigador puede interpretar los resultados analizados de la muestra, diciendo que la edad crítica de todos los estudiantes en ese centro de estudios se encuentran comprendidos entre dieciocho y veinte años, ya que la edad de ese grupo de estudiantes, es la que más se repite. Para la aplicación de los métodos estadísticos es necesario comenzar a reconocer la existencia de algunas herramientas y conceptos que son de gran importancia. Tal es el caso del concepto de variable, clasificación y su medición, pues esto puede ser considerado al momento de seleccionar las herramientas que le pueden ser aplicadas. Por otro lado, el uso de instrumentos para recopilar la información resulta una parte fundamental para la obtención de datos en el área social, y sus características y validez se deben tomar en cuenta al momento de trabajar en la obtención y recopilación de la información. VARIABLES Las variables son magnitud que puede tener un valor cualquiera de los comprendidos en un conjunto de valores de un estudio o investigación determinada. Son todos aquellos datos u observaciones que pueden ser expresados mediante números, es decir, son características de una población determinada, susceptible de medición. Son características que pueden ser observadas en determinado fenómeno natural, social, económico, político etc. Las mismas son susceptibles de adoptar distintos valores o ser expresadas en varias categorías. En los estudios estadísticos que se realizan se busca investigar acerca de una o varias características de la población observada. Para un correcto manejo de la información, estas características deben ser tomadas en cuenta de acuerdo a su tipo para poder aplicar algunas de las operaciones que son necesarios llevar a cabo. Existen muchas definiciones de variables, entre las cuales tenemos:
  27. Son aquellos datos u observaciones que pueden ser expresados cuantitativamente,

    es decir, son características de una población específica, en las cuales se realiza una investigación en un momento dado. Las variables por lo general se representan con letras mayúsculas y sus valores particulares con minúsculas, es decir, si se hace referencia a los salarios devengados por un grupo de trabajadores la variable salario estaría representado por una letra mayúscula, en este caso Xi y varios salarios de diferentes trabajadores en particular, estarían representados con la letra minúscula correspondiente, así: x1 = 180.000, x2 = 190.000, x3 = 480.00, etcétera. Es aquella característica de una población que puede tomar diferentes valores en un estudio determinado. Son símbolos tal como X, Y, Z, A, B, etc., que puede tomar un valor cualquiera de una característica especificada de un estudio determinado. Por lo tanto, son características que pueden ser observadas en determinado fenómeno natural, social, político, económico, etc. Las mismas son susceptibles de adoptar distintos valores o ser expresadas en varias categorías. Por ejemplo, la estatura de las personas, la talla de un grupo de trabajadores petroleros, la edad de un conjunto de estudiantes universitarios, el índice académico de los estudiantes del IUTJAA , son variable. En otras palabras, una variable es una función que asocia a cada elemento de la población la medición de una característica, particularmente de aquella que se desea observar. Clasificación de las Variables Existen muchas clasificaciones de variables, pero en este curso estudiaremos las siguientes: Variables Numéricas: Son aquellas variables que toman valores numéricos. A estas variables le corresponde la escala de medición de intervalo y razón o proporción. Variable Aleatoria o probabilística: Es aquel valor que asume la variable que han sido antecedidas por una selección aleatoria de los objetos medidos o son resultados de algún proceso al azar, es decir, es la variable que toma diferentes valores como resultado de un experimento aleatorio. A las variables aleatorias usualmente se les denota por letras X, Y, Z; y a los valores por las respectivas minúsculas. Por ejemplo, si en un Banco los números de las cuentas corrientes de los clientes que presentan un saldo superior a 1.000.000 de bolívares se escogen veinte al azar, en un día determinado para darles un premio, la variable número de cuenta corriente de cada cliente constituye una variable aleatoria que podemos designar Xi. Por lo tanto, la variable aleatoria es una función de valor real que tiene como dominio el espacio muestral asociado a un experimento aleatorio. Variables Cualitativas o categóricas: Son aquellas variables cuyos valores son del tipo categórico, es decir; que indican categorías o son etiquetadas numéricamente o con
  28. nombres. Son las que se refieren a clasificaciones, como: estado

    civil, profesión, color de los ojos, preferencia por una marca etc., es decir, son aquellas que no aparecen en forma numérica, sino como categorías o atributos. Esta a su vez, se clasifica en: Variables Categóricas Nominales: Son las variables categóricas que, además de que sus posibles valores son mutuamente excluyentes entre sí, no tienen alguna forma “natural” de ordenación. Por ejemplo, cuando sus posibles valores son: “Sí” y “No”. A este tipo de variable le corresponde las escalas de medición nominal. Variables Categóricas Ordinales: Son las variables categóricas que tienen algún orden. Por ejemplo, cuando sus posibles valores son: “siempre”, “casi siempre” y “nunca”. A estos tipos de variables le corresponden las escalas de medición ordinal. Variable Continua: Es aquella que puede tomar cualquier valor dentro de la escala de los números reales, es decir, es aquella que teóricamente puede tomar cualquier valor, bien sean valores enteros o fraccionados. Los valores que puede tomar esa es cualquiera e incluso valores fraccionados por ejemplo, un alumno A mide 1,68 m y otro alumno B mide 1,69 y otro C mide 2,.00 m. Entre estos tres alumnos están los que miden 1.682 m, 1.693 m, 2,125 m, entre otros. Otros ejemplos de variables continuas, pueden ser la talla de las personas o el tiempo necesario para realizar una transacción bancaria por parte de un conjunto de clientes de una entidad bancaria. Variable Discreta: Es aquella variable que solo puede tomar valores enteros en la escala de los números naturales, es decir, la variable no puede tomar valores fraccionarios. Por ejemplo, el número de hijos en un matrimonio puede ser: 0,1, 2, 3 ó 4; pero ningún matrimonio tiene 0,5 ó 3,89 hijos. También, el número de personas que llegan a una entidad bancaria a solicitar un servicio. Estos ejemplos, muestran que las variables discretas sólo asumen valores enteros, es decir, no admiten fraccionamientos. Variable Dependiente: Es aquella que se presenta como consecuencia de una variable antecedente, que por lo general es la variable independientes. Variable Independiente: Es aquella que se presenta como causa y condición de la variable dependiente. Es la manipulada por el investigador; recibe el nombre de variable experimental. UNIVERSO: En estadística es el nombre especifico que recibe particularmente en la investigación social la operación dentro de la delimitación del campo de investigación que tienen por objeto la determinación del conjunto de unidades de observaciones del conjunto de unidades de observación que van a ser investigadas. Para muchos investigadores él termino universo y población son sinónima. En general, el universo es la totalidad de elementos o características que conforman el ámbito de un estudio o investigación. POBLACIÓN: En estadística el concepto de población va más allá de lo que comúnmente se conoce como tal. En términos estadísticos, población es un conjunto finito o infinito de personas, animales o cosas que presentan características comunes, sobre los cuales se quiere efectuar un estudio determinado. En otras palabras, la población se define como la totalidad de los valores posibles (mediciones o conteos) de una característica particular de un grupo especificado de personas, animales o cosas que se desean estudiar en un momento determinado. Así, se puede hablar de la población de
  29. habitantes de un país, de la población de estudiantes universitarios

    de la zona sur del Estado Anzoátegui, de la población de casas de la Urbanización Los Ríos de la ciudad de El Tigre, el rendimiento académico de los estudiantes del IUTJAA, el número de carros marca Corola de la ciudad de El Tigre, la estatura de un grupo alumnos del IUTJAA, la talla, etc. La población es el conjunto formado por todos los valores posibles que puede asumir la variable objeto de estudio, ya que constituye la totalidad del grupo que se quiere estudiar los que van a poseer una característica de ese grupo específico de individuos, animales o cosas. Es la colección de todos los elementos que se están estudiando, acerca de los cuales se intenta sacar conclusiones, el cual puede ser un conjunto finito o infinito de personas, animales o cosas que presentan características comunes. Así por ejemplo, en un estudio sobre la preferencia de los electores que participaran en una elección presidencial, la población consiste en todos los participantes registrados para votar en ese proceso. Pero el término no sólo está asociado a la colección de seres humanos y organismos, también pueden ser cosas no vivientes tales como: el estudio de mercado que se realiza para determinar las ventas anuales de los supermercados de una zona determinada de una ciudad, luego, las ventas anuales de todos los supermercados constituyen así mismo la población. MUESTRA: La muestra es un subconjunto de la población, seleccionado de tal forma, que sea representativo de la población en estudio, obteniéndose con el fin de investigar alguna o algunas de las propiedades de la población de la cual procede. En otras palabras es una parte de la población que sirve para representarla. Según el DRAE, es una parte o porción extraída de un conjunto por métodos que permiten considerarla como representativa del mismo. Entonces, una muestra no es más que una parte de la población que sirve para representarla. La muestra debe obtenerse de la población que se desea estudiar; una muestra debe ser definida sobre la base de la población determinada, y las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia. La muestra debe ser representativa ya que debe contener las características relevantes de la población en las mismas proporciones en que están incluidas en tal población, es decir, contiene las características más importantes de esa colección de elementos que representan la población bajo estudio, a fin de investigar alguna o algunas de las propiedades de la población de la cual procede; y las conclusiones que se obtengan de dicha muestra sólo podrán referirse a la población en referencia. La muestra es el elemento básico sobre el cual se fundamenta la posterior inferencia acerca de la población de donde se ha tomado. Por ello, su escogencia y selección debe hacerse siguiendo ciertos procedimientos o parámetros que son indispensables, es decir, se selecciona de acuerdo con una regla o plan definido. En estadística, en vez de estudiar las poblaciones en su totalidad, se acude al recurso de considerar solamente una parte de ella, a la cual se le denomina muestra. Por lo tanto, una muestra es una parte de la población, seleccionada de acuerdo con una regla o plan definido. Muestreo: Es el procedimiento mediante el cual se obtiene una o más muestras de una población determinada. Existen dos tipos de muestreos a saber:
  30. Muestreo no Probabilístico: Es aquel en el cual se toma

    la muestra según el criterio del investigador, estos pueden ser: muestreo intencional u opinático y el muestreo sin norma o circunstancial. Muestreo Probabilístico: Es aquel que se selecciona utilizando métodos aleatorios en los que se utilizan las probabilidades matemáticas. Entre estos se pueden mencionar: Muestreo aleatorio con reemplazamiento, muestreo aleatorio sin reemplazamiento, muestreo estratificado, muestreo por conglomerado o por área y muestreo aleatorio simple. Los Parámetros.- Son cualquiera característica que se pueda medir y cuya medición se lleve a cabo sobre todos los elementos que integran una población determinada, los mismos suelen representarse con letras griegas. El valor de un parámetro poblacional es un valor fijo en un momento dado. Ejemplo: La media Aritmética = μ (miu), La desviación Típica = σ, (Sigma) etcétera. Los Estadígrafos (Estadísticos o Estimadores).- Son aquellas características medibles, cuya medición se realiza sobre los componentes de una muestra, los mismos se representan con letras del alfabeto castellano. Los estadígrafos no tienen un valor único, sino que pueden tomar distintos valores al ser calculados a partir de muestras diferentes. Ejemplos: la media aritmética = X , La desviación Típica = S. MEDICIÓN: La asignación o magnitud que se aplica a las categorías o clases de acuerdo a ciertas reglas o símbolos. Consiste en la recopilación de datos y su utilización mediante el empleo de una serie de normas de tipo estadístico; es la representación simbólica de un dato o serie de datos obtenidos por algún tipo de observación. ESCALAS DE MEDICIÓN DE LAS VARIABLES Una escala de medición es una asignación de valores numéricos a las características de una muestra o una población, se mide básicamente en proporción de escala. Las escalas de medición son el conjunto de los posibles valores que determinada variable puede tomar. Por tal razón, los tipos de escala de medición están íntimamente ligadas con los tipos de variables a estudiar. Las magnitudes de las observaciones cuantitativas se conocen como los valores que una variable puede asumir. Consiste entonces, en una serie de graduaciones que permiten darle un valor numérico a las características que estamos midiendo; para hacer más comprensible y que adquiera un significado mediante un arreglo ordenado para establecer un análisis estadístico. Son denominaciones o clasificaciones de individuos o características. Las escalas de medición es el alma fundamental de toda investigación Científica, puesto que, sólo a través de ellas es como se pueden calibrar los fenómenos, sus relaciones, entre otros. Se refieren habitualmente a las asignaciones de números a observaciones, de una forma tal que los números sean susceptibles de análisis por medio de manipulaciones u operaciones; estas escalas permiten asignarle un valor numérico a las características que se están midiendo. Por lo general proceden de las medidas de una o más variables. Dependiendo de la medición y de la esencia de las variables, se obtienen diversas clases de datos que originan diferentes escalas. Resulta intensamente conocer el tipo de escala que representan los datos, debido a que, de su esencia dependen las técnicas estadísticas que se deberán aplicar para su análisis.
  31. Para lograr estadísticas confiables hay que manipular cuantiosos datos estadísticos,

    los cuales poseen determinadas características. Por ejemplo, si los datos son alumnos, entre algunas de ellos se puede señalar el peso, la estatura, el sexo, el rendimiento académico, entre otros. Al elaborar estadísticas con datos y su característica es necesario contarlas, jerarquizarlas y medirlas, es por ello que, se utilizan las escalas de medición como el proceso de asignar números o establecer una correspondencia uno a uno entre objetivos y observaciones. Las escalas de medición sé clasifican de la siguiente forma: Escala Nominal, Escala Ordinal, Escala de Intervalos y Escalas de razón o Proporción. Escala de Medición Nominal: Es aquella en la que los números sólo se emplean para diferenciar los objetos de distintas categorías o cuando se emplean nombres. Se dice que los datos que se obtienen para una variable cualitativa se miden en una escala nominal. Si los datos observados simplemente se clasifican en distintas categorías que no implican orden, se tiene un nivel de medición nominal. Ejemplos de números, esta característica son las que usan los jugadores de béisbol, los números telefónicos, los números de las Cedulas de Identidad, etcétera. Se usa una escala nominal cuando se distribuyen conjuntos de objetos, personas o características entre dos o más categorías. La Escala Nominal se utiliza como medida de identidad. Los números pueden servir como indicativos o etiquetas para identificar objetos o clases, pues se usa cuando un objeto se diferencia de otro solamente por la nominación con que se conoce. La escala nominal es la forma más débil de medición porque no se puede intentar el conteo de las diferencias dentro de una categoría determinada o especificar cualquier orden o dirección a lo largo de las diversas categorías. Sin embargo, no se intenta medir dife- rencias entre los valores clasificados dentro de una categoría determinada. Propiedades de la escala Nominal 1. No intervienen mediciones, ni escala, en vez de esto solo hay cuentas o conteos. 2. Esta escala es considerada excluyente, es decir que la persona u objeto se incluye solamente en una categoría. 3. No existe un orden específico para esta categoría. 4. No presentan el cero. 5. No se basa en diferencia cuantitativa. 6. Los elementos de una categoría deben de ser equivalentes, idénticos. Ejemplos: Una muestra de personas puede clasificarse con base en la religión profesada: (1) Cristianos; (2) Judíos; (3) Musulmanes; (4) Otros; y (5) Sin Creencia alguna. O bien podrían clasificarse según el sexo, el color de los ojos, algún partido político, etcétera. Otros ejemplos de escala nominal puede ser el número de placa de los vehículos, los números de los teléfonos de una ciudad, la Cedula de Identidad de los habitantes de un país, etcétera. El tipo de operación estadística más utilizada en la escala nominal es el conteo de las frecuencias con que se presentan las características en las unidades del las respectivas subclases. Estas frecuencias pueden ser presentadas con números absolutos, porcentajes y proporciones. Además, puede calcularse razones, tasas de incremento, y el coeficiente de contingencia.
  32. Escala de Medición Ordinal: Es aquella en la que los

    números se utilizan para diferenciar en orden de supremacía de acuerdo con cierto criterio jerárquico, como son los números que se emplean para clasificar los distintos estratos socio-económicos o para designar preferencias. Si los datos observados se clasifican en categorías distintas en las que existe algún orden, se obtiene un nivel de medición ordinal Cuando los objetos son medidos en escala ordinal los que tengan la misma asignación se consideran iguales; pero los que tengan asignaciones diferentes pertenecen a categorías distintas. La diferencia entre dos números ordinales no tiene significado cuantitativo, sólo expresan, por ejemplo, que una situación es mejor que otra, pero no cuanto. La escala ordinal es una forma un tanto más fuerte de medición que la nominal, porque se dice que un valor observado que se clasifica en una categoría posee más la propiedad que se mide que algún valor observado que se clasifica en otra categoría. También, la escala ordinal siegue siendo una forma de medición débil porque no se pueden hacer planteamientos numéricos significativos con respecto a las diferencias entre las categorías. Es decir, la ordenación establece sólo cuál categoría es “mayor”, “mejor” o “preferida”; y no se habla cuánto es “mayor”, “mejor” o más “preferida”.’Esta escala se emplea, cuando un estudio está basado en ciertas normas que se asignan a un conjunto de objetos, personas o características o a un conjunto de categorías ordenadas. Las categorías de la escala se ordenan dé acuerdo con la cantidad de rasgos o características que representan cada una de ellas ya que la escala ordinal distingue los diferentes valores de la variable, ubicando las características en orden, desde la más alta hasta la más baja. Propiedades de la escala Ordinal 1. Las observaciones o elementos se les ordena en rangos o categorías diferentes. 2. Cada categoría o rango mantiene una relación entre si, estas relaciones se expresan en términos algebraicos de desigualdades (mayor que o menor que). 3. No es posible definir unidades de mediciones iguales en todos los puntos de la escala. 4. Las categorías son mayores o menores que otras categorías, es decir, que existe una clasificación de mayor a menor (jerarquía). 5. Las categorías son mutuamente excluyentes y exhaustivas. 6. No presentan el cero. Ejemplo de escala Ordinal Calificaciones de Estudiantes de Estadística en un Semestre Calificaciones Nº de calificaciones Excelente 3 Sobresaliente 6 Distinguido 10 Bueno 38 Satisfactorio 25 Deficiente 50 Muy Deficiente 0
  33. Se pueden clasificar los habitantes de una ciudad de acuerdo

    a su situación económica, a los estudiantes tomando en cuenta a su rendimiento académico, etcétera. Aunque la escala ordinal resulta en cierta forma más precisa que la nominal, no alcanza el grado de precisión deseado en una investigación. Otro ejemplo, sería el caso de cuatro estudiantes de tecnología administrativa del IUTJAA, que presentan una prueba Extraordinaria de estadística y obtienen las siguientes calificaciones: 19,16, 12 y 10. El estudiante que obtuvo 19 puntos se le denomina como Excelente, al que obtuvo 16 puntos como Distinguido, el que logró 12 tendrá una categoría de Bueno y al que obtuvo 10 puntos se le asigna la categoría de Satisfactorio. Es decir, los alumnos han sido clasificados de acuerdo con su rendimiento académico. El orden jerárquico de los militares (Subteniente, Teniente, Capitán, Mayor, Teniente Coronel, Coronel, General) y la clasificación académica de los profesores universitarios (Instructor, Asistente, Agregado, Asociado, Titular) son ejemplos de escala ordinal. En la escala ordinal las unidades de las subclases guardan una cierta relación entre sí, esto se pone de manifiesto cuando existe la posibilidad de establecer la relación menor que o mayor que, respecto a las características de las unidades escaladas. Por ejemplo, El grado militar de A es el de Subteniente y el de B es el de Teniente, luego el grado de B es mayor que el de A (B>A) Otro ejemplo de medición con la escala ordinal es el referido al de la escala de dureza de los minerales, es decir, la resistencia que oponen los minerales al ser rayados, los cuales van del uno al diez. El talco se asocia con el valor uno porque no raya a ninguno, el diamante se asocia con el valor diez porque no es raya por ningún otro, pero si puede rayar al resto de los minerales, etcétera. Escala de Medición de Intervalos: Es una escala más especializada que las dos anteriores, puesto que es posible ordenar las mediciones y expresar además en cuánto difiere una situación de la otra. Por Ejemplo, en las mediciones de temperatura ambiental no sólo se puede afirmar “hoy hace más calor que ayer”, si no que de la misma forma se puede expresar “hoy la temperatura es cuatro grados Centígrados más alta que la de ayer a la misma hora”. Esta escala se caracteriza por tener una unidad de medida y un origen (cero) arbitrario. La distancia entre dos mediciones tiene un significado preciso. La escala de intervalos a diferencia de la nominal y ordinal, es una escala efectivamente cuantitativamente. Una escala de intervalo es una escala ordenada en la cual la diferencia entre las mediciones es una cantidad significativa. La escala de intervalos posee además, de las características de la escala nominal y ordinal, la propiedad de que la distancia entre dos valores es de una magnitud conocida, lo que le permite a esta escala un mayor grado de perfección, ya que proporciona números que manifiestan diferencias palpables entre individuos, objetos o cosas. Por tal razón, la escala de intervalo revela que un individuo u objeto es tantas unidades más grandes o más pequeño, más pesado ó más ligero, más rápido o más lento que otro, es decir, muestra la cantidad en la que un objeto se diferencia de otro cuantitativamente. En esta escala el punto cero y la unidad de medición son arbitrarios. La razón entre dos intervalos es siempre independiente del punto cero y de la unidad que se emplee en la medición. En el caso de las escalas de intervalos las unidades de medición son iguales.
  34. Propiedades de la escala de Intervalo: 1. Esta escala implica

    la cuantificación de los datos 2. En estas medidas se utilizan unidades constantes de medición (capacidad, peso, Céntimos, grados fahrehért o centígrados) los cuales producen intervalos iguales entre puntos de la escala. 3. Proporcionan números que manifiestan diferencias palpables entre individuos, objetos o cosas. 4. En esta escala de intervalos el punto cero (0) y la unidad de medida es arbitrario. 5. Se pueden aplicar todas las medidas estadísticas más conocidas, con excepción del coeficiente de variación. 6. Son mutuamente exclusivas y exhaustivas. Ejemplos de las escalas de intervalo Calificación de una prueba de Estadísticas realizada en el I.U.T.J.A.A Puntuación Nº de Estudiantes 90-99 2 80-89 6 70-79 15 60-69 30 Menos de 60 60 Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir temperatura, bien sea en grados Centígrados o Fahrenheit. En estas escalas la diferencia entre 80º y 85º es igual a la que existe entre 90º y 95º o entre dos puntos cualesquiera de la escala. La escala de intervalo tiene carácter cuantitativo y esto le permite el cálculo de las medidas estadísticas más comunes (medias, desviaciones típicas o estándar, coeficientes de correlación de Pearson, entre otros), esto confirma él porque muchos valores estadísticos se utilizan con las escalas de intervalos. Escala de Medición de Razón o Proporción: Esta constituye el nivel más alto de medición, posee todas las características de las escalas nominales, ordinales y de intervalos; además tiene un cero absoluto o natural que tiene significado físico. Si en ella la medición es cero, significa ausencia o inexistencia total de la propiedad considerada. Son posibles todas las operaciones aritméticas. Los números indican los valores concretos de la propiedad que sé está midiendo; peso, estatura, ingresos monetarios y gastos directos, son ejemplos de medidas con una escala de razón. La distancia entre dos valores de la escala es conocida en el sentido cuantitativo y su razón es independiente de las unidades empleadas. Por ejemplo, en las unidades de longitud, peso y capacidad el valor cero indica ausencia de medida, mientras que en la escala de intervalo si se tiene cero grado centígrado no se puede afirmar que hay
  35. ausencia de temperatura. La escala de razón permite establecer ciertas

    comparaciones entre los valores que no son permitidos en la escala de intervalo. Por lo tanto, la proporción de un punto cualquiera de la escala a otro es independiente de la unidad de medida. Si una persona mide 2.00 m puede afirmarse que duplica en estatura a otro que mide 1.00 m Las escalas de razón más comunes corresponden a medidas de longitud, peso, capacidad, sonido, entre otros. Al medir la temperatura absoluta la escala de Kelvin, que es de este tipo, tiene su punto cero a 273º, este valor es él más bajo posible. Cuando se emplea este tipo de escala, los números indican razones o cocientes entre ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser sometidos a los tratamientos más elaborados. Propiedades de la escala a razón: 1. La distancia entre los números es un tamaño conocido y constante. 2. Los datos tienen un punto cero significativo. 3. Puede utilizarse cualquier prueba de tipo estadístico, incluyendo el coeficiente de variación. 4. Permite hacer comparaciones entre los números verdaderos con un cero aritmético siendo arbitrario únicamente la unidad de medida. Ejemplo de escala a razón Número de computadores vendidos en els último trimestres del año 2009 Meses Nº de computadores Octubre 8.000 Noviembre 12.000 Diciembre 17.000 Generalmente, se supone que los datos que se obtienen para una variable cuantitativa se miden en escalas de intervalo o de razón. Estas escalas constituyen los niveles más elevados de medición. Son formas más fuertes de medición que la escala nominal y ordinal, porque permiten comprender no sólo cuál de los valores de un estudio es mayor o menor, sino por cuántas unidades de medida. Las escalas de razón son medidas de Longitud, peso, capacidad, etc., los números reflejan razones entre particularidades y los datos obtenidos según tales escalas pueden ser sometidas a cualquier tratamiento estadístico INSTRUMENTOS DE MEDICIÓN DE LAS VARIABLES Son las herramientas que se manipulan para obtener información y para llevar a cabo las observaciones de una investigación o estudio determinado. Conforme a lo que se desea estudiar o investigar, la característica a observar, sus propiedades y factores relacionados con aspectos naturales, económicos, políticos, sociales, etc., cuando se selecciona uno de estos instrumentos. En otras palabras, estos son los que permiten efectuar observaciones, de uno u otro fenómeno, en una forma más despejada y precisa de la descripción de los hechos a estudiar.
  36. La encuesta, el cuestionario, la entrevista, la observación y las

    escalas de actitudes y opiniones, constituyen técnicas o herramientas que se utilizan para medir las variables, las mismas deben reunir dos características fundamentales: a) Validez: Esta característica se refiere a que la calificación o resultado obtenido mediante la aplicación del instrumento, mida lo que realmente se desea medir. La validez de contenido puede definirse como la propiedad que posee el instrumento para medir todos los factores de la variable que se están estudiando. Para determinar los parámetros de la validez de contenido de un instrumento, es necesario: Definir operativa y teóricamente las variables que se van a medir. Programar todas las formas en que esta variable se puede presentar para establecer los indicadores más adecuados, para ello es necesario haber realizado una amplia revisión bibliográfica y consultado a especialistas en la materia. Efectuar una prueba piloto que contribuya a mejorar la validez del instrumento. La validez de predicción está relacionada con la eficacia que alcanza la técnica para predecir el comportamiento de los fenómenos ante determinadas circunstancias. Se puede verificar comparando el resultado obtenido a través de la aplicación del instrumento, si predice el comportamiento del fenómeno en estudio, entonces, es conveniente compara el estándar o prueba piloto con los resultados obtenidos en las pruebas aplicadas a la muestra objeto del estudio, con los resultados obtenidos en el desempeño del trabajo. b) Confiabilidad: La confiabilidad está referida a la estabilidad, consistencia y exactitud de los resultados, es decir, que los resultados obtenidos por el instrumento serán confiables siempre y cuando sean similares a los resultados que se obtengan si se vuelven a aplicar el instrumento sobre la misma muestra en igualdad de condición. Dentro de la clasificación de los instrumentos de medición se pueden considerar básicamente los siguientes: la observación, la encuesta (que utiliza cuestionarios) y la entrevista. Para utilizar alguno de estos instrumentos de medición es indispensable que se cumplan con las siguientes condiciones, en la que, por lo general coinciden los tres: 1. Definir el objeto de la encuesta: Formulando con precisión los objetivos a conseguir, describiendo el problema a investigar, eliminando lo superfluo y centrando el contenido de la encuesta, y diseñando la muestra. Se incluye la forma de presentación de resultados así como los costos de la investigación. 2. La formulación del cuestionario que se utilizará o de los puntos a observar es fundamental en el desarrollo de una investigación, debiendo ser realizado meticulosamente y comprobado antes de pasarlo a la muestra representativa de la población.
  37. 3. El trabajo de campo, consistente en la obtención de

    los datos. Para ello será preciso seleccionar a los entrevistadores, formarlos y distribuirles el trabajo a realizar de forma homogénea. 4. Obtener los resultados, o sea, procesar, codificar y tabular los datos obtenidos para que luego sean presentados en el informe y que sirvan para posteriores análisis. LA OBSERVACIÓN Es la técnica de recolección de información por excelencia y se utiliza en todas las ramas de la ciencia. Su uso está regido por alguna teoría y éstas determinan los aspectos que se van a observar. Hay que tener presente que para que sea válido este instrumento de observación, se deben cumplir las siguientes sugerencias: 1. Con respecto a las condiciones previas a la observación: o El observador debe estar familiarizado con el medio. o Se deben realizar ensayos de la observación, previos a la observación definitiva. o El observador debe memorizar lo que se va a observar. 2. Con respecto al procedimiento en la observación: o Las notas deben ser registradas con prontitud (en minutos). o Las notas deben incluir las acciones realizadas por el observador. 3. Con respecto al contenido de las notas: o Las notas deben contener todos los datos que permitan identificar el día, el lugar y la hora de la observación, así como las circunstancias, los actores, etcétera, que estuvieron involucrados. o Se deben eliminar apreciaciones subjetivas sobre el carácter o personalidad de los sujetos. En su lugar se debe incluir la descripción de los hechos. o Las conversaciones van transcritas en estilo directo. o Las opiniones y deducciones del observador se deben hacer aparte, de preferencia al margen para así no perder la relación entre la opinión del observador y la parte de las notas a que le corresponde. 4. Con respecto a la ordenación de las notas: o Las notas deben ser revisadas y corregidas a la brevedad posible. o Asimismo, las notas deben ser clasificadas y ordenadas para permitir su manejo más ágil, además de evitar que se pierdan, se confundan con otras partes de la observación, se traspapelen, etcétera. LA ENCUESTA Esta es un de las herramientas más utilizada en la investigación de ciencias sociales. Para su implementación, la encuesta utiliza los cuestionarios como medio principal para obtener información. De esta manera, las encuestas pueden realizarse para que el individuo encuestado procese por sí mismo las respuestas en el papel. Es trascendente que el investigador en los cuestionarios sólo solicite la información indispensable, la mínima para que sean comprendidas las preguntas. Más información, o información innecesaria, puede derivar en respuestas no veraces.
  38. De lo misma forma, al diseñar la encuesta y confeccionar

    el cuestionario hay que tomar en cuenta los recursos (tanto humanos como materiales) de los que se disponen, tanto para la recopilación como para la lectura de la información, para así lograr un diseño funcionalmente eficaz. Según M. García Ferrando, "prácticamente todo fenómeno social puede ser estudiado a través de las encuestas", y podemos considerar las siguientes cuatro razones para sustentar éstos: 1. Las encuestas son una de las escasas técnicas de que se dispone para el estudio de las actitudes, valores, creencias y motivos. 2. Las técnicas de encuesta se adaptan a todo tipo de información y a cualquier población. 3. Las encuestas permiten recuperar información sobre sucesos acontecidos a los entrevistados. 4. Las encuestas permiten estandarizar los datos para un análisis posterior, obteniendo gran cantidad de datos a un precio bajo y en un período de tiempo corto. Según Cadoche y sus colaboradores, las encuestas se pueden clasificar atendiendo al ámbito que abarcan, a la forma de obtener los datos y al contenido, así: Encuestas exhaustivas y parciales: Se denomina exhaustiva cuando abarca a todas las unidades estadísticas que componen el colectivo, universo, población o conjunto estudiado. Cuando una encuesta no es exhaustiva, se denomina parcial. Encuestas directas e indirectas: Una encuesta es directa cuando la unidad estadística se observa a través de la investigación propuesta registrándose en el cuestionario. Será indirecta cuando los datos obtenidos no corresponden al objetivo principal de la encuesta pretendiendo averiguar algo distinto o bien son deducidos de los resultados de anteriores investigaciones estadísticas. Encuestas sobre hechos y encuestas de opinión: Las encuestas de opinión tienen por objetivo averiguar lo que el público en general piensa acerca de una determinada materia o lo que considera debe hacerse en una circunstancia concreta. Se realizan con un procedimiento de muestreo y son aplicadas a una parte de la población ya que una de sus ventajas es la enorme rapidez con que se obtienen sus resultados. No obstante, las encuestas de opinión no indican necesariamente lo que el público piensa del tema, sino lo que pensaría si le plantease una pregunta a ese respecto, ya que hay personas que no tienen una opinión formada sobre lo que se les pregunta y contestan con lo que dicen los periódicos y las revistas. A veces las personas encuestadas tienen más de una respuesta a una misma pregunta dependiendo del marco en que se le haga la encuesta y por consecuencia las respuestas que se dan no tienen por qué ser sinceras. Las encuestas sobre hechos se realizan sobre acontecimientos ya ocurridos, hechos materiales. EL CUESTIONARIO El cuestionario es un formato redactado en forma de interrogatorio con el mismo se obtiene información relacionada con las variables objeto de la investigación. Pueden ser aplicados personalmente o por correo y en forma individual o colectiva. Esta formado por un conjunto de preguntas elaboradas cuidadosamente sobre los hechos y aspectos que se desean conocer sobre una población o parte de ella; este instrumento es
  39. respondido por el participante sin la intervención directa del entrevistador.

    En el cuestionario simple el encuestado contesta, previa lectura del escrito, sin intervención directa de ninguna de las personas que participa en la investigación. En la entrevista, el cuestionario es aplicado a los sujetos investigados, por personas especializadas en esa tarea. Estas hacen a los encuestados las preguntas del cuestionario y anotan en el las respuestas. Las escalas son una forma especial de cuestionario; se caracteriza porque las preguntas y sus diferentes respuestas tienen atribuido un valor numérico, lo que permite cifrar cuantitativamente y en cierta forma medir el nivel que alcanza en cada caso la actitud o aspecto investigado. El diseño del cuestionario habrá de fundamentarse en el marco teórico, la hipótesis, sus variables y los objetivos de la investigación. Cada pregunta que se incluya deberá estar relacionada con las variables indicadoras. Es muy conveniente que cuando se elabore el cuestionario se tenga a la mano la operatividad de las variables, para asegurarse de que todos los indicadores están siendo investigados. Los cuestionarios pueden ser: Cuestionario individual: Es el que el encuestado contesta de forma individual por escrito y sin que intervenga para nada el encuestador. Cuestionario-lista: Es aquel que es preguntado al encuestado en una entrevista por uno de los especialistas de la investigación. Como los cuestionarios están formados por preguntas, se considera que una de las características básicas que estos deben reunir es la ser excluyentes y exhaustivas, lo que permitirá que una pregunta no produzca dos respuestas simultáneamente, por lo tanto, a cada pregunta solamente le corresponderá una y sólo una respuesta. Por otro lado, una manera de clasificar las preguntas, es por la forma de su respuesta, así: Preguntas cerradas: que consiste en proporcionar al sujeto observado una serie de opciones para que escoja una como respuesta. Tienen la ventaja de que pueden ser procesadas más fácilmente y su codificación se facilita; pero también tienen la desventaja de que si están mal diseñadas las opciones, el sujeto encuestado no encontrará la opción que él desearía y la información se viciaría. Una forma de evitarlo es realizar primero un estudio piloto y así obtener las posibles opciones para las respuestas de una manera más confiable. También se consideran cerradas las preguntas que contienen una lista de preferencias u ordenación de opciones, que consiste en proporcionar una lista de opciones al encuestado y éste las ordenará de acuerdo a su interés, gustos, etcétera. Preguntas abiertas: que consisten en dejar totalmente libre al sujeto observado para expresarse, según convenga. Tiene la ventaja de proporcionar una mayor riqueza en las respuestas; mas, por lo mismo, puede llegar a complicar el proceso de tratamiento y
  40. codificación de la información. Una posible manera de manipular las

    preguntas abiertas es llevando a cabo un proceso de categorización, el cual consiste en estudiar el total de respuestas abiertas obtenidas y clasificarlas en categorías de tal forma que respuestas semejantes entre sí queden en la misma categoría. Es importante señalar que es el objetivo de la investigación la que determina el tipo de preguntas a utilizar. Según Cadoche y sus colaboradores, las preguntas pueden ser clasificadas de acuerdo a su contenido: Preguntas de identificación: edad, sexo, profesión, nacionalidad, etcétera. Preguntas de hecho: referidas a acontecimientos concretos. Por ejemplo: ¿terminó la educación básica? Preguntas de acción: referidas a actividades de los encuestados. Por ejemplo: ¿ha tomado algún curso de capacitación? Preguntas de información: para conocer los conocimientos del encuestado. Por ejemplo: ¿sabe qué es un hipertexto? Preguntas de intención: para conocer la intención del encuestado. Por ejemplo: ¿utilizará algún programa de computación para su próxima clase? Preguntas de opinión: para conocer la opinión del encuestado. Por ejemplo: ¿qué carrera cursarás después del bachillerato? Existe otra clasificación de los cuestionarios que toma en la función que las preguntas desarrollaran dentro del cuestionario. De esta manera tenemos: Preguntas filtro: son aquéllas que se realizan previamente a otras para eliminar a los que no les afecte. Por ejemplo: ¿Tiene usted coche? ¿Piensa comprarse uno? Preguntas trampa o de control: son las que su utilizan para descubrir la intención con que se responde. Para ello se incluyen preguntas en diversos puntos del cuestionario que parecen independientes entre sí, pero en realidad buscan determinar la intencionalidad del encuestado al forzarlo a que las conteste coherentemente (ambas y por separado) en el caso de que sea honesto, pues de lo contrario «caería» en contradicciones. Preguntas de introducción o rompehielos: utilizadas para comenzar el cuestionario o para enlazar un tema con otro. Preguntas muelle, colchón o amortiguadoras: son preguntas sobre temas peligrosos o inconvenientes, formuladas suavemente. Preguntas en batería: conjunto de preguntas encadenadas unas con otras complementándose. Preguntas embudo: se empieza por cuestiones generales hasta llegar a los puntos más esenciales.
  41. Para la elaboración de un cuestionario eficaz y útil, Cadoche

    y su equipo proponen 17 reglas fundamentales para su confección: 1. Las preguntas han de ser pocas (no más de 30). 2. Las preguntas preferentemente cerradas y numéricas. 3. Redactar las preguntas con lenguaje sencillo. 4. Formular las preguntas de forma concreta y precisa. 5. Evitar utilizar palabras abstractas y ambiguas. 6. Formular las preguntas de forma neutral. 7. En las preguntas abiertas no dar ninguna opción alternativa. 8. No hacer preguntas que obliguen a esfuerzos de memoria. 9. No hacer preguntas que obliguen a consultar archivos. 10. No hacer preguntas que obliguen a cálculos numéricos complicados. 11. No hacer preguntas indiscretas. 12. Redactar las preguntas de forma personal y directa.} 13. Redactar las preguntas para que se contesten de forma directa e inequívoca. 14. Que no levanten prejuicios en los encuestados. 15. Redactar las preguntas limitadas a una sola idea o referencia. 16. Evitar preguntas condicionantes que conlleven una carga emocional grande. 17. Evitar estimular una respuesta condicionada. Es el caso de preguntas que presentan varias respuestas alternativas y una de ellas va unida a un objetivo tan altruista que difícilmente puede uno negarse. Asimismo, hay que considerar que no todas las preguntas, o todas las formulaciones, son posibles de utilizar, algunas de las preguntas que no deben hacerse son: Preguntas de intelectuales: Por ejemplo: ¿Qué aspectos particulares del actual debate positivista-interpretativo le gustaría ver reflejados en un curso de psicología del desarrollo dirigido a una audiencia de maestros? Preguntas complejas: Por ejemplo: ¿Cuando prepara sus clase prefiere consultar un libro determinado incorporando la terminología que este propone o escoge varios libros de los que extrae un poco de cada uno pero que explica con sus propias palabras para hacerlos más accesibles a sus alumnos y no confundirlos? Preguntas o instrucciones irritantes: Por ejemplo: ¿Ha asistido alguna vez en tiempo de servicio a un curso de cualquier clase durante su carrera entera de maestro?. Si tiene mas de 40 años y nunca ha asistido a un curso, ponga una marca en la casilla rotulada NUNCA y otra en la casilla rotulada VIEJO. Preguntas que emplean negaciones: Por ejemplo: ¿Cuál es su sincera opinión sobre que ningún maestro debería dejar de realizar cursos de perfeccionamiento durante su ejercicio profesional? Preguntas demasiado abiertas: Por ejemplo: Use las pág. 5, 6 y 7 respectivamente para responder a cada una de las cuestiones a cerca de sus actitudes respecto a los cursos de perfeccionamiento en general y a sus opiniones acerca de su valor en la vida profesional del maestro.
  42. Tomando en cuenta lo antes mencionados se puede comprender la

    importancia del planteamiento y la elaboración del cuestionario, ya que de la forma en que se elabore este instrumento y se redacten las formulaciones, dependerán los resultados de la investigación que se desea realizar. Una encuesta no puede obtener buenos resultados con un cuestionario mal elaborado, puesto que si el cuestionario es oscuro, ambiguo o impreciso, los resultados obtenidos también lo serán y no se podrá confiar en los resultados que se obtengan para emprender la investigación. Castañeda Jiménez sugiere que se tomen en cuenta las siguientes previsiones en la elaboración de un cuestionario: 1. En la elaboración o construcción del instrumento: o Hay que determinar los reactivos de acuerdo a lo que se necesita observar. o Hay que determinar el orden de los reactivos de acuerdo a los aspectos que se mencionan más adelante. o Se debe tener cuidado en la formulación de los reactivos. Una formulación incorrecta o diferente puede dar lugar a interpretaciones diferentes por parte del entrevistado a las que el observador desea. 2. Respecto al orden de los reactivos: o Es conveniente situar los reactivos que sean más difíciles de ser contestado honestamente al final, de esta manera no se desanimará de antemano el entrevistado. o Otra opción es repetir dos o tres reactivos que posean la misma información pero con diferente redacción. Estos reactivos de control permitirán detectar cuándo el entrevistado está contestando honestamente. 3. Respecto a la redacción de los reactivos: o La redacción, y el vocabulario, debe estar acorde a la persona observada, tomando en cuenta su edad, nivel cultural, nivel escolar, nivel socio-económico, etcétera. o Cada reactivo debe contener una y sólo una pregunta. o En la redacción de la pregunta no debe estar sugerida alguna de las respuestas. o Tampoco conviene apoyarse o mencionar opiniones o sugerencias ya existentes, como son posiciones de instituciones, de personas, etcétera. o Asimismo, Cadoche y sus colegas proponen una guía para preparar un cuestionario: Decisiones sobre el contenido de las preguntas: • 1. ¿Es necesaria la pregunta? ¿Será útil? 2. ¿Se necesitan varias preguntas sobre esta cuestión? 3. ¿Cuentan los informantes con los datos necesarios para contestar la pregunta? 4. ¿Necesita la pregunta ser más concreta, específica e íntimamente ligada con la experiencia personal del informante? 5. ¿Es el contenido de la pregunta lo suficientemente general y está libre de concreciones y especificidades falsas? 6. ¿Expresan las preguntas actitudes generales y son tan específicas como suenan? 7. ¿Está el contenido de la pregunta polarizado o cargado en una dirección sin preguntas acompañantes que equilibren el énfasis?
  43. 8. ¿Darán los informantes la información que se les pide?

    9. Decisiones sobre la redacción de las preguntas: • 1. ¿Se puede malinterpretar la pregunta?¿Contiene fraseología difícil o poco clara? 2. ¿Expresa la pregunta adecuadamente la alternativa con respecto al punto?} 3. ¿Es engañosa la pregunta por culpa de asunciones no establecidas o de implicaciones que no se ven? 4. ¿Está polarizada la redacción?¿Está cargada emocionalmente o inclinada hacia un tipo particular de contestación? 5. ¿Puede ser objetable por el informante la redacción de la pregunta? 6. ¿Produciría mejores resultados una redacción mas personalizada de la pregunta? 7. ¿Puede preguntarse mejor la cuestión, de manera más directa o más indirecta? Decisiones sobre la forma de respuesta de la pregunta: 8. ¿Puede contestarse mejor la pregunta con un impreso que exija la contestación por una marca (o contestación corta de una o dos palabras, o un número), de respuesta libre o por una marca con contestación ampliatoria? 9. Si se usa la contestación por una marca, ¿cuál es el mejor tipo de cuestión: dicotómica, de elección múltiple, o de escala? 10. Si se usa una lista de comprobación, ¿cubre adecuadamente todas las alternativas significativas sin solaparse y en un orden definible? ¿Es de una longitud razonable? ¿Es la redacción de los ítems imparcial y equilibrada? 11. ¿Es fácil, definida, uniforme y adecuada para la finalidad, la forma de respuesta? Decisiones sobre la ubicación de la pregunta en la secuencia: 12. ¿Puede verse influida por el contenido de las cuestiones precedentes la contestación a la pregunta? 13. ¿Está dirigida la pregunta en una forma natural? ¿Está en correcto orden psicológico? ¿Aparece la pregunta demasiado pronto o demasiado tarde desde el punto de vista de despertar interés y recibir la atención suficiente? LA ENTREVISTA La entrevista es muy utilizada en investigación social, y sus características son similares a las del cuestionario, siendo la principal diferencia el hecho de que es el encuestador u observador quien anota las respuestas a las preguntas. La utilización de este instrumento requiere de una mayor habilidad por parte del encuestador u observador para llevar el tema de la entrevista, debido a que las respuestas son por lo general abiertas y admiten implementar nuevas preguntas no vislumbradas por el encuestador inicialmente. Esto facilita la ventaja de explotar temas no contemplados inicialmente o ahondar en algunos de los contemplados. No obstante, tiene la desventaja de que, si no se tiene la suficiente habilidad para mantener el tema, la entrevista se "pierde" e, incluso, puede invalidarse; por lo tanto, el entrevistador debe poseer aptitudes específicas para utilizar el arte de la entrevista
  44. Las recomendaciones y características sugeridas, son las mismas que se

    utilizan para el caso del cuestionario, sin embargo, se debe utilizar una grabadora (de audio o de vídeo) para la posterior copia de los diálogos. Los tipos fundamentales son: -La entrevista cerrada: Es aquel tipo en la que las alternativas de contestación a que debe someterse el encuestado están predeterminadas. -La entrevista con profundidad: Es aquella que se hace conscientes los contenidos mentales transformándolos en profundos. -La entrevista semiestruturada: Es aquella en la que, si bien hay una guía para las preguntas, las respuestas son libres, y su ventaja radica en que permiten obtener información complementaria. La entrevista es una de las técnicas más utilizada en la investigación. Mediante ésta, una persona, el entrevistador solicita información a otra, el entrevistado. La entrevista puede ser uno de los instrumentos más valiosos para obtener información y aunque aparentemente no necesita estar muy preparada, es posible definirla como el arte de escuchar y captar información, esta habilidad requiere de capacitación, ya que no toda persona puede ser un buen entrevistador. Además, es una manera de interactuar socialmente puesto que es a través del diálogo como el investigador obtiene los datos que requiere para su estudio. ESCALA DE ACTITUDES Y OPINIÓN La escala de actitudes y opinión, son instrumentos que se utilizan para medir la intensidad de las actitudes y opiniones de una población hacia un fenómeno determinado. Se llaman escalas porque se forman de un continuo de valores que tienen diversos puntos intermedios. Una actitud se define como el grado de afecto positivo o negativo asociado a un objeto psicológico. Existen infinidad de escalas de actitud y de opinión ya estandarizadas o que el mismo investigador puede diseñar. Entre estas escalas las más utilizadas son: la escala de Thurstone, la de likert, la de Guttamam, las escalas de ordenación, entre otros. CENSO: Es la medición o análisis de cada componente de la población. En algunos casos es necesario inspeccionar a cada persona o elemento de la población que deseamos descubrir, a esto lo llamamos enumeración completa o censo. Este sirve para evaluar el estado de la población de un país en un momento dado, generalmente cada diez años. Es un registro donde se concentra toda la información referente a la población o riqueza de una nación o localidad, es un estudio exhaustivo ya que se realiza en toda la población y los resultados son ratificados en un lapso de tiempo largo. El Censo constituye una lista o padrón de la población o riqueza de un país, con fines estadísticos. Sirve para evaluar el Estado de la población de un país en un momento dado. Aunque en la antigüedad tenía una finalidad estrictamente impositiva, hoy en día constituye el punto de partida para la elaboración de las políticas demográficas y sociales. El documento básico del censo es un cuestionario en el que figuran datos como el lugar de residencia, la edad, el sexo, el estado civil, la lengua materna, el nivel de
  45. estudio y la profesión. A partir de este cuestionario, el

    censo indica el tamaño de la población, su distribución en el territorio y su estructura o composición. Entre las variables que pueden extraerse de los datos censales cabe mencionar la densidad de la población, relación entre el número de habitantes y la superficie; la distribución por edad y sexo, que permite elaborar las denominadas pirámides de edad, representación gráfica del grado de juventud o envejecimiento de la población, y la estructura socioeconómica de la población considerada, población activa y reparto de la primera en los diferentes sectores productivos. TIPOS DE CENSO EN VENEZUELA Censo Electoral: Es un registro que contiene la inscripción de todas aquellas personas que reúnen los requisitos para ser electores. Su elaboración y mantenimiento corresponde a la Oficina del Censo Electoral (OCE). El censo electoral se compone de: censo de venezolanos residentes en Venezuela, censo de venezolanos residentes en el extranjero y censo de extranjeros residentes en Venezuela con derecho a voto en las elecciones. Censo de Población: Es el conjunto de operaciones de recopilación, resumen, valoración, análisis y publicación de los datos de carácter demográfico, cultural, económico y social de todos los habitantes del país (residentes tanto en viviendas como en establecimientos colectivos) y de sus divisiones político-administrativas, referidos a un momento o periodo determinado. A lo largo de nuestra historia, se han realizado un total de quince Censos de Población con periodicidad decenal, en los años acabados en cero de 1.900 a 1.970 y acabados en uno a partir del año 1.981, siendo el último Censo de Población el realizado con fecha de referencia uno de Marzo de 1.991. Censo de Viviendas: Es el conjunto de operaciones consiste en la recopilación, resumen, valoración, análisis y publicación de los datos relativos a viviendas. Clasificando éstas en viviendas familiares, alojamientos y establecimientos colectivos. DATOS ESTADÍSTICOS Dato estadístico.- Es un conjunto de valores numéricos que tienen relación significativa entre sí. Los mismos pueden ser comparados, analizados e interpretados en una investigación cualquiera. Se puede afirmar que son las expresiones numéricas obtenidas como consecuencia de observar un individuo de la población; por lo tanto, son las características que se han tomado en cuenta de cualquiera población para una investigación determinada. La información cuantitativa o numérica puede encontrarse casi donde quiera: en negocios, economía y muchas otras áreas. Por ejemplo el precio marcado en un sombrero en mostrado en un cierto número de bolívares, la situación de empleo en una nación es expresadas en un número de personas, la inscripción en una universidad es registrada mediante un número de estudiantes, la distancia recorrida por un agente de ventas es reportada en número de kilómetros, y la edad de una persona es representada por el número de años. Sin embargo, no toda la información cuantitativa es considerada como dato estadístico. La información cuantitativa apropiada para análisis estadístico debe ser un conjunto (conjuntos) de números que muestren relaciones significativas entre si. En otras palabras, los datos estadísticos son números que pueden ser
  46. comparados, analizados en interpretado. Un número aislado que no se

    compara o que no nuestra relación significativa con otro número no es un dato estadístico. En el ejemplo de arriba la edad de Luis a solas no constituye dato estadístico si no hay otro disponible para comparación. Sin embargo, las edades de mil estudiantes son datos estadísticos, puesto que las edades pueden ser comparadas y analizada, y los resultados del análisis pueden ser interpretados. También, las llamadas estadísticas de un paciente tal como son medidas por un doctor no son datos estadísticos, puesto que cada medida, tal como la estatura no muestra relación significativa con otras medidas, tal como el número de pulsaciones por minuto o la medida de la vista del paciente. Sin embargo, la información relativa a la estatura de los pacientes dentro de un centro hospitalario en un cierto periodo de tiempo si son datos establecido, puesto que las estaturas pueden ser comparada, analizadas interpretadas de acuerdo con sus relaciones. El área de la cual los datos estadísticos son recopilados es generalmente referida como la población o universo. Una población puede ser finita o infinita. Una población finita tiene un número limitado de individuo u objetos, mientras que una población infinita tiene un número ilimitado. Por ejemplo una clase de estadística de cuarenta estudiantes es una población finita. El número de estudiantes universitarios de América del Sur durante el año 99 es ilimitado; por lo tanto, tales estudiantes forman una población infinita. La tarea de recopilar un conjunto completo de datos de una población finito pequeña es relativamente simple. Si deseamos obtener la edad de 25 estudiantes en una clase de estadística, se puede simplemente pregunta a cada estudiante la edad. Así tendríamos un conjunto completo de datos. Sin embargo, recopilar tales datos de una población finita pero grande, es algunas veces imposible o impractico. Recopilar un conjunto completo de la concerniente a la edad de todos los estudiantes de la escuela primaria de Venezuela en 1999, por ejemplo, puede ser impractico, aunque es posible, no se debería realizar debido al tiempo y los costos consumidos. La recopilación de datos completos de una población infinita es infinitamente imposible. Al fin de evitar la tarea imposible o impráctica de recolectar la totalidad de los datos de poblaciones infinitas, usualmente se extrae una muestra de elementos representativo de la población. La muestra, es entonces, utiliza para el estudio estadístico y los resultados de la muestra son usados como las bases para describir, estimar o predecir las características de la población. Supongamos quinientos estudiantes son representativos de los educandos de el tecnológico de El Tigre y que los mismos son seleccionados del total de cinco mil estudiantes que posee esa institución en 1999 (población). El conjunto de datos recopilados concerniente a las edades de los quinientos estudiantes es una muestra, luego, un investigador puede usar estos resultados para estimar o predecir las edades de todos los estudiantes del tecnológico de El Tigre en el 2002.. CUADRO O TABLAS ESTADÍSTICAS Cuadros estadísticos.- Son esquemas organizados en los que se registran los datos estadísticos en forma organizada con la frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar la información recopilada de una investigación o estudio determinado. Por lo tanto, los cuadros estadísticos es una ordenación de datos numéricos en filas y columnas con las especificaciones correspondientes acerca de la naturaleza de los datos. Constituye una forma útil de
  47. presentar los datos estadísticos obtenidos en una investigación a través

    de cuadros, tablas y gráficos. Esta puede presentar la información para referencias generales o para un uso específico o particular. La ordenación de datos en cuadros estadísticos, denominada forma tabular o tabulación, están constituidos por datos cuantitativos y éstos a su vez están en filas y columnas de acuerdo con las especificaciones de los datos. La tabulación es una presentación sistemática de los datos estadísticos de una investigación determinada, estos se presentan en forma resumida a través de las tablas o cuadros estadísticos. TIPOS DE CUADROS ESTADÍSTICOS CUADROS ESTADÍSTICOS GENERALES O DE REFERENCIA Son aquellos que proporcionan información en forma bastante detallada y de fácil referencia, se utilizan como referencia de uso general. No se elaboran para una exposición específica. Los cuadros presentados por las organizaciones gubernamentales casi siempre son de este tipo. Son construidos de una forma breve y simple. Están referidos a observaciones independientes entre sí. CUADROS ESTADÍSTICOS ANALÍTICOS O DE RESUMEN Las tablas o cuadros analíticos o de fines especiales, son aquellos que proporcionan un resumen o un análisis de los datos, en otras palabras; tiene por objeto el de exponer los resúmenes finales de una serie de cuadros de investigación, o los datos de éstos que más interesan. Estos se refieren a observaciones dependientes entre sí. PARTES QUE INTEGRAN UN CUADRO ESTADÍSTICO Los cuadros estadísticos están compuestos por las siguientes partes: 1. Título. 2. Encabezamiento. 3. Columna Matriz. o Concepto 4. Cuerpo. 5. Notas de Encabezado 6. Nota de Pie 7. Fuente de Datos 1) Título: Es una descripción del contenido de la tabla. Debe ser compacta y completa. Este comprende las siguientes partes: A) Numeración del Cuadro: cuando los cuadros forman parte de un texto o de un grupo deben ser numerados en la parte superior central de la hoja. B) Titulo Propiamente Dicho: se debe seguir los siguientes puntos: 1) Se debe ubicar centrado en la parte superior del cuadro sin subrayar, y usando letras mayúsculas para todo el enunciado.
  48. 2) Se debe redactarse con precisión y que exprese brevemente

    los datos que se presentan en el cuadro. 3) En general el orden del enunciado será así: a) Referencia Geográfica. b) Naturaleza de los Datos. c) Referencia Cronológica. d) Detalle de las clasificaciones o unidades. Estas deberán colocarse entre paréntesis y utilizando mayúsculas únicamente al iniciar la palabra. Ejemplo: Un título completo indica: ¿Qué son los datos incluidos en el cuerpo de la tabla? ¿Dónde está el área representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo ocurrieron los datos? Encabezado: Es el título de la parte de una columna o columnas. Las tablas más simples pueden consistir solamente de dos columnas y dos encabezados: Una para los conceptos y otra para los datos. Debe disponerse en la parte superior del cuadro y las designaciones que comprenden deberán escribirse en lo posible horizontalmente, debiendo ser preciso y breves, así mismos se dispondrá en un orden lógico de izquierda a derecha. Otra observación para la elaboración del encabezamiento, es que tanto él como las diversas columnas deben separarse con rayas, cerrando el cuadrado por la parte superior e inferior con una raya gruesa o una doble raya, en la actualidad existe la preferencia de no rayar verticalmente el encabezamiento. Concepto o Columnas Matriz: La descripción en hilera de la tabla son llamados conceptos; y estos son colocados al lado izquierdo de la tabla. La naturaleza de las clasificaciones es indicada por los encabezados de las columnas, incluyendo la columna matriz Es bueno Recordar que los datos estadísticos pueden referirse a clasificaciones cualitativas, cuantitativas, cronológicas o geográficas; recordar esto es importante puesto que la naturaleza de los datos tomando en cuenta esta clasificación determinará en parte el arreglo en que se lleven éstos a la columna matriz. Existen variadas formas de arreglo de los datos en la columna matriz. Es permisible disponerlos en orden alfabético, método que se usa habitualmente cuando los datos se clasifican geográfica o cualitativamente. Pueden ordenarse también según clases fijadas por la costumbre: casado, soltero, divorciado, viudo. Es factible observar que si las diferentes nominaciones son ordenadas alfabéticamente, se hace muy sencillo localizarlas. Cuando se trata de clasificaciones cuantitativas, el arreglo puede hacerse en orden ascendente o descendente. Cuando se refiere a clasificaciones cronológicas, se ordenan los años en sentido ascendente: 1995, 1996, 1997, 1998, y cuando se trate de meses se comienza por el mes de Enero. Cuerpo del cuadro: El cuerpo del cuadro es la parte que contiene los datos estadísticos presentados en éste. Cada dato individual ocupa en el cuadro un lugar que corresponde a
  49. la intersección de una fila y una columna dada; por

    tanto, el significado de los datos en un lugar está indicado por las especificaciones o partidas combinadas de la columna y la fila que se interceptan. Cuando el valor de uno de los lugares del cuerpo del cuadro sea cero es conveniente marcar ese lugar con un guión, si no existe el dato, si es estimado, o si la cifra indica alguna consideración distinta a la del resto de los otros, debe indicarse con una llamada y su respectiva aclaratoria al pie del cuadro. La representación efectiva de los datos en la tabla depende de los arreglos de las columnas en hileras. Nota de Encabezado: Son usualmente escritas justamente arriba de los encabezados y debajo de los títulos. Son usados para explicar ciertos puntos relacionados con la tabla completa que no han sido incluidos en el título ni en los encabezados ni en los conceptos. Nota de Pie: Las notas de pie son usualmente colocadas debajo de los conceptos. Son usados para clarificar algunas partes incluidas en la tabla que no son explicadas en otras partes, tal como las notas de pie en la tabla. Las notas al pie de los cuadros se utilizan para hacer aclaratorias sobre uno o varios elementos en particular. La nota sobre la fuente de los datos debe indicar el origen de la información presentada en el cuadro. Fuentes: Las fuentes de datos o simplemente fuentes, es usualmente escrita debajo de las notas de pie. Si los datos fueron recopilados y presentados por la misma persona, es costumbre no establecer la fuente en la tabla. El objeto de la indicación de las fuentes de los datos es el de proporcionar el debido reconocimiento a la persona u organismo que recopiló y /o publicó los datos, además de indicar, a quienes deseen ampliar la información, el origen de la misma Otras consideraciones sobre la Construcción de Cuadros En cuanto a los totales, cuando se les quiera recalcar, por tener gran relevancia, se colocarán en la parte superior de la columna matriz y a la izquierda del encabezamiento, aunque algunos autores lo suelen poner en la parte inferior de la columna matriz y a la derecha del encabezamiento. Los cuadros estadísticos que llamamos de resumen o analíticos, deben construirse de tal forma que se destaquen las comparaciones importantes, Esto puede lograrse colocando las cifras que se van a comparar en columnas o filas contiguas. Uso de porcentajes: En los cuadros estadísticos, normalmente se utilizan porcentajes. Existen cuadros que sólo poseen datos en forma de porcentajes, mientras que otros vienen expresados tanto en valores absolutos como en porcentajes. La finalidad del uso de los porcentajes en los cuadros es facilitar la comparación, de tal manera que las relaciones que puedan existir se perciban. Cuando se usan estos es necesario recalcar las bases sobre las cuales se han establecido dichos porcentajes; esto tiene como propósito indicar al lector cual es la base que sé esta utilizando para determinar el mismo. PROPIEDADES DE LOS CUADROS ESTADÍSTICOS * Deben simplificar la presentación de las tablas. * Tratar un solo tema en ese.
  50. * Elaborar un arreglo apropiado de clasificación. * El tamaño

    del cuadro debe crearse de tal manera que no sea ni muy largo y angosto, ni muy ancho o corto. * Cada signo de presentación que se va a utilizar debe estar plenamente identificado. * Las notas que se encuentran al pie de los cuadros deben incluir las descripciones en forma precisa. Tabulación.- Es una presentación sistemática de los datos estadísticos de una investigación determinada, estos se presentan en forma resumida a través de las tablas o cuadros estadísticos. Cuadros estadísticos.- Son esquemas organizados en los que se registran los datos estadísticos en forma organizada con la frecuencia de cada uno de estos, los mismos se observan en columnas y filas con la finalidad de presentar la información recopilada de una investigación o estudio determinado. Sean los siguientes datos el tiempo de servicio de un grupo de trabajadores de la empresa RENINCA: 4 2 4 5 3 3 5 3 2 2 2 5 2 4 6 6 2 3 3 6 3 5 3 4 6 3 4 2 4 6 Estos datos se tabularan y se presentaran en un cuadro estadístico de la siguiente manera: Cuadro correspondientes a los años de servicios de los obreros de la empresa RENICA Años de servicios N° de obreros (Variable) fi 2 7 3 8 4 6 5 4 6 5 TOTAL 30 Gráficas o Diagramas.- Son expresiones en forma de figura, de información originada de un conjunto de datos estadísticos, que explican un fenómeno determinado. Son descripciones de operaciones y demostraciones que se representan por medio de figuras o signos, los mismos se realizan con los valores de los cuadros estadísticos. En otras palabras, es una representación de la relación entre variables, que se realiza en un plano determinado.
  51. Gráficos estadísticos más importantes El fin que persigue todo gráfico

    es el de dar una idea rápida de la situación que en ese momento se está investigando. Por tal motivo, la presentación de los datos por medio de gráficos debe ser de una forma simple y de una compresión fácil. Es preferible construir un conjunto de gráficos en donde cada uno de ellos presente un aspecto sencillo de una situación determinada, que presentar un solo gráfico en el cual se observen demasiadas relaciones que se haga difícil estudiar de una forma efectiva. Por lo tanto, no debe sobrecargarse un gráfico para tratar de mostrar demasiadas categorías, ya que, la simplicidad es una de la característica básica de estos. Existe una gran variedad de tipos de gráficos entre los que se pueden mencionar los pictogramas, cartogramas, de cuadrados, de triángulos y círculos proporcionales, de sectores circulares, de barras, lineales, estereogramas, polares, etc., pero los más utilizados y de interpretación sencilla son los: Los gráficos de barras, los de sectores circulares y los lineales. En este curso solo se estudiaran las siguientes gráficas: 1.- Diagrama de Líneas. 2.- Diagrama de Barras. 3.- Diagrama Circular o de Pastel. 4.- Histograma. 5.- Polígono de Frecuencia. 6.- Polígono Acumulativo (OJIVA). Los diagramas de líneas, el histogramas, el polígono de frecuencia y la ojiva son gráficos cartesianos porque para su construcción requieren del plano cartesiano, a estos se le denominan en términos generales gráficos de líneas. El diagrama de barras y el de pastel se les denomina gráficos de sectores, puesto que, no requieren del plano cartesiano para su construcción. Diagrama de Línea El diagrama de línea es una gráfica que se representa en el plano cartesiano, con los datos de un fenómeno determinado para el cual se ha elaborado un cuadro estadístico. En términos generales se puede decir que so aquellas líneas que se dibujan en los ejes cartesianos, siguiendo algunos criterios. Criterios para elaborar un diagrama de Líneas 1.- La utilización de la escala que se utilizará en el plano cartesiano puede variar tomando en cuenta el fenómeno que se va graficar. No es necesario que las abscisas (ejes x) y las ordenadas (eje y) del plano cartesiano lleven la misma escala; sin embargo, cuando las magnitudes de las variables no se diferencian sustancialmente, es recomendable utilizar escalas iguales para obtener un gráfico de mayor precisión. 2.- Cuando una de las variables en estudio se inicia con valores muy altos es recomendable no comenzar el eje por el origen cartesiano sino por un valor próximo o por el mismo valor por donde comienza la variable.
  52. 3.- Es costumbre representar en el eje de las x

    del plano cartesiano la variable independiente del estudio que se realiza y en el eje de las y la variable dependiente. En aquellos casos que se dificulta distinguir el tipo de variable se recomienda colocar en la ordenada del plano cartesiano las frecuencias de las variables en estudio y sobre la abscisa la variable cronológica (años, meses, semanas, días, horas, etc.). Ejemplo: Los datos que se presenta a continuación corresponden a los años de servicios de 60 empleados de la empresa GUANICA: 4 3 4 5 6 7 8 9 10 8 4 8 6 3 8 10 7 10 9 10 8 3 5 7 8 6 10 9 7 8 5 3 8 7 8 10 8 10 8 7 7 9 8 7 6 5 7 10 8 9 8 10 7 6 7 8 6 7 6 8 Procedimiento.- Con los datos se procedió a elaborar un cuadro estadístico y se obtuvo el siguiente: 1.- Con los datos que fueron suministrados se elaboró un cuadro estadístico con la frecuencia de cada variable y se organizaron las mismas en una forma ascendentes de la siguiente manera: Cuadro resumen de los años de servicio de los Empleados de la Empresa GUANICA. Años de Servicio (Variable Independiente) N° de Empleados (fi) 3 4 4 3 5 4 6 7 7 12 8 16 9 5 10 9 TOTAL 60
  53. 0 2 4 6 8 10 12 14 16 18

    20 3 4 5 6 7 8 9 10 Frecuencias Años de servicio Grafica de Linea correspondiente a los años de servicio de los empleados de la empresa GUANICA. 2.- Se marcó en el eje de las “x” los años de servicio con la frecuencia correspondiente en el eje de las “y”. Luego, esos puntos se unieron mediante líneas y el resultado fue la gráfica de línea de los años de servicio de los empleados de la empresa GUANICA. Diagrama de Barras Los diagramas de barras son gráficas que se utilizan con mucha frecuencia para representar datos de una investigación determinada, son de fácil interpretación para cualquier lector. Estos gráficos están constituidos por una serie de rectángulos o barras. La longitud y anchura de cada barra representa un fenómeno. La forma de elaborar los mismos es la siguiente: se utiliza un sistema de coordenadas rectangulares y se llevan al eje de las “x” los valores que toma la variable en estudio y en el eje de las “y” se colocan las frecuencias de cada barra. Luego se construyen los rectángulos, tomando como base al eje de las abscisas, cuya altura será igual a cada una de las diferentes frecuencias que presentan las variables en estudio. La magnitud con que viene expresada la variable se observa en la longitud de las barras (rectángulos). Es importante destacar que solamente la longitud de las barras y no su anchura es lo que denota la diferencia de magnitud entre los valores de la variable. Todas las barras tienen que tener una anchura igual, separadas entre sí, preferiblemente por una longitud igual a la mitad del ancho de estas o distancias iguales entre barras. Es recomendable, que las barras no sean ni excesivamente cortas y anchas, ni demasiado largas y angostas, esto es
  54. con el objeto de dar una visión objetiva de la

    investigación en estudio. Las barras se pueden graficar tanto verticalmente como horizontalmente. Se pueden elaborar barras compuestas y barras agrupadas. Ejemplo: pleados de la mpresa GUANICA, con el mismo elabore un diagrama de barras. (Variable Ind endiente) leados (f Sea el siguiente cuadro resumen los años de servicio de los em e Años de servicio ep N° de Emp i) 3 4 4 3 5 4 6 7 7 12 8 16 9 5 10 9 TOTAL 60 Gráfico Circular o de Pastel 4 3 4 7 12 16 5 9 0 2 4 6 8 10 12 14 16 18 3 4 5 6 7 8 9 10 11 12 Frecuencias Años de servicio Diagra de barra correspondiente a los años de servicio de los empleados de la Empresa GUANICA La gráfica de pastel (gráfico de sectores) es un tipo de gráfica que consiste en representar por medio de la circunferencia o un círculo las magnitudes que expresan los datos de un estudio determinado. Este tipo de gráfica considera la circunferencia como representante de los datos estadísticos de una investigación cualquiera. Por tal motivo, se dividirá en tantos sectores como variables tenga la investigación en estudio; la
  55. magnitud de cada sector se encontrará en relación directa con

    la magnitud de la variable a representar, tomando en cuenta que toda la investigación se representa con 360°. En general, los datos que se representan por medio de este diagrama son partes componentes de un total. en ser proporcionales a la magnitud de cada componente representado por las variables. e servicio de los empleados de la empresa GUANICA, elabore una gráfica de Círculo. Años de servicio Grados % Para su elaboración se procede de la siguiente forma: se considera la circunferencia como representación del total de la investigación en estudio, por tal motivo, se dividirá toda su superficie en tantas secciones como variables tenga la investigación en estudio, las superficies de las sesiones de la circunferencia deb Ejemplo: Sea el siguiente cuadro resumen los años d fi 3 4 24 7.0 4 3 18 5.0 5 4 24 7.0 6 7 42 12.0 7 12 72 20.0 8 16 96 26.0 9 5 30 8.0 10 9 54 15.0 TOTALES 60 360° 100.0 a de círculo en este caso se obtienen aplicando una regla de tres de la siguiente forma: 60 360° , 60 360° , 60 360° , 60 360° 4 X 3 X 4 X 7 X X = 24° X = 18° X = 24° X = 42° 60 360° , 60 360 , 60 360° , 60 360° 12 X 16 X 5 X 9 X En la gráfica de pastel se observa la variable y el % correspondiente de la misma. Si se considera la circunferencia como representación del total de los datos que en el estudio anterior referente a la empresa GUANICA es de 60, entonces, se debe igualar 60 a los 360° de la circunferencia y por medio de una simple regla de tres, distribuir esos 360° proporcionalmente entre las frecuencias de las diferentes variables del estudio en cuestión, para así obtener las magnitudes de los diferentes sectores que representaran el número de empleados con los diferentes años de servicio como se observa en el cuadro anterior. De la misma forma se obtienen los porcentajes de cada variable, planteando una sencilla regla de tres. Los diferentes grados que formaran el diagram
  56. X = 72° X = 96° X = 30° X

    = 54° Los resultados obtenidos en estos cálculos se encuentran ubicados en el cuadro anterior. Los porcentajes de cada una de las variables se encuentran en el mismo cuadro y los mismos se calcularon así: 60 100 , 60 100 , 60 100 , 60 100 4 X 3 X 4 X 7 X X = 7.0 X = 5.0 X = 7.0 X = 11.0 60 100 , 60 100 , 60 100 , 60 100 12 X 16 X 5 X 9 X X = 20.0 X = 26.0 X = 8.0 X = 15.0 4 3 4 7 12 16 5 9 Diagrama Circular correspondiente a los años de servicio de los Empleados de la Empresa GUANICA 3 4 5 6 7 8 9 10
  57. Una vez realizado los cálculos de los grados que corresponden

    a cada variable, se llevan a una circunferencia utilizando para ello un transportador. Luego se iniciará el marcaje de los grados considerando el 0° lo que corresponde a las doce de un reloj y el marcaje se realizará tomando en cuenta el orden lógico del cuadro y con el sentido de dirección que sigue las agujas de un reloj. Representación de tronco y hoja Un método para iniciar el análisis exploratorio de los datos, previo al uso de los métodos estadísticos tradicionales, y que además proporciona información rápida, visual y es relativamente nueva, es la representación gráfica de tronco y hoja. Esta representación se basa en la ordenación de los datos a manera de gráfico, pero sin llegar a ello, utilizando las decenas y las unidades. Esta técnica se puede encontrar en el libro de Freud y Simón, pero comentaremos su uso a través del siguiente ejemplo que contiene las calificaciones obtenidas en una prueba de matemáticas: 78 93 61 100 70 83 88 74 97 72 66 73 76 81 83 64 91 70 77 86 Ahora se analizaran cada uno de los datos separando las decenas de las unidades, es decir, el número 51 se verá como 5 | 1. De esta manera las decenas se pondrán en una columna, en forma vertical, y las unidades a su derecha: 6 7 8 9 1 1 8 3 6 7 8 9 1 1 0 1 0 6 4 0 4 2 3 6 0 7 8 1 3 6 7 1 3 0 Para entenderle un poco más, se ha de decir que el primer renglón que dice 6 | 1 6 4 quiere decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representación gráfica tronco y hoja, donde cada renglón es una posición de tronco y cada dígito de la derecha es una hoja. El procedimiento para realizarla es primero empezar con los troncos, es decir la columna de la izquierda, y después dato por dato ir llenando las hojas a la derecha de la línea vertical, en el tronco correspondiente. Además, si se desean tener los datos ordenados, y hay gente que lo prefiere así, se pueden ordenar las hojas en cada renglón para que la representación quede como sigue: 0 4 6 0 2 3 4 6 7 8 3 3 6 8 3 7 1 0
  58. En realidad una representación de tronco y hojas presenta la

    misma información que la lista original de datos, pero de una manera mucho más compacta (especialmente si la lista de datos es más grande) y manejable. Sin embargo, información más compleja resulta un poco más difícil de manejar, por lo que en ocasiones conviene redondear los datos, ignorar sus partes decimales o utilizar las centenas u otras posiciones de los números para las troncos. En cada uno de esos casos conviene hacer alguna anotación, o poner una nota, a fin que los lectores puedan identificar las adecuaciones realizadas y así poder interpretar lo que se quiere transmitir. Para mostrar la información de manera más clara, es posible modificar el número de posiciones del tronco, aumentándola o disminuyéndola de acuerdo a las necesidades particulares de cada problema. Por ejemplo, con los datos del examen anterior, se pueden dividir en dos cada posición del tronco, utilizando la primera posición para disponer las hojas 0, 1, 2, 3 y 4, y la segunda posición para las hojas restantes. De esta manera, se obtiene la representación gráfica de doble tronco: 6 6 7 7 8 8 9 9 1 1 6 0 6 1 7 0 siciones del tronco, con la intención de buscar una mayor clarid resentación. representación inicial de la información obtenida. se les designan con las letras fi, y por lo general se les llaman frecuencias e de variable. La representación numérica de las variables se denomina dato estadístico. en ser para datos no agrupados y para datos agrupados o de tervalos de clase. - + - + - + - + 0- 4 0 2 3 4 7 8 3 3 8 3 6 1 Con esto se han duplicado el número de po ad en la p Esta manera de representación inicial de los datos no la profundizaremos más, sino que la utilizaremos más adelante en algunos casos para, precisamente, presentar una Frecuencia.- La frecuencia es el número de veces que se repite (aparece) el mismo dato estadístico en un conjunto de observaciones de una investigación determinada, las frecuencias absolutas. Distribución de Frecuencia.- En estadística existe una relación con cantidades, números agrupados o no, los cuales poseen entre sí características similares. Existen investigaciones relacionadas con los precios de los productos de la dieta diaria, la estatura y el peso de un grupo de individuos, los salarios de los empleados, los grados de temperatura del medio ambiente, las calificaciones de los estudiantes, etc., que pueden adquirir diferentes valores gracias a una unidad apropiada, que recibe el nombr La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados ascendente o descendentemente, con la frecuencia (fi) de cada dato. Las distribuciones de frecuencias pued in
  59. Distribución de frecuencia para datos no Agrupados.- Es aquella distribución

    que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo n orden lógico con sus respectivas frecuencias. NICA, con los mismos, elabore una distribución de ecuencia para datos no agrupados: u Ejemplo: Los datos que se presenta a continuación corresponden a los años de servicios de 60 empleados de la empresa GUA fr 3 5 4 5 6 7 8 9 10 8 4 8 6 3 8 10 7 10 9 10 8 3 5 7 8 6 10 9 7 8 5 3 8 7 8 10 8 10 8 7 7 9 8 7 6 5 7 8 8 9 8 10 7 6 7 8 6 7 6 10 Procedimiento.- Con los datos se procedió a elaborar un cuadro estadístico con la frecuencia de cada variable y se organizaron las mismas en una forma ascendentes y se btuvo la siguiente distribución de frecuencia para datos no agrupados: Años de Servicio (fi) o 3 4 4 3 5 4 6 7 7 12 8 16 9 5 10 9 TOTAL (N) 60 En la distribución se observa que “N” (número total de datos) es de 60 pero el rango (número de variables diferentes) de esta serie de valores es de 8, por lo tanto, la istribución más conveniente es la que se utiliza para datos no agrupados. era elaborar gráficos lineales como el istograma, el polígono de frecuencia o la ojiva. d Distribución de frecuencia de clase o de datos Agrupados.- Es aquella distribución en la que la disposición tabular de los datos estadísticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el número total de datos (N) es igual o superior 50 y además el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para datos agrupados, también se utilizará este tipo de distribución cuando se requi h
  60. La razón fundamental para utilizar la distribución de frecuencia de

    clases es proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la información obtenida de una investigación sea manejable con mayor facilidad. Este tipo de distribución se basa en el principio de que una observación no puede considerarse diferente de otra por presentar pequeñas diferencias cuantitativas, como por ejemplo el sueldo mensual de dos empleados que difieran en 500 bolívares, de dos edades de personas adultas que difieran en un año, dos alturas de un edificio que difieran en un metro, el costo de 2 autos nuevos que difieran en 5000 bolívares, etc. Al agrupar los datos en una distribución de frecuencia de clase se pierde parte de la información. La reducción o agrupamiento a que son sometidos los datos de una serie de valores cuando existen muchos valores diferentes, originan los denominados errores de agrupamiento; sin embargo, estos errores son en general muy pequeños, razón por la cual la distribución de frecuencia de clase tiene una validez estadística práctica. Cuando se dispone de una serie de datos que sea igual o mayor que 50 y, además, el rango de esa serie de valores sea mayor de 20, lo más recomendable es utilizar una distribución de frecuencia de clase. Componentes de una distribución de frecuencia de clase 1.- Rango o Amplitud total (recorrido).- Es el límite dentro del cual están comprendidos todos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio o investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango es el tamaño del intervalo en el cual se ubican todos los valores que pueden tomar los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor estando incluidos ambos extremos. El rango de una distribución de frecuencia se designa con la letra R. Para calcular el rango de una distribución de frecuencia de clase se calcula la diferencia entre el dato mayor (XM ) y el dato menor (Xm ), y se le agrega una Unidad de Medida (UM), que por lo general es la unidad. La unidad de medida en una distribución de frecuencia se encuentra al obtener la diferencia de dos datos consecutivos de la serie de valores. En algunos casos, los valores de los datos de la serie de observaciones pueden estar expresadas con números decimales, o ser múltiplos de algunos otros números, cuando esto sucede, la unidad de medida adquiere un valor diferente a la unidad. Ver ejemplos: EJEMPLOS A B C OBSERVACINES 6, 9, 11, 12,19, 20, 26, 27, 32,33, 39 0.5, 0.6, 0.10, 0.11 0.19, 0.21, 0.22, 6, 9, 12, 21, 33, 39, 48, UNIDADDE MEDIDA 1 0.1 3
  61. Los datos que se presenta a continuación corresponden a los

    años de servicios de 60 empleados de la empresa GUANICA, con los mismos calcule el rango de la distribución de frecuencia. 3 5 4 5 6 7 8 9 10 8 4 8 6 3 8 10 7 10 9 10 8 3 5 7 8 6 10 9 7 8 5 3 8 7 8 10 8 10 8 7 7 9 8 7 6 5 7 8 8 9 8 10 7 6 7 8 6 7 6 10 Para calcular el rango lo primero que se hace es ubicar el XM , el Xm y la UM. XM = 10, Xm = 3, UM = 5 – 4 = 1 (diferencia entre dos valores consecutivos), luego R = XM – Xm + UM , entonces, R = 10 – 3 + 1 = 8 R = 8. 2.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre dos limites. Para organizar los valores de la serie de datos hay que determinar un número de clases que sea conveniente. En otras palabras, que ese número de intervalos no origine un número pequeño de clases ni muy grande. Un número de clases pequeño puede ocultar la naturaleza natural de los valores y un número muy alto puede provocar demasiados detalles como para observar alguna información de gran utilidad en la investigación. Uno de los problemas que se presentan al elaborar una distribución de frecuencia de clase es el de fijar el número de clases a utilizar, puesto que no existe un criterio general para determinar el número de clases a elegir; sin embargo, algunos especialista en la materia creen que un buen criterio es considerar de 7 a 20 clase, dependiendo esto, de las características del estudio que se realiza; por tal motivo el número de clase a utilizar en una investigación determinada dependerá de la persona que realice la investigación. En este curso se utilizará el criterio anteriormente descrito. Las clases de una distribución de frecuencia indican las cotas o fronteras de cada clase en la distribución, las clases están formadas por dos números, denominados limites aparentes (LA), ejemplo: 32 — 37, el primero de estos (32) se le llama límite inferior aparente (LIA) y al segundo (37) se le denomina límite superior aparente (LSA). Los Limites Reales(LR) o verdaderos de una clase son aquellos que se obtienen restándole media unidad de medida al límite aparente inferior de una clase y sumándole media unidad de medida al límite superior aparente de las diferentes clases, es decir, son valores no observables de la variable en estudio, puesto que no lo registra la unidad de medida utilizada; hay que tener cuidado de que los limites reales de clase no coincidan con valores observables de la variable, para evitar ambigüedades sobre la clase a la que corresponde una observación. Si se toma como ejemplo: 32 — 37 (32 a 37), se puede observar que estos son los límites aparentes inferior 32 y superior 37 de esa clase, si se aplica el concepto de límite real se tendrán los siguientes límites verdaderos: 31.5 — 37.5, como se puede observar el límite inferior aparente disminuyó en media unidad de medida y se convirtió en (LRI) Limite Real Inferior (31.5) y el límite superior aparente aumento media unidad y se convirtió en (LRS) Limite Real Superior (37.5).
  62. Tamaño de los Intervalos de Clase Los intervalos de clase

    pueden ser de tres tipos, según el tamaño que estos presenten en una distribución de frecuencia: a) Clases de igual tamaño, b) clases desiguales de tamaño y c) clases abiertas. Clases de igual tamaño Este tipo de clases es el más utilizado en los cálculos estadísticos; cuando todas las clases son del mismo tamaño, los cálculos relacionados con la distribución de frecuencia son simplificados grandemente. En términos generales, este tipo de distribución, es el que se utiliza comúnmente en casi todas las investigaciones. Ejemplo: CLASES fi 5——7 5 8——10 10 11——13 15 14——16 18 17——19 11 20——22 5 TOTALES 64 En esa distribución de frecuencia de clase se puede observar que cada clase posee tres variables diferentes, por lo tanto, los intervalos de clases son de igual tamaño. Clases desiguales de tamaño Los intervalos de clases desiguales no son frecuentes en los análisis estadísticos, la utilización de los mismos se debe evitar; sin embargo, en algunas investigaciones es indispensable su utilización; tal es el caso de aquellas investigaciones que tienen como propósito particular el de analizar valores que varían en un amplio recorrido de la variable. Cuando se utiliza este tipo de clase los intervalos de clases deberían ser incrementados de una forma ordena si es posible. Este tipo de clases se utiliza algunas veces para reportar datos relacionados con valuaciones de activos o ingresos personales. Ejemplo: CLASES AMPLITUD 100——499 399 500——999 499 1000——4999 3999 5000——9999 4999 10000——24999 14999 25000——50000 25000 Como se puede observar en la anterior distribución cada clase tiene un tamaño diferente, es decir, sus amplitudes o tamaño son diferentes para cada clase.
  63. Clases Abiertas Las clases abiertas son aquellas en las que

    uno de sus dos limites de clases no esta definido numéricamente. Este tipo de clase se utiliza cuando las distribuciones poseen algunos datos u observaciones que son mucho mayores o mucho más pequeños que los demás y se quiere condensar en un sólo. En lo posible es conveniente evitar este tipo de clase ya que en estas no es posible definir el punto medio de la distribución, por lo cual se hace difícil la representación gráfica y en realizar otros cálculos con los datos que presentan los cuadros estadísticos. Sin embargo, existen investigaciones donde la aplicación de clases abiertas es conveniente, por cuanto, la existencia de valores de la serie de datos son muchos menores o mucho mayores que el resto de la serie. Ejemplo: Sea la siguiente distribución de frecuencia, las observaciones correspondientes al salario que devenga un grupo de personas que viven en determinado barrio de una ciudad. CLASES fi X & Menos de 150000 67 ? 150000——239000 36 194500 340000——429000 10 384500 430000——519000 8 474500 520000——609000 7 564500 610000——699000 8 654500 700000——789000 7 744500 790000 y Más 7 ? TOTALES 135 Como se puede observar en ese cuadro estadístico los valores de las variables que conforman la primera y la última clase de la distribución no tienen valores definidos. 3.-Amplitud de Clase, Longitud o Ancho de una Clase La amplitud o longitud de una clase es el número de valores o variables que concurren a una clase determinada. La amplitud de clase se designa con las letras Ic. Existen diversos criterios para determinar la amplitud de clases, ante esa diversidad de criterios, se ha considerado que lo más importante es dar un ancho o longitud de clase a todos los intervalos de tal manera que respondan a la naturaleza de los datos y al objetivo que se persigue y esto se logra con la práctica. Existe una fórmula para determinar el Ic y la misma se expresa así: . .. .. .., .. .. .., ... ...., clase de Amplitud Ic clases de Numero NC Rango R Donde NC R = = = Ic = Con la formula anterior se puede determinar el Ic, conociendo el rango y el número de clases. Cuando se tenga dudas en determinar la amplitud de clase de una serie de valores, es de gran utilidad utilizar el método sugerido por Hebert A. Sturges el cual establece que: . .. .. .. ,. ..,. . log . 322 , 3 1 datos de total numero N donde N Rango Ic = + =
  64. En esta fórmula 1+3,322 log. N = NC (Número de

    clases), en la gran mayoría de los casos el resultado final es un número fraccionario, el cual no es adecuado en la práctica, sin embargo, se puede aplicar las técnicas de redondeo para convertirlo en un número entero. En este curso se utilizará el método de Sturges para determinar el Ic de una distribución de frecuencia de clase siempre y cuando el mismo sea aplicable. Algunos investigadores consideran que el método de Sturges pierde eficacia cuando el número total de datos de una serie de valores es muy extenso, considerando como extenso un N>500. En una distribución de frecuencia de clase el Ic se puede determinar aplicando la siguiente fórmula: LRI LRS Ic − = Es recomendable que el Ic sea un número impar para que el punto medio o marca de clase de una distribución coincida con un número entero lo cual facilitará cálculos posteriores. Como se inicia la primera Clase de una distribución de frecuencia de clase El límite inferior de la primera clase de una distribución de frecuencia debería comenzar por un múltiplo del Ic (Ancho o tamaño del intervalo), ejemplo: Si el Ic de una distribución de frecuencia de clase = 3, y el dato menor es 49, entonces él límite inferior de la primera clase se ubicara así: 3x1 = 3, 3x2 = 6, 3x3 = 9, 3x4 = 12, 3x5 = 15, 3x6 = 18, ......3x13 = 39, 3x14 = 42, 3x15 = 45, 3x16 = 48, 3x17 = 51, en fin por un número que sea múltiplo de 3, siempre y cuando no deje fuera de la primera clase al menor de los datos de la serie de valores, en este caso se iniciaría la primera clase en: 48——50, no se tomo 51 por ser este valor mayor que valor menor de la serie de datos y si tomáramos 51 los valores correspondientes a 48 y 50 quedarían fuera de la clase. Si el valor más pequeño de los datos de una serie de valores es inferior al Ic, entonces, el límite inferior de la primera clase tiene que iniciarse con ese valor más pequeño. 4.-Punto medio o Marca de clase El centro de la clase, es el volar de los datos que se ubica en la posición central de la clase y representa todos los demás valores de esa clase. Este valor se utiliza para el cálculo de la media aritmética. El punto medio se representa por: Medio .. Punto . X = & . El punto medio de una clase se determina por la semisuma del límite inferior y superior de una clase, tal como lo indica la formula siguiente: 2 LAS LAI X + = &
  65. 5.-Frecuencia de clase cuentran presente en una lase determinada, de

    una distribución de frecuencia de clase. .- Frecuencia Relativa fr; si cada fr se multiplica por 00 se obtiene la frecuencia relativa porcentual (fr %). .-Frecuencias acumuladas muladas ueden ser menor que (fa< que) y frecuencias acumuladas mayor que (fa>que). .-Frecuencia acumulada menor que limites periores de cada clase y como ordenada los diferentes valores de la fa < que. .-Frecuencia acumulada mayor que eriores de cada lase con los valores de fa > que como ordenada en el plano cartesiano. 0.- Frecuencia acumulada relativa las frecuencias acumuladas relativas porcentuales y las mismas se designan así: far %. La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el número total de valores de las variables que se en c 6 La frecuencia relativa es aquella que resulta de dividir cada uno de los fi de las clases de una distribución de frecuencia de clase entre el número total de datos(N) de la serie de valores. Estas frecuencias se designan con las letras 1 7 Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se obtienen de las sumas sucesivas de las fi que integran cada una de las clases de una distribución de frecuencia de clase, esto se logra cuando la acumulación de las frecuencias se realiza tomando en cuenta la primera clase hasta alcanzar la ultima. Las frecuencias acumuladas se designan con las letras fa. Las frecuencias acu p 8 Las frecuencias acumuladas menor que (fa< que) son aquellas frecuencias acumuladas que se forman con el fi de los valores más pequeños de las variables de cada clase hacia los valores mayores de la misma. Para graficar los polígonos de frecuencias acumuladas (ojiva) fa< que, se utilizan como variables independientes los su 9 Las frecuencias acumuladas mayor que (fa> que) son aquellas frecuencias acumuladas que se forman de las fi de los valores mayores de las variables de cada clase hacia los valores menores de la misma. Para graficar los polígonos de frecuencias acumuladas (ojiva) fa > que, se utiliza como variable independiente los limites inf c 1 La frecuencia acumulada relativa es aquella que resulta de dividir cada una de las fa de las diferentes clases que integran una distribución de frecuencia de clase entre el número total de datos (N) de la serie de valores, estas frecuencias se designan con las letras far. Si las far se multiplican por 100 se obtienen
  66. Problema tipo 1.- Sean los siguientes datos las horas extras

    trabajadas por un grupo de obreros petroleros de la zona durante un mes. Con esos datos elabore una distribución de frecuencia de clase utilizando el método de Sturges. 22 39 37 28 23 39 24 38 31 35 36 28 23 27 38 40 22 23 36 27 32 33 26 60 39 33 40 27 34 22 30 31 37 33 41 39 58 59 56 41 54 56 57 58 39 40 34 45 53 52 52 28 36 37 40 26 34 25 23 32 56 33 58 40 36 25 42 33 45 55 29 52 38 28 38 38 32 42 53 58 45 43 40 28 60 41 37 42 31 45 30 28 40 37 28 44 40 39 57 60 Para elaborar la distribución de frecuencia hay que realizar los siguientes cálculos: 1.- Calcular el rango R así: R = XM – Xm + 1 UM, XM = 60, Xm = 22, UM = 23 – 22 = 1. Luego: R = 60 – 22 + 1 R = 39. 2.- Se calcula el Ic de la serie de valores aplicando el método de Sturges así: N R Ic . log . 322 , 3 1 + = R = 39, N = 100, Log. 100 = 2.0. . 10 . 5 64 . 7 39 0 . 2 322 , 3 1 39 = = + = x Ic Como el Ic = 5.10 se redondea al impar más cercano que en este caso es Ic = 5.0. Ahora se procede a buscar el límite inferior de la primera clase de la distribución, para ello se busca un múltiplo del Ic que no sea superior al menor valor de los datos que este caso es 22. Tomando en cuenta este criterio el límite inferior de la primera clase será entonces: 5x4 = 20, que es un múltiplo del Ic y no es mayor que el menor valor de la serie de datos. Se procede ahora a elaborar las diferentes clases que integraran la distribución de frecuencia. La primera clase se forma así: 20 — 24, el resto de las clases y las demás columnas que integran la distribución se formaran así (se recomienda al estudiante que realice todos los cálculos necesarios para completar la distribución):
  67. Clases fi fa< que fa>que X & fr fr %

    far<que far % 20——24 8 8 100 22 0.08 8.0 0.08 8.0 25——29 15 23 92 27 0.15 15.0 0.23 23.0 30——34 16 39 77 32 0.16 16.0 0.39 39.0 35——39 21 60 61 37 0.21 21.0 0.60 60.0 40——44 16 76 40 42 0.16 16.0 0.76 79.0 45——49 4 80 24 47 0.04 4.0 0.80 80.0 50——54 6 86 20 52 0.06 6.0 0.86 86.0 55——59 11 97 14 57 0.11 11.0 0.97 97.0 60——64 3 100 3 62 0.03 3.0 1.00 100.0 Total 100 1.00 Para calcular las fa>que de la distribución, se inicia la acumulación de los fi desde la última clase de la distribución, que es donde se encuentran los valores mayores de las variables, hasta llegar a la primera clase que es donde se ubican los valores menores de los datos. Los cálculos de las demás columnas de la distribución se explicaran ampliamente en la teoría. 2.- Los datos que se presentan a continuación corresponden al consumo de carne de ganado, en un trimestre, de un grupo de familia de un barrio de la ciudad de E l Tigre. Con los mismos elabore una distribución de frecuencia de clase utilizando para ello el método de Sturges. 25 3 5 3 8 10 12 14 3 8 10 12 15 27 30 28 25 29 28 24 28 27 2 30 22 21 20 26 4 8 10 12 15 16 10 12 15 16 12 10 8 5 5 8 11 25 30 17 18 13 11 13 17 17 13 11 9 7 7 9 22 13 18 19 14 15 11 9 10 12 14 20 19 17 16 27 15 16 14 10 23 18 19 22 17 26 8 7 8 30 24 10 6 7 9 30 12 9 7 12 Para resolver el problema planteado se inician los siguientes pasos: 1.- Se calcula el rango R de la distribución aplicando la formula: R = XM – Xm +1UM. XM = 30, Xm = 2, UM = 3 – 2 = 1; R = 30 – 2 +1 = 29, R = 29, N =100, Log.100 = 2.0. 2.- Se calcula el Ic aplicando el método de sturges: N R Ic . log . 322 , 3 1+ = . 8 . 3 64 . 7 29 0 . 2 322 , 3 1 29 = = + = x Ic
  68. Como se puede observar el Ic = 3.8, hay que

    redondear este Ic al impar más cercano, que en este caso seria 3.0. Ahora se procede a buscar el límite inferior de la primera lase de la distribución esta sería un múltiplo del Ic que sea menor o igual al menor de todas las lases. Se procederá ahora a completar la distribución de frecuencia, se recomienda al estudiante realizar los es s necesario ara le m C fa e fa e c los datos de la serie de valores. En este caso el mínimo múltiplo del Ic es 3, pero el límite inferior de la serie de valores no se puede iniciar con 3 ya que de ser así quedarían valores fuera de la clase como es el caso de 2 que no sería incluido en la clase, en este caso se tiene que utilizar como límite inferior de la primera clase el menor valor de la serie de datos, es decir, 2. Luego la primera clase seria: 2 — 4, y así sucesivamente hasta completar c diferent cálculo s p comp tar la mis a. LASES fi <qu >qu X & fr fr % fa far e r<que %<qu 2——4 5 5 100 3 .005 5.0 0.05 5.0 5——7 9 14 95 6 0.09 9.0 0.14 14.0 8——10 20 34 86 9 0.20 20.0 0.34 34.0 11——13 16 50 66 12 0.16 16.0 0.50 .50.0 14—— 16 13 63 50 15 0.13 13.0 0.63 63.0 17—— 19 11 74 37 18 0.11 11.0 0.74 74.0 20—— 22 6 80 26 21 0.06 6.0 0.80 80.0 23—— 25 6 86 20 24 0.06 6.0 0.86 86.0 2 94 1 27 0.94 94.0 6—— 28 8 4 0.08 8.0 29—— 31 6 100 6 30 0.06 6.0 1.00 100.0 TOTAL 100 1.00 100.0 Se recomienda al estudiante que realice todos los cálculos necesarios para completar mente por un grupo de familias de una Urbanización de El Tigre. Con los ismos elabore una distribución de frecuencia de clase, para ello utilice el método de Sturges. los datos que conforman el cuadro de la distribución de frecuencia anterior. 3.- Los datos que a continuación se presentan corresponden al consumo de azúcar trimestral m 14 24 32 38 40 30 26 16 18 28 30 40 42 32 28 18 20 44 34 28 20 22 30 34 44 46 36 30 22 24 30 36 46 48 22 30 38 46 48 38 30 24 26 32 38 50 52 48 46 16 18 22 24 26 28 30 16 14 16 20 18 14 18 34 36 40 42 44 20 22 24 26 18 16 24 28 30 32 26 24 22 20 18 16 14 42 34 28 52 32 28 38 14 50 22 24 20 24 30 36 Para elaborar la distribución de frecuencia de clase lo primero que se hace es calcular el n este caso se puede observar que la unidad de medida es puesto que la serie de rango de la serie de valores así: XM = 52, Xm = 14, UM = 16 – 14 = 2, UM = 2; R = XM – Xm + 1 UM. E valores sigue una secuencia de números múltiplos de dos.
  69. R = 52 – 14 + 2; R = 40.

    El número total de datos es 100 y el Log. 100 = 2.0. Después de calculado R se calcula el Ic utilizando el método de Sturges así: un múltiplo de 5 y no es mayor que el menor valor de la serie de datos, entonces la primera clase se iente distribución presenta los diferentes componentes que la integran, se recomienda al estudiante realizar todos esos cálculos necesarios para conformar la m f fa e fa> El Ic en este caso es 5.24 y si se hace el redondeo al impar más cercano, entonces el Ic = 5.0. Ahora se buscara el límite inferior de la primera clase que integrará la distribución, esta deberá ser un múltiplo del Ic y que sea menor o igual al valor más pequeño de la serie de valores, en este caso el límite inferior será 10 que es iniciara así: 10 — 14 y el resto de las mismas seguirán la secuencia lógica. La sigu isma Clases i <qu que X & fr fr % far far e <que %<qu 10——14 5 5 100 12 0.05 5.0 0.05 5.0 15——19 13 18 95 17 0.13 13.0 0.18 18.0 20——24 22 40 82 22 0.22 22.0 0.40 40.0 25——29 12 52 60 27 0.12 12.0 0.52 52.0 30——34 19 71 48 32 0.19 19.0 0.71 71.0 35——39 9 80 29 37 0.09 9.0 0.80 80.0 40——44 9 89 20 42 0.09 9.0 0.89 89.0 45——49 7 96 11 47 0.07 7.0 0.96 96.0 50——54 4 100 4 52 0.04 4.0 1.00 100.0 Total 100 Se recomienda al estudiante realizar todos los cálculos necesarios para completar el y la jiva o polígono de frecuencias acumuladas. El método más utilizado para graficar los tribución de frecuencia es el histograma. cuadro. Gráficos de la distribución de frecuencias de clases Con los cuadros de las distribuciones de frecuencias se pueden elaborar varios tipos de gráficos, los más utilizados son: Los histogramas, los polígonos de frecuencias o datos de una dis Histograma El histograma es un diagrama en forma de columna, muy parecido a los gráficos de barras. Se define como un conjunto de rectángulos paralelos, en el que la base representa la clase de la distribución y su altura la magnitud que alcanza la frecuencia de la clase correspondiente. Son barras rectangulares levantadas sobre el eje de las abscisas del plano cartesiano utilizando escalas adecuadas para los valores que asume . 24 . 5 24 . 5 40 40 = ∴ = = = = Ic R Ic 64 . 7 0 . 2 322 , 3 1 . log . 322 , 3 1 + + x N
  70. la variable en la distribución de frecuencia. El ancho de

    la base de los rectángulos es proporcional a cada clase de la distribución, de tal manera que, cuando la distribución tiene clases de igual el tamaño de todos los rectángulos tendrán bases iguales. Los lados del rectángulo se levantan sobre los puntos del eje de las x que corresponden a los limites de cada clase y la longitud de los mismos será igual a la frecuencia que nga esa clase, los lados por lo tanto corresponden a la frecuencia de cada clase de la je de las x, es decir, si las variable independientes ocupan en el eje x 8 cm, la máxima altura que ocuparan las frecuencias en el eje y tendrá que ser de 6 cm. e las x los limites inferiores de cada clase y el ultimo límite superior de la istribución, y sobre el eje de las y se coloca la magnitud de la frecuencia de cada las erpendiculares será igual a la frecuencia de cada clase; y para finalizar se unen las dos erpendiculares que representan a cada clase, el resultado final será el histograma. urante un trimestre por un grupo de familias de una Urbanización de El Tigre. Elabore un histograma. Es recomienda al e te elaborar los cálculos respectivos. te distribución de frecuencia. Cuando se elaboran gráficas estadísticas en el plano cartesiano es recomendable que en el eje de las ordenadas se representen las frecuencias y en el eje de las abscisas las variables independiente. El eje de las y que representa las frecuencias debe empezar siempre en cero. Es importante señalar que la longitud del eje de las y que representa la altura tenga el 75 % de la longitud del e Pasos para construir un histograma 1.- Se trazan dos ejes de coordenadas, el de abscisas y el de ordenada.. Se coloca sobre el eje d d clase. 3.- Se trazan perpendiculares por los limites de cada clase, la altura de p p Problemas 1.- Dada la siguiente distribución de frecuencia correspondiente al consumo de arroz d studian Clases fi 20——24 8 25——29 15 30——34 16 35——39 21 40——44 16 45——49 4 50——54 6 55——59 11 60——64 3 Total 100 Cuadro resumen:
  71. Clases fi fa e fa e < qu >qu X

    & fr fr % fa r<que far % 20——24 8 8 100 22 0.08 8.0 0.08 8.0 25——29 15 23 92 27 0.15 15.0 0.23 23.0 30——34 16 39 77 32 0.16 16.0 0.39 39.0 35——39 21 60 61 37 0.21 21.0 0.60 60.0 40——44 16 76 40 42 0.16 16.0 0.76 79.0 45——49 4 80 24 47 0.04 4.0 0.80 80.0 50 ——54 6 86 2 0 52 0. 06 6. 0 0. 86 86 .0 55 97 14 57 0.11 11 0. 97 ——59 11 .0 97 .0 60——64 3 100 3 62 0.03 3.0 1.00 100.0 Total 100 al onsumo de carne de res en kg.(en un trimestre) de un grupo de familia de un barrio de ciudad de El Tigre. Con los mism re un Hi grama. Elabore los cálculos. Cuadro resume 2.- La Distribución e frecuencia que se presentan a continuación corresponden c la os elabo sto n: Clases fi 2——4 5 5——7 9 8——10 20 11——13 16 14—— 16 13 17—— 19 11 20—— 22 0 23—— 25 6 26—— 28 8 29—— 31 6 TOTAL 100 0 8 15 16 21 16 4 6 11 3 0 5 10 15 20 25 Frecuencias Histograma correspondiente a las horas extras laboradas por un grupo de obreros petroleros. 15 20 25 30 35 40 45 50 55 60 65 Limites Inferiores
  72. Clases fi X & fa< e fa qu >que 2——4

    5 3 5 100 5——7 9 6 14 95 8——10 20 9 34 86 11——13 16 12 50 66 14—— 16 13 15 63 50 17—— 19 11 18 74 37 20—— 22 0 21 80 26 23—— 25 6 24 86 20 26—— 28 8 27 94 14 2 3 1 9—— 31 6 0 0 6 TOTAL 100
  73. 0 5 9 20 16 13 11 0 6 8

    6 0 5 10 15 20 25 1 2 5 8 11 14 17 20 23 26 29 32 Frecuencias Limites inferiores Histograma correspondiente al consumo de carne de res, en kg., por un grupo de familias de un barrio de El Tigre. Polígono de frecuencia Es un diagrama de líneas que representa los puntos medios y las respectivas frecuencias de una distribución de frecuencia de clase. Es una representación gráfica cerrada de una distribución de frecuencia. Es otra de las formas de graficar los valores de una distribución de frecuencia de clase. No existe ninguna razón estadística para seleccionar los polígonos de frecuencia en vez de los histogramas o viceversa, los histogramas simplemente representan una manera de graficar y los polígonos de frecuencia otra; la diferencia entre ambos radica en que una barra vertical rectangular representa una clase y su frecuencia en el histograma y un punto cumple la misma función en el polígono de frecuencia. Pasos para elaborar un polígono de frecuencia 1.- Se dibuja un plano cartesiano. 2.- Se traza sobre el eje de las abscisas, a distancias iguales, los puntos medios de las diferentes clases de la distribución de frecuencia. 3.- Se levantan perpendiculares por cada una de las marcas de clase, con una longitud igual a la frecuencia de cada una de las clases que integran la distribución de frecuencia. Al final de cada perpendicular se marca un punto. 4.- Los puntos resultantes se unen por medio de una línea recta obteniéndose una línea poligonal.
  74. 5.- Con la finalidad de cerrar la línea poligonal se

    agrega una clase imaginaria con frecuencia cero a cada extremo de la distribución de frecuencia, por tal motivo ambos xtremos del polígono se cortan con el eje de las abscisas. por medio de segmentos de recta dan como resultado el olígono de frecuencia. roblemas tipo . Con esos datos elabore un olígono de frecuencia. Elabore los cálculos respectivos. e También se puede elaborar un polígono de frecuencia después de haber graficado un histograma; si se determina el punto medio de cada rectángulo de un histograma y esos puntos medios se unen p P 1.- Sea la siguiente distribución correspondiente a las horas extras trabajadas por un grupo de obreros petroleros de la zona durante un mes p Clases fi 20——24 8 25——29 15 30——34 16 35——39 21 40——44 16 45——49 4 50——54 6 55——59 11 60——64 3 Total 100 Cuadro resumen: Clases fi X & fa<que fa e >qu 20——24 8 22 8 10 25——29 15 27 23 92 30——34 16 32 39 77 35——39 2 1 37 60 61 40——44 16 42 76 40 45——49 4 47 80 24 50——54 6 52 86 2 0 55 9 ——5 11 5 7 9 7 1 4 60——64 3 62 100 3 Total 100
  75. Observe que los puntos medios, 17 y 67 del polígono

    son imaginarios, se utilizan para cerrar la línea poligonal, lo que da origen al polígono de frecuencia. 2.- La Distribución de frecuencia que se presentan a continuación corresponden al consumo de carne de res en kg., en un trimestre, de un grupo de familia de un barrio de la ciudad de El Tigre. Con los mismos elabore un polígono de frecuencia. Realice los cálculos respectivos. Clases fi 2——4 5 5——7 9 8——10 20 11——13 16 14—— 16 13 17—— 19 11 20—— 22 6 23—— 25 6 26—— 28 8 29—— 31 6 TOTAL 100 0 8 15 16 21 16 4 6 11 3 0 0 0 0 0 0 0 0 0 0 0 5 10 15 20 25 17 22 27 32 37 42 47 52 57 62 67 Frecuencias Puntos Medios Poligono de frecuenca relacionado con las horas extras laboradas por un grupo de obreros petroleros de la zona
  76. Cuadro resumen: Clases fi X & fa<que fa>que 2——4 5

    3 5 100 5——7 9 6 14 95 8——10 20 9 34 86 11——13 16 12 50 66 14—— 16 13 15 63 50 17—— 19 11 18 74 37 20—— 22 6 21 80 26 23—— 25 6 24 86 20 26—— 28 8 27 94 14 29—— 31 6 30 10 6 TOTAL 100 0 5 9 20 16 13 11 6 6 8 6 0 0 0 0 0 0 0 0 0 0 0 5 10 15 20 25 0 3 6 9 12 15 18 21 24 27 30 32 Frecuencias Puntos Medio Poligono de frecuencia relacionado al consumo en kg. de carne de res,en un trimestre,de un grupo de familias de un barrio de El tigre. Los puntos medios primero y último del polígono son imaginarios, se puede observar que tienen como frecuencia cera, los mismos se utilizan para cerrar la línea poligonal y el área que se ubica debajo de esta es la correspondiente al polígono de frecuencia.
  77. 3.- La siguiente distribución de frecuencia corresponde a la edad

    de un grupo de trabajadores de la empresa RUMICA. Elabore un polígono de frecuencia. Realice los cálculos respectivos. Clases fi 22 —24 3 25— 27 5 28 —30 0 31— 33 10 34 —36 8 37 —39 7 40— 42 6 43 —45 7 Total 46 Cuadro resumen: Clases fi X & fa<que fa>que 22 —24 3 23 3 46 25— 27 5 26 8 43 28 —30 0 29 8 38 31— 33 10 32 18 38 34 —36 8 35 26 28 37 —39 7 38 33 20 40— 42 6 41 39 13 43 —45 7 44 46 7 Total
  78. 0 3 5 0 10 8 7 6 7 0

    0 0 0 0 0 0 0 0 0 0 2 4 6 8 10 12 20 23 26 29 32 35 38 41 44 47 Frecuencias Puntos Medio Poligono de frecuencia relacionado con la edad de un grupo de trabajadores de la empresa RUMICA. Se puede observar que los puntos medios 20 y 47 pertenecen a clases imaginarias y su función es la de cerrar la línea poligonal, dando origen al polígono de frecuencia. Polígono de frecuencia acumulativa u ojiva Es una gráfica que se elabora con los valores de las frecuencias acumulados (menor que y mayor que) y los límites de las clases de una distribución de frecuencia. El polígono de frecuencia acumulada se le conoce comúnmente como ojiva. La ojiva es una representación gráfica que consiste en una línea, que puede ser ascendente o descendente y se utiliza para representar las distribuciones de frecuencias acumuladas menor que y mayor que, según los datos utilizados. En los estudios de análisis estadísticos la ojiva es de gran utilidad porque permite obtener con gran aproximación cierta información requerida, en un momento determinado. Pasos para elaborar una ojiva 1.- Se trazan los ejes de abscisa y ordenada del plano cartesiano. 2.- Se marca sobre el eje de las x los limites superiores de cada clase, si se trata de la ojiva menor que o los limites inferiores de la misma si se desea graficar la ojiva mayor que, curva descendente, y sobre el eje de las ordenas se marcan las magnitudes de las frecuencias acumuladas menor que( curva ascendente) de cada clase, si se quiere
  79. graficar la ojiva menor que o las frecuencias acumuladas mayor

    que de cada clase, si se desea graficar la ojiva mayor que. 3.- Se trazan perpendiculares por los límites superiores o inferiores de cada clase, según la ojiva que se desea graficar, la altura de la perpendicular tiene que ser igual a la frecuencia acumulada menor que o mayor que de la clase respectiva y al final de la misma se marca un punto. 4.- por último se unen todos los puntos por medio de segmentos de recta, dando origen a la ojiva. Nota.- algunos investigadores consideran que la ojiva menor que y la mayor que se deberían graficar con los límites inferiores de clase y al final el último límite de la distribución. Problemas tipo 1.- Sea la siguiente distribución correspondiente a las horas extras laboradas por un grupo de obreros petroleros de la zona durante un mes. Con esos datos elabore un polígono de frecuencia acumulada menor que y otro mayor que. Realice los cálculos respectivos para completar el siguiente cuadro. Clases fi Clases fi PM fa<que fa>que 20——24 8 20——24 8 22 8 10 25——29 15 25——29 15 27 23 92 30——34 16 30——34 16 32 39 77 35——39 21 35——39 21 37 60 61 40——44 16 40——44 16 42 76 40 45——49 4 45——49 4 47 80 24 50——54 6 50——54 6 52 86 20 55——59 11 55——59 11 57 97 14 60——64 3 60——64 3 62 100 3 Total 100 Total 100
  80. 8 23 39 60 76 80 86 97 100 0

    0 0 0 0 0 0 0 0 0 20 40 60 80 100 120 24 29 34 39 44 49 54 59 64 Frecencias acumuladas " Menor que" Limites superiores Ojiva " menor que"correspondiente a las horas extras laboradas por un grupo de obreros petroleros 100 92 77 61 40 24 20 14 3 0 0 0 0 0 0 0 0 0 0 20 40 60 80 100 120 20 25 30 35 40 45 50 55 60 Frecuencias Acumuladas "Mayor Que". Limites Inferiores Ojiva "mayor que" correspondiente a las horas extraslaboradas por un grupo de obreros petroleros.
  81. 2.- La Distribución de frecuencia que se presentan a continuación

    corresponden al consumo de carne de res en kg., en un trimestre, de un grupo de familia de un barrio de la ciudad de El Tigre. Con los mismos elabore un polígono de frecuencia Acumulado, menor que y otro mayor que. Realice los cálculos respectivos para completar el siguiente cuadro. Clases fi Clases fi PM fa<que fa>que 2——4 5 2——4 5 3 5 100 5——7 9 5——7 9 6 14 95 8——10 20 8——10 20 9 34 86 11——13 16 11——13 16 12 50 66 14—— 16 13 14—— 16 13 15 63 50 17—— 19 11 17—— 19 11 18 74 37 20—— 22 6 20—— 22 6 21 80 26 23—— 25 6 23—— 25 6 24 86 20 26—— 28 8 26—— 28 8 27 94 14 29—— 31 6 29—— 31 6 30 100 6 TOTAL 100 TOTAL 100 5 14 34 50 63 74 80 86 94 100 100 95 86 66 50 37 26 20 14 6 0 0 0 0 0 0 0 20 40 60 80 100 120 2 5 8 11 14 17 20 23 26 29 31 Frecuencias acumuladas Limites Inferiores Ojiva "Menor Que" y "Mayor que" correspondiente al consumo de carne de res, en kg. de un grupo de familias de un barrio de El Tigre.
  82. 5 14 34 50 63 74 80 86 94 100

    0 0 0 0 0 0 0 0 0 0 20 40 60 80 100 120 2 5 8 11 14 20 23 26 29 Frecuencias Acumuladas "Menor que" Limites Iferiores Ojiva "Menor Que" correspondiente al consumo de carne de res, en kg., de un grupo de familia de un barrio de El Tigre. 100 95 86 66 50 37 26 20 14 6 0 20 40 60 80 100 120 4 7 10 13 16 19 22 25 28 31 Frecuencia Acumulada " Mayor Que". Limites Superior Ojiva "Mayor Que" correspondiente al consumo de carne de res, en kg. de un grupo de familia de un barrio de El Tigre.
  83. MEDIDAS DE POSICION (CAPÍTULO 2) OBJETIVO: Aplicar las caracteristicas y

    propiedades de la media aritmetica, la mediana, la moda, los cuartiles, percentiles como principales medida de tendencia central de una distribucion de frecuencia de clase. CONTENIDOS: Describir las propiedades de la media aritmetica, la mediana, la moda, los cuartiles y los percentiles. Resolucion de problemas aplicando el Spss13.0. MEDIDAS DE POSICIÓN El análisis estadístico de una serie de datos se elabora mediante el cálculo de diferentes parámetros y / o estadísticos. Después que los datos han sido reunidos y tabulados, se inicia el análisis con el fin de calcular un número único, que represente o resuma todos los datos. Por lo general, las frecuencias de los intervalos centrales de una serie de datos son mayores que el resto, ese número se le denomina medida de posición. Las medidas de posición forman parte del conjunto de medidas descriptivas numéricas, entre las que se encuentran los parámetros y los estadígrafos. Una medida de posición es un número que se escoge como orientación para hacer mención a un grupo de datos. Uno de los problemas fundamentales que presenta un análisis estadística, es el de buscar el valor más representativo de una serie de valores. El primer paso que hay que realizar para que se entienda una larga serie de valores u observaciones, es el de resumir los datos en una distribución de frecuencia; esto no es suficiente para fines practico, puesto que a menudo es necesario una sola medida descriptiva, y en especial cuando se requiere comparar dos o más serie estadísticas. Es necesario continuar el proceso de reducción hasta sustituir todos los valores observados por uno solo que sea representativo, de tal forma que permita una interpretación global del fenómeno en estudio; para que ese valor sea representativo debe reflejar la tendencia de los datos individuales de la serie de valores. Un valor o dato de la serie con estas características recibe el nombre de promedio, media o medida de posición, esto es debido a su ubicación en la zona central de la distribución. Las medidas de posición son de gran importancia en el resumen estadístico, ya que representan un gran número de valores individuales por uno solo. El valor más representativo de un conjunto de datos por lo general no es el valor más pequeño ni el más grande, es un número cuyo valor se encuentra en un punto intermedio de la serie de datos. Por lo tanto un promedio es con frecuencia un valor referido que representará la medida de posición de la serie de valores. Las medidas de posición se emplean con frecuencia como mecanismo para resumir un gran número de datos o cantidades con la finalidad de obtener un valor que sea representativo de la serie.
  84. Las Principales Medidas de Posición son: a) La Media Aritmética,

    b) La Mediana, c) La Moda, d) Los cuartiles, e) Los Deciles y f) Los Percentiles. CARACTERÍSTICAS DE LAS MEDIDAS DE POSICIÓN 1. – Deben ser definidas rigurosamente y no ser susceptibles de diversas interpretaciones. 2. – Deben depender de todas las observaciones de la serie, de lo contrario no seria una característica de la distribución. 3. – No deben tener un carácter matemático demasiado abstracto. 4. – Deben ser susceptibles de cálculo algebraico, rápido y fácil. SUMATORIA En esta unidad y en las siguientes se utilizaran sumas de muchos términos, por lo cual es necesario introducir una notación denominada sumatoria, para facilitar las sumas. La notación sumatoria implica el uso del símbolo∑, que no es otra cosa que la letra sigma mayúscula del alfabeto griego y que corresponde a la letra S de nuestro alfabeto. Siempre que se utilice el signo ∑ se leerá “suma de o sumatoria de “. Según, Leithold sumatoria se define así: . . . .. .. . . .. ), ( . ). 1 ( ..... ). 2 ( . ). 1 ( . ). ( n m y enteros son n y m donde n F n F m F m F m F F n m i i ≤ + − + + + + + + = ∑ = La ecuación de definición consiste de la suma de (n-m + 1) términos, donde el primer término se obtiene sustituyendo i por m en Fi, el segundo se obtiene remplazando i por (m+1) en Fi, y así sucesivamente, hasta alcanzar el último término al sustituir i por n en Fi . En la ecuación de sumatoria la letra m se le denomina límite inferior de la sumatoria y n se le llama límite superior de la sumatoria. El símbolo i se le denomina índice de la sumatoria. Ejemplos: 4 3 2 1 4 1 X X X X X i i + + + = ∑ = . Observe que las notaciones colocadas arriba y abajo del signo sumatoria indican que solo deben ser sumados sucesivamente las primeras cuatro observaciones. También puede darse el siguiente caso: 7 6 5 4 3 7 3 X X X X X X i i + + + + = ∑ = . Se puede observar que las notaciones colocadas arriba y abajo del signo sumatoria indican que solo deben ser sumados sucesivamente desde la tercera hasta la séptima observación. Generalmente, con el objeto de simplificar más aun las formulas que permiten utilizar el símbolo sigma, se pueden suprimir los subíndices, quedando el símbolo de sumatoria expresado de la siguiente manera: ∑ X. Esto se puede hacer cuando no hay ambigüedad al referirse a los diferentes valores que toma la variable X.
  85. PROPIEDADES DE LA SUMATORIA 1. – La sumatoria de la

    suma de dos o más términos, es igual a La suma de las sumatorias separadas de los términos. ( ) ∑ ∑ ∑ ∑ = = = = + + = + + n i i n i i n i i n i i i i Z Y X Z Y X 1 1 1 1 . 2. – L a sumatoria de la diferencia de dos o más términos, es igual a la diferencia de las sumatorias separadas de los términos. ( ) . 1 1 1 1 ∑ ∑ ∑ ∑ = = = = − − = − − n i i n i i n i i n i i i i Z Y X Z Y X 3 – La sumatoria de una constante multiplicada por una variable, es igual a la constante multiplicada por la sumatoria de la variable. . .. .. .. .. .. ... 1 1 cualquira constante una es K donde X K X K n i i i n i ∑ ∑ = = = 4. – La sumatoria de una constante es igual a la constante multiplicada por el número de casos que indique el límite superior de la sumatoria. . .. .. .. .. .. ., 1 cualquiera constante una es K donde nK K n i = ∑ = Cuando se trabaja con el término sumatoria es bueno recomendar lo siguiente: . . ... .,.. 1 1 1 2 1 1 2 ∑ ∑ ∑ ∑ ∑ = = = = = ≠ ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ≠ n i i n i i i n i i n i i n i i Y X Y X y X X Ejemplos: 1.- Resolver las siguientes sumatorias, tomando en cuenta que: { } 2 ,.. 1 ,.. 1 3 2 1 2 = = − = = X X X X i , c) 2 3 1 3 1 2 ).. ,... )... ⎥ ⎦ ⎤ ⎢ ⎣ ⎡∑ ∑ = = i i i i X b X a 2 3 2 2 ) 1 ( + ∑ = i i X a) . 6 4 1 1 ) 2 ( ) 1 ( ) 1 ( 2 2 2 3 1 2 = + + = + + − = ∑ = i i X b) [ ] [ ] . 4 ) 2 ( 2 1 1 ) 2 ( ) 1 ( ) 1 ( 2 2 2 2 3 1 = = + + − = + + − = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡∑ = i i X
  86. c) [ ] [ ] . 29 25 4 )

    5 ( ) 2 ( 1 ) 2 ( 1 ) 1 ( ) 1 ( 2 2 2 2 2 2 2 3 2 2 = + = + = + + + = + ∑ = i i X 2. – Exprese las siguientes operaciones utilizando la notación sumatoria: a) X1 + X2 + X3 +X4 . b) . ...... 2 2 7 2 6 2 5 n X X X X + + + + Estos problemas se resuelven así: . b) . ∑ = 4 1 )...... i i X a ∑ = n i i X 5 2 MEDIA ARITMÉTICA La media aritmética ( X ) o simplemente la media es el parámetro de posición de más importancia en las aplicaciones estadísticas. Se trata del valor medio de todos los valores que toma la variable estadística de una serie de datos. Por lo tanto, la medida posicional más utilizada en los estudios estadísticos viene a ser la media. Por su fácil cálculo e interpretación, es la medida de posición más conocida y más utilizada en los cálculos estadísticos. La media es el valor más representativo de la serie de valores, es el punto de equilibrio, es el centro de gravedad de la serie de datos. La media aritmética por lo general se le designa con X . La media aritmética de una serie de N valores de una variable X1 , X2 , X3 ; X4 ,.........Xn , es el cociente de dividir la sumatoria de todos los valores que toma la variable Xi, entre el número total de ellos. La formula se puede expresar así: N X X n 1 i i ∑ = = . Desviaciones o desvíos.- Son diferencias algebraicas entre cada valor de la serie o cada punto medio y la media aritmética de dicha serie, o un valor cualquiera tomado arbitrariamente. Los desvíos o desviación se designan con la letra di. Dado una serie de valores X1 , X2 , X3 , .......Xn , se llama desvío a la diferencia entre un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor indicado k de la serie corresponde precisamente a la media aritmética de esos valores dados, se dice entonces que los desvíos son con respecto a la media aritmética. En símbolo: ). ( X X d i i − = PROPIEDADES DE LA MEDIA ARITMÉTICA 1. – La suma de las desviaciones con respecto a la media aritmética es igual a cero. . 0 = ∑ i d 2. – La suma de las desviaciones al cuadrado de los diversos valores con respecto a la media aritmética es menor que la suma de las desviaciones al cuadrado de los
  87. diversos valores con respecto a cualquier punto K, que no

    sea la media aritmética. ( )2 ∑ − X X i < ( )2 ∑ − K X i . 3. – La media aritmética total o conjunta de dos o más serie de datos, se puede calcular en función de las medias aritméticas parciales y del número de datos de cada una de ellas, mediante la siguiente fórmula: , ....... ........ 3 3 2 2 1 1 3 3 2 2 1 1 k k k k t n X n X n X n X N X n X n X n X n X ∑ ∑ ∑ ∑ + + + = + + + + = Donde: en esta n1 , n2 , n3 y nk es el número de datos de cada serie. , ...... 3 2 1 k n n n n N + + + + = Además, son X y X X X k .,.. .. .,., .,.. ..,. 3 ., 2 1 las medias de cada una de las series. 4 – La media del producto de una constante por una variable, es igual al producto de la constante por la media de la variable. . X K N X K N KX X i i = = = ∑ ∑ 5 – La media de la suma de una constante más una variable, es igual a la media de la variable más la constante. 6 ( ) ( ) . K X n K n X n K X X i i K Xi + = + = + = ∑ ∑ ∑ + ., de la misma forma se cumple esta propiedad para la resta. CARACTERÍSTICAS PRINCIPALES DE LA MEDIA ARITMÉTICA 1. – El valor de la media depende de cada una de las medidas que forman la serie de datos, y se halla afectada excesivamente por los valores extremos de la serie de datos. 2. – La media se calcula con facilidad y es única para cada caso y permite representar mediante un solo valor la posición de la serie de valores. 3. – La media es una medida de posición que se calcula con todos los datos de la serie de valores y es susceptible de operaciones algebraicas. CÁLCULO DE LA MEDIA PARA DATOS NO AGRUPADOS Para calcular la media de datos no agrupados en clases se aplica la siguiente fórmula:
  88. N X X i ∑ = . En donde N

    es el número total de datos y son los valores de la variable. i X Ejemplo: 1. – Calcule la media aritmética de los siguientes valores: { } 14 .,. 11 ., 9 ,. 8 ,. 7 ,. 5 = i X . 9 6 54 6 14 11 9 8 7 5 N X X i = = + + + + + = = ∑ Por lo tanto la media es 9. CÁLCULO DE LA MEDIA PARA DATOS AGRUPADOS Cuando se construye una distribución de frecuencia, los datos se agrupan en clases definidas por unos límites. Cuando se trabaja con la distribución de frecuencia se parte del supuesto de que todos los datos comprendidos en un intervalo de clase se distribuyen uniformemente a lo largo de este, entonces se puede tomar la marca de clase o punto medio (X ) del intervalo como adecuada representación de los valores que conforman el mencionado intervalo. El punto medio se designa con la letra & X & . Para calcular la media en estas condiciones se pueden utilizar tres métodos: El método directo o largo y dos métodos abreviados. MÉTODO DIRECTO Este método se le conoce también como método largo; el mismo resulta demasiado engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase son muy grandes, debido a que los cálculos son demasiados extensos. Los pasos a seguir para calcular la media con este método son los siguientes: 1. – Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos medios de cada clase y se colocan en sus respectivas columnas, se determinan las frecuencias de cada clase y se ubican en sus respectivas columnas. 2. – Se multiplican los puntos medios de cada clase por sus respectivas frecuencias, luego se obtiene la sumatoria de las frecuencias (fi ) multiplicadas por el punto medio ( X & ) así: . i i X f & ∑ 3. – Luego se calcula la media aritmética aplicando la formula: N Donde N X f N f X f X i i i i .. ... ∑ ∑ ∑ = = = & & es igual al número total de datos. Ejemplo: 1.-Calcule la media de la siguiente distribución de frecuencia correspondiente al peso en Kg de un grupo de obreros. Realice los cálculos respectivos para completar el siguiente cuadro.
  89. CLASES i f 75-------79 20 80-------84 40 85-------89 60 90-------94

    100 95 ------99 140 = ∑ i f N =360 CLASES X & i f X f i & 75-------79 77 20 1540 80-------84 82 40 3280 85-------89 87 60 5220 90-------94 92 100 9200 95 ------99 97 140 13580 TOTAL = ∑ i f N =360 = ∑ i i X f & 32820 Aplicando la formula se tiene: . 17 . 91 360 32820 = = = ∑ N X f X i i & MÉTODOS ABREVIADOS Los métodos abreviados para calcular la media son preferibles en la mayoría de los casos, especialmente cuando el número de clases de las distribuciones de frecuencias son grandes. Es un método fácil de aplicar. Existe un método abreviado que se utiliza para cualquier tipo de distribución de frecuencia sin importar si tiene o no intervalos constantes de clase y hay otro que se utiliza solamente cuando en la distribución el intervalo de clase es constante, en esta cátedra se analizará el primero. Si se selecciona un punto medio ( X & ) de la distribución de frecuencia que sea diferente de la media aritmética de esa, entonces la suma algebraica de las desviaciones ( ) con respecto al valor seleccionado será diferente de cero. Si la suma algebraica de las desviaciones es dividida por el número de datos totales (N) de la serie y el cociente resultante es sumado al valor seleccionado, el resultado final será igual al de la media aritmética de la serie. Este método permite ahorrar una considerable cantidad de tiempo cuando en una serie de valores el conjunto de datos es grande. La media seleccionada arbitrariamente o media imaginaria se le designará con la letra A y los desvíos di vendrán a ser la desviación de cada valor de la serie con respecto a la media imaginaria A. La fórmula para este caso será: i d N d f A X o N A X f A X i i i i ∑ ∑ + = − + = .... ... ) ( &
  90. La fracción N d f i i ∑ se le

    denomina factor de corrección, A es la media arbitraria o supuesta. El factor de corrección, será positivo o negativo según que A sea menor o mayor que la media aritmética de la serie de valores. PASOS PARA APLICAR EL MÉTODO ABREVIADO 1. – Se organizan los datos de la serie en clases con sus respectivas frecuencias (fi), los mismos se colocan en columnas con sus respectivos puntos medios ( ). i X & 1. – Se escoge un punto medio cualquiera de la distribución, el cual será una media imaginaria que se le denominara A, esta deberá ser lo más central posible para que los cálculos se hagan más fácil, se calculan los di de los puntos medios de la distribución con respecto a esa media imaginaria, aplicando la formula: , los mismo se colocan en su columna respectiva. ) ( A X d i i − = & 3 – Sé efectúan los productos de cada clase y al final se calcula la sumatoria de estos productos aplicando la formula: i i d f i i d f ∑ . 4 – Finalmente se calcula la media aplicando la formula: N d f A X i i ∑ + = . 1.-Dada la siguiente distribución de frecuencia, correspondiente al peso en Kg de un grupo de obreros, calcule la media aritmética, aplicando el método abreviado.Realice los cálculos respectivos para completar el siguiente cuadro. CLASES i f 75------79 20 80------84 40 85------89 60 90------94 100 95------99 140 TOTAL N = 360 CLASES i X & i f ( di = − ) A X i & i i d f 75------79 77 20 87 – 77 = - 10 - 200 80------84 82 40 87 – 82 = - 5 - 200 85------89 87 60 87 – 87 = 0 0 90------94 92 100 87 – 92 = 5 500 95------99 97 140 87 – 97 = 10 1400 N = 360 1500 = ∑ i i d f En este caso se tomará como media arbitraria el punto medio, A = 87.0.
  91. Ahora se aplica la formula así: . 17 . 91

    360 1500 87 = + = + = ∑ N d f A X i i Como se puede observar la media obtenida es idéntica a la obtenida por el método largo. El estudiante puede realizar este problema utilizando cualquier punto medio de la distribución, se le deja como practica para que se ejercite con este método, siempre obtendrá el mismo resultado utilizando cualquiera media imaginaria diferente a la utilizada en la resolución de este problema. 2 – Calcule la media aritmética de la siguiente distribución aplicando el método abreviado. Realice los cálculos respectivos para completar el siguiente cuadro. CLASES i f 50------54 5 55-----59 10 60-----64 20 65-----69 40 70-----74 100 75-----79 38 80-----84 22 85-----89 9 90-----94 6 Totales N = 250 Para calcular la media en este caso sé escogió como media imaginaria A = 72, por ser este el punto medio más céntrico de la serie, se pudo haber tomado otro punto medio diferente de este y el resultado hubiese sido el mismo. Ahora se aplica la formula: CLASES i X & i f ( di = − ) A X i & i i d f 50------54 52 5 72 – 52 = - 20 - 100 55-----59 57 10 72 – 57 = -15 - 150 60-----64 62 20 72 – 62 = -10 - 200 65-----69 67 40 72 – 67 = -5 - 200 70-----74 72 100 72 – 72 = 0 0 75-----79 77 38 72 – 77 = 5 190 80-----84 82 22 72 – 82 = 10 220 85-----89 87 9 72 – 87 = 15 135 90-----94 92 6 72 – 92 = 20 120 TOTALES N = 250 15 = ∑ i i d f . 06 . 72 06 . 0 72 250 15 72 = + = + = + = ∑ N d f A X i i . El estudiante hará como ejercicio el cálculo de la media con los restantes puntos medios de la distribución de frecuencia. LA MEDIANA La mediana (Md) es una medida de posición que divide a la serie de valores en dos partes iguales, un cincuenta por ciento que es mayor o igual a esta y otro cincuenta por ciento que es menor o igual que ella. Es por lo tanto, un parámetro que está en el
  92. medio del ordenamiento o arreglo de los datos organizados, entonces,

    la mediana divide la distribución en una forma tal que a cada lado de la misma queda un número igual de datos. Para encontrar la mediana en una serie de datos no agrupados, lo primero que se hace es ordenar los datos en una forma creciente o decreciente y luego se ubica la posición que esta ocupa en esa serie de datos; para ello hay que determinar si la serie de datos es par o impar. Si el número N de datos es impar, entonces la posición de la mediana se determina por la formula: 2 1 N p Md + = , luego el número que se obtiene indica el lugar o posición que ocupa la mediana en la serie de valores, luego la mediana será el número que ocupe el lugar de lo posición encontrada. Para obtener la posición de la mediana en una serie de datos no agrupados, en donde el número N de datos es par, se aplica la formula 2 N PMd = El resultado obtenido, es la posición que ocupara la mediana, pero en este caso se ubica la posición de la mediana por ambos extremos de la serie de valores y los dos valores que se obtengan se le saca la media y esta será la mediana buscada, por lo tanto la mediana, en este caso, es un número que no se encuentra dentro de la serie de datos dados. Ejemplos: 1– Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los años de servicios de un grupo de trabajadores. Determine la mediana. Lo primero que se hace es ordenar los datos en forma creciente o decreciente; luego se aplica la formula 2 1 + = N PMd , para ubicar la posición de la mediana. Los datos ordenados quedaran así: 5, 6, 7, 8, 9, 10, 12. La posición . 4 2 1 7 = + = Md p Esto indica que la mediana ocupa la posición 4 en la serie de valores y por lo tanto esa posición corresponde a los números 8 y 9 que en este caso ocupan la posición por la izquierda y por la derecha, por lo tanto la Md viene a ser la semisuma de ambas posiciones ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ = + 5 . 8 2 9 8 en este caso 8.5 es la mediana buscad, y esto es así, ya que el número 8.5 divide la serie de valores en dos partes iguales, una mitad que es mayor que la mediana y otra mitad que es menor que esta. Cuando los valores de los datos brutos de un conjunto de datos se agrupan en una distribución de frecuencia de clase, cada valor pierde su identidad, por tal motivo la mediana obtenida de una distribución de frecuencia de datos puede no ser la misma que la mediana obtenida de los datos sin arreglar en clases, pero el resultado será una aproximación. Cuando se obtiene la mediana para datos agrupados se utiliza el método de interpolación. La interpolación parte del supuesto de que los datos de cada intervalo de la distribución están igualmente distribuidos. PASOS PARA DETERMINAR LA MEDIANA EN DATOS AGRUPADOS 1. – Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de clases, se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fa de esa distribución.
  93. 2. – Se determina la ubicación o posición de la

    mediana en el intervalo de la distribución de frecuencia, mediante la fórmula 2 N PMd = . El resultado obtenido determinará la clase donde se encuentra ubicada la mediana, lo cual se conseguirá en la clase donde la frecuencia acumulada Fa sea igual o superior a este resultado. Luego se aplica la formula: , 2 Ic fm Faa N Li Md ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + = en esta fórmula Md es la mediana, Li es el límite real inferior de la clase donde se encuentra ubicada la mediana, Faa es el valor de la frecuencia acumulada anterior a la clase donde se encuentra la mediana, fm es el valor de la frecuencia fi de la clase donde se encuentra la mediana, Ic es el valor o longitud del intervalo de clase y N es el número total de datos de la distribución en estudio. 1.- Dada la siguiente distribución de frecuencia referida a las horas extras laboradas por un grupo de obreros. Calcule la mediana. Realice los cálculos respectivos para completar el siguiente cuadro. N° de horas Extras Obreros CLASES fi 55------59 6 60------64 20 65------69 18 70------74 50 75------79 17 80------84 16 85------89 5 N = 132 Cuadro con las frecuencias acumuladas: N° de horas Extras Obreros Obreros CLASES fi fa 55------59 6 6 60------64 20 26 65------69 18 44 70------74 50 94 75------79 17 111 80------84 16 127 85------89 5 132 N = 132
  94. Ahora se aplica la formula: Ic fm Faa N Li

    Md ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + = 2 N = 132, , 66 2 132 2 N = = luego la mediana se encuentra en la clase 70----74, por lo tanto el limite real inferior de esa clase es 69.5 = Li. La frecuencia fi de esa clase es 50 = fm , Faa = 44 y el Ic = 5. Aplicando la formula se tiene: . 70 . 71 2 . 2 5 . 69 5 . 50 22 5 . 69 5 50 44 66 5 . 69 Md = + = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = Luego la mediana de esa distribución es 71.70. Esto quiere decir que un 50 % de los obreros trabajaron horas extras por debajo de 71.70 horas y el otro 50 % trabajaron horas extras por encima de 71.70 horas. CARACTERÍSTICAS DE LA MEDIANA * La mediana no es afectada por los valores extremos de una serie de valores, puesto que la misma no es calculada con todos los valores de la serie. * La mediana no está definida algebraicamente, ya que para su cálculo no intervienen todos los valores de la serie. * La mediana en algunos casos no se puede calcular exactamente y esto ocurre cuando en una serie de valores para datos no agrupados el número de datos es par, en este caso la mediana se calcula aproximadamente. * La mediana se puede calcular en aquellas distribuciones de frecuencia de clases abierta, siempre y cuando los elementos centrales puedan ser determinados. * La suma de los valores absolutos de las desviaciones de los datos individuales con respecto a la mediana siempre es mínima. LA MODA La moda es la medida de posición que indica la magnitud del valor que se presenta con más frecuencia en una serie de datos; es pues, el valor de la variable que más se repite en un conjunto de datos. De las medias de posición la moda es la que se determina con mayor facilidad, ya que se puede obtener por una simple observación de los datos en estudio, puesto que la moda es el dato que se observa con mayor frecuencia. La moda se designa con las letras Mo. En las representaciones gráficas la moda es el punto más alto de la gráfica. La obtención de la moda para datos agrupados no es un valor exacto, ya que varía con las diferentes formas de agrupar una distribución de frecuencia.
  95. En algunas distribuciones de frecuencias o serie de datos no

    agrupados o agrupados se presentan dos o más modas, en estos casa se habla de serie de datos bimodales o multimodales, según sea el caso. Estos tipos de distribuciones o series de valores se deben a la falta de homogeneidad de los datos. Cuando una serie de valores es simétrica, la media, la mediana y el modo coinciden, y si la asimetría de la serie es moderada, la mediana estará situada entre la media y el modo con una separación de un tercio entre ambas. Tomando en cuenta esta relación, cuando se tengan dos de esta medidas se puede determinar la tercera; sin embargo es conveniente utilizar esta relación para calcular solamente la moda ya que para calcular la media y la mediana existen formulas matemáticas que dan resultados más exactos; la fórmula matemática para calcular la moda por medio de la relación antes mencionada es: ( ) Md X X Mo − − = 3 Para calcular la moda en datos agrupados existen varios métodos; cada uno de los métodos puede dar un valor diferente de la moda: En este curso se dará un método el cual se puede considerar uno de los más precisos en el cálculo de esta. Es un método matemático que consiste en la interpolación mediante la siguiente fórmula: Ic Li Mo . 2 1 1 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ Δ + Δ Δ + = , en donde Mo es la moda, Li es el límite real de la clase que presenta el mayor número de frecuencia; la clase que presenta el mayor número de frecuencias fi se le denomina clase modal y a las frecuencias de esa clases se les denomina frecuencia modal fm, 1 Δ es la diferencia entre la frecuencia de la clase modal ( fm) y la frecuencia de la clase anterior a la modal, la cual se designa con fa , entonces, ; es la diferencia entre la frecuencia de la clase modal (fm) y la frecuencia de la clase siguiente a la modal, esta se designa con fs , entonces, ) ( 1 fa fm − = Δ ). ( 2 fs fm − = Δ 2 Δ 1. – Dada la siguiente distribución de frecuencia correspondiente al peso en Kg de un grupo de trabajadores de una empresa, calcule la moda. CLASES fi 30-----39 2 40-----49 2 50-----59 7 60-----69 11 70-----79 12 80-----89 16 90-----99 2 TOTAL La clase modal es 80----89, entonces Li = 79.5 y su fm = 16, fa = 12 y fs = 2, , entonces: 10 Ic = 14 2 16 f f ;.. 4 12 16 f f s m 2 1 a m 1 = − = − = Δ = − = Δ → − = Δ
  96. Aplicando la formula se tiene: . 71 . 81 22

    . 2 5 . 79 18 40 5 . 79 10 . 14 4 4 5 . 79 Mo L Mo 2 1 1 i = + = + = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + + = → ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ Δ + Δ Δ + = Este resultado de la moda se interpreta así: La mayoría de los trabajadores tiene un peso aproximadamente de 81.71 Kg. CARACTERÍSTICAS DE LA MODA * El valor de la moda puede ser afectado grandemente por el método de elaboración de los intervalos de clases. * El valor de la moda no se encuentra afectado por la magnitud de los valores extremos de una serie de valores, como sucede en la media aritmética. * La moda se puede obtener en una forma aproximada muy fácilmente, puesto que la obtención exacta es algo complicado. * La moda tiene poca utilidad en una distribución de frecuencia que no posea suficientes datos y que no ofrezcan una marcada tendencia central. * No es susceptible de operaciones algebraicas posteriores. * La moda se utiliza cuando se trabaja con escalas nominales aunque se puede utilizar con las otras escalas. * La moda es útil cuando se está interesado en tener una idea aproximada de la mayor concentración de una serie de datos. OTRAS MEDIDAS POSICIÓNALES Cuando se estudio la mediana se pudo detectar que esta divide la serie de valores en dos partes iguales, una generalización de esta medida da origen a unas nuevas medidas de posición denominadas: Cuartiles; Deciles y Percentiles. Estas nuevas medidas de posición surgen por la necesidad de requerir de otras medidas que expresen diferentes situaciones de orden, aparte de las señaladas por la mediana. Por lo tanto es interesante ubicar otras medidas que fraccionen una serie de datos en diferentes partes. Es bueno destacar que los cuarteles, los Deciles y los Percentiles son unas variantes de la mediana: De la misma forma los percentiles abarcan tanto a los cuarteles como a los Deciles. LOS CUARTILES.- Son medidas posiciónales que dividen la distribución de frecuencia en cuatro partes iguales. Se designa por el símbolo Qa en la que a corresponde a los valores 1, 2 y 3., que viene a ser el número de Qa que posee una distribución de frecuencia de clase. El Q1 divide la distribución de frecuencia en dos partes, una corresponde a 25 % que está por debajo de Q1 y el otro 75 % por encima de Q1 . El Q2 divide la distribución de frecuencia en dos partes iguales, un 50 % que está por debajo de los valores de Q2 y otro 50 % que está por encima del valor de Q2 . El Q2 es igual a la mediana.
  97. CÁLCULO DE LOS CUARTILES.- Para datos no agrupados no tiene

    ninguna utilidad práctica calcular los cuartiles. Para el cálculo de los cuartiles en datos agrupados en una distribución de frecuencia existe un método por análisis gráfico y otro por determinación numérica, por fines prácticos en esta cátedra se utilizara el último método. Para calcular los cuartiles por el método numérico se procede de la siguiente manera: 1 – Se localiza la posición del cuartil solicitado aplicando la formula de posición: 4 aN P Qa = , en donde a viene a ser el número del cuartil solicitado, N corresponde al número total de datos de la distribución y 4 corresponde al número de cuartiles que presenta una distribución de frecuencia. 2 – Luego se aplica la fórmula para determinar un cuartil determinado, así: . . 4 Ic fm Faa aN Li Q a ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + = En esta fórmula, Qa = El cuartil solicitado, en esta a corresponde al número del cuartil solicitado; Li = Limite real inferior de la clase donde se encuentra ubicado el cuartil; Faa = Frecuencia acumulada anterior a la clase donde se encuentra el cuartil; fm = Frecuencia fi que posee el intervalo de clase donde se encuentra el cuartil; 4 aN P Qa = = Posición que ocupa el cuartil en la distribución de frecuencia, este resultado obtenido determinará la clase donde se encuentra ubicado el cuartil, el mismo se encontrará en la clase donde la frecuencia acumulada Fa sea igual o superior a este resultado. DECILES. – Son medidas de posición que dividen la distribución de frecuencia en diez partes iguales y estas van desde el número uno hasta el número nueve. Los deciles se les designa con las letras Da , siendo a, el número de los diferentes deciles, que en este caso son nueve. El D2 es el punto debajo del cual se encuentran ubicados el 20 % de los valores de la distribución o también el punto por sobre el cual se encuentra el 80 % de los valores de la serie de datos. La mediana es igual al D5, puesto que este decil divide la distribución en dos partes iguale tal como lo hace la mediana, de la misma forma el decil cinco es igual al cuartil dos. CÁLCULO DE LOS DECILES – El cálculo de los deciles es similar al cálculo de los cuartiles, solo que en estos varía la posición, la misma se calcula con la formula: 10 aN P Da = , en esta a corresponde al número del decil que se desea calcular, N equivale al número de datos de la distribución y 10 corresponde a las diez partes en la que se divide la serie de valores de la distribución.
  98. La fórmula para su cálculo es: Ic fm Faa aN

    Li D a . 10 ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + = . En este caso se aplica la formula de la misma manera que se hizo para calcular los cuartiles, solo que en esta fórmula varia la posición de ubicación de la clase donde se encuentra ubicado el decil. LOS PERCENTILES – Son medidas posicióneles que dividen la distribución de frecuencia en 100 partes iguales. Con estos se puede calcular cualquier porcentaje de datos de la distribución de frecuencia. Los percentiles son las medidas más utilizadas para propósitos de ubicación de valor de una serie de datos ubicados en una distribución de frecuencia. El número de percentiles de una distribución de frecuencia es de 99. El percentil 50 es igual a la mediana, al decil 5 y al cuartil 2, es decir: por encima y 50 % por debajo de los datos de la distribución. % 50 . 50 5 2 = = = = P D Q Md El cálculo de los percentiles es similar al cálculo de los cuartiles y los deciles con una variante en la posición de ubicación de estos, que viene expresada por la siguiente fórmula: 100 aN P Pa = . Con esta posición se aplica la formula: Ic fm Faa aN Li P a . 100 ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ − + = . 1. – Dada la siguiente distribución correspondiente al salario semanal en dólares de un grupo de obreros de una empresa petrolera trasnacional. Calcule: a) Q1 , b) Q2 , c) Compare los resultados con la mediana D3 , d) D5 , e) P25 , f) P50 , g) P7 SALARIO EN $ fi Fa 200-----299 85 85 300-----399 90 175 400-----499 120 295 500-----599 70 365 600-----699 62 427 700-----799 36 463 Totales = N 463 a) Para calcular Q1, se determina primero la posición así: PQ1 = 115.75. Con ese valor de la posición encontrado se busca en las frecuencias acumuladas para ver cuál de esas contiene ese valor. Observando las frecuencias acumuladas se puede detectar que la posición 115.75 se encuentra en la clase 300- -----399, por lo tanto el Li = 299.5, fm = 90, y la Faa = 85 y Ic = 100, aplicando la formula se tiene:
  99. . 67 . 333 17 . 34 5 . 299

    90 3075 5 . 299 100 . 90 85 75 . 115 5 . 299 1 = + = + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = Q Este valor de Q1 indica que el 25 % de los obreros en estudio, devengan un salario semanal por debajo de 333.67 $ y el 75 % restante gana un salario por encima de 333.67 $. b) Para calcular Q2 =Md se determina primero la posición de este así. 5 . 231 4 463 2 2 = = x P Q , ahora se ubica esta posición en las frecuencias acumulados para determinar la posición de Q2 , se puede observar en la distribución que esta posición de Q2 esta ubicada en la clase 400----499, entonces, Li = 399.5, fm = 120, Faa = 175 y Ic = 100, aplicando la formula se tiene: . 58 . 446 08 . 47 5 . 399 120 5650 5 . 399 100 . 120 175 5 . 231 5 . 399 2 = + → + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = Q Este resultado de Q2 establece que el 50 % de los obreros de este estudio, devengan un salario semanal por debajo de 446.58 $ y el otro 50 % devenga un sueldo por encima de 446.58 $. Calcule la mediana y compárela con este resultado. c) Para determinar D3 = P30 hay primero que calcular la posición de este así: 9 . 138 10 463 3 3 = = x P D , ahora se ubica esta posición en las frecuencias acumuladas para determinar la posición de D3 , en la tabla de la distribución de frecuencia se observa que D3 se encuentra en la clase 300----399, luego, Li = 299.5, fm = 90, Faa = 85 y Ic = 100, aplicando la formula se tiene: 39 . 359 89 . 59 5 . 299 100 . 90 85 9 . 138 5 . 299 3 = + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = D . Esto indica que un 30 % de los obreros ganan un salario semanal por debajo de 359.39 $ y el 70 % restante devenga un sueldo por encima de 359.39 $. d) Calcular, D5 = Q2 = P50 , además P25 = Q1 , la comprobación de estos resultados se le deja como practica al estudiante. g) Para calcular P70 lo primero que se hace es determinar la posición, 10 . 324 ' 100 463 70 70 = = x P P . Ahora se ubica este resultado en la columna de frecuencias acumuladas para encontrar la posición de P70 en la distribución de frecuencia. Como se puede observar en la tabla de distribución de frecuencia, P70 se encuentra ubicado en la clase 500-------599, entonces, Li = 499.5, fm = 70, Faa = 295 y Ic = 100, aplicando la formula se tiene: . 07 . 541 57 . 41 5 . 499 70 2910 5 . 499 100 . 70 295 10 . 324 5 . 499 70 = + = + = ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = P
  100. Esto indica que el 70 % de los obreros devengan

    un sueldo semanal que esta por debajo de 541.07 $ y que el 30 % de los restantes obreros, ganan un salario por encima de 541.07 $. PORCENTAJES DE VALORES QUE ESTÁN POR DEBAJO O POR ENCIMA DE UN VALOR DETERMINADO Muchas veces necesitamos conocer el porcentaje de valores que están por debajo o por encima de un valor determinado; lo que representa un tipo de problema contrario al estudiado anteriormente, esto es, dado un cierto valor en el eje de abscisa (X) del plano cartesiano, determinar en la ordenada (Y) el tanto por ciento de valores inferiores y superiores al valor dado. Operación que se resuelve utilizando la siguiente fórmula matemática: N I L P f faa p c i i 100 ( ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = , donde: porcentaje p = que se quiere buscar. = P Valor dado en el eje de las X (valor que se ubica en las clases). = faa Frecuencia acumulada de la clase anterior a la clase donde se encuentra ubicado P. = i f Frecuencia de la clase donde se encuentra ubicada P. = i L Límite inferior de la clase donde se encuentra ubicada P. = c I Intervalo de clase. N = Número total de datos o total de frecuencias. EJEMPLO: Utilizando los datos de la distribución de frecuencia anterior, Determine que porcentaje de obreros ganan un salario semanal inferior a 450 $. Solución: Datos: ? = p = P 450 = faa 175 = i L 400 = c I 100 N = 463 Ahora se aplica la formula: N I L P f faa p c i i 100 ( ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = , Sustituyendo valores se tiene: 75 . 50 463 100 100 400 450 ( 120 175 = → ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − + = p p
  101. De acuerdo con el resultado se puede afirmar que el

    50.75 % de los obreros devengan un salario inferior a 450 $ y el 49.25 % de los obreros ganan un salario superior a 450 $. MEDIDAS DE DISPERSION (CAPÍTULO 3) OBJETIVO: Aplicar las caractersticas y propiedades de la desviacion tipica y la varianza como principales medidas de dispersión de una distribucion de frecuencia. CONTENIDOS: Descripcion de las caractersticas de la desviacion tipica, la varianza y los momentos estadisticos. Resolucion de problemas aplicando el Spss13.0. MEDIDAS DE DISPERSIÓN Las medidas de posición central son los valores que de una manera condensada representan una serie de datos, pero realmente no son suficientes para caracterizar una distribución de frecuencia. Para describir una distribución de frecuencia o serie de datos es necesario, por lo menos otra medida que indique la dispersión o variabilidad de los datos, es decir, su alejamiento de las medidas de posición central. Estas medidas de posición central no tienen ningún valor si no se conoce como se acercan o se alejan esos valores con respecto al promedio, en otras palabras es conocer como se dispersan o varían esos valores con respecto al promedio de una distribución de frecuencia. La dispersión o variabilidad se entiende como el hecho de que los valores de una serie difieran uno de otro, es decir, como se están dispersando o distribuyendo en la distribución. De acuerdo con esto es necesario encontrar una medida que indique hasta que punto los valores de una variable están dispersos en relación con el valor típico. Las medidas de variabilidad son números que expresan la forma en que los valores de una serie de datos cambian alrededor de una medida de posición central la cual por lo general es la media aritmética. La dispersión puede ser mayor o menor, tomando en cuenta esas diferencias. La variabilidad es la esencia de la estadística, puesto que las variables y atributos se caracterizan siempre por diferencias de valores entre observaciones individuales. Casi siempre en una distribución de frecuencia el promedio obtenido difiere de los datos de la serie; por esto es importante determinar el grado de variación o dispersión de los datos de una serie de valores con respecto al promedio. Las medidas de dispersión se clasifican en dos grandes grupos: a).- Las Medidas de Dispersión Absolutas y las Relativas; las Relativas, vienen expresadas en las mismas medidas que se identifican la serie de datos, las mismas son: 1).- El Recorrido, 2) La Desviación cuartilica, 3) La Desviación Semicuartilica, 4) La desviación Media, 5) La Desviación Típica o Estándar 6) La varianza. Las Medidas de Dispersión relativa. Son relaciones entre medidas de dispersión absolutas y medidas de tendencia central multiplicadas por 100, por lo tanto vienen expresadas en porcentaje, su función es la de encontrar entre varias distribuciones la
  102. dispersión existente entre ellas. La medida de dispersión relativa de

    mayor importancia es el Coeficiente de Variación. Se llama Variación o Dispersión de los datos, el grado en que los valores de una distribución o serie numérica tiende a acercarse o alejarse alrededor de un promedio. Cuando la dispersión es baja indica que la serie de valores es relativamente homogénea mientras que una variabilidad alta indica una serie de valores heterogénea. Cuando los valores observados de una serie están muy concentrados alrededor del promedio, se dice que ese promedio es o será muy representativo; pero si están muy dispersos con relación al promedio, es decir muy esparcidos con respecto al promedio, entonces ese promedio es poco representativo de la serie o distribución, puesto que no representan adecuadamente los datos individuales de esa distribución. Es importante obtener una medida que indique hasta qué punto las observaciones de una serie de valores están variando en relación con el valor típico de la serie. RANGO O RECORRIDO(R) -. Es la primera medida de dispersión, no esta relacionada con ningún promedio en particular, ya que este se relaciona con los datos mismos, puesto que su cálculo se determina restándole al dato mayor de una serie el dato menor de la misma, más una unidad de medida (UM). El rango es el número de variables diferentes que posee una serie de valores. Su formula se calcula así: Rango(R) = Dato mayor (XM )−Dato Menor (Xm ) + Una unidad de medida (1UM): R = XM − Xm + 1 UM. El rango es la medida de dispersión más sencilla e inexacta dentro de las medidas de dispersión absoluta. Esta medida tiene bastante uso en el control de calidad de los productos manufacturados. DESVIACIÓN ÍNTERCUARTILICA (DC). - La desviación íntercuartilica es la diferencia que existe entre el cuartil tres(Q3 ) y el cuartil uno(Q1 ) de una distribución de frecuencia y se expresa así: DC = Q3 − Q1 . DESVIACIÓN SEMI-ÍNTERCUARTILICA (DSC). - La desviación semi- íntercuartilica es la diferencia entre el Q3 y el Q1 dividido entre dos: 2 1 3 Q Q DSC − = . Si los valores de la DC o DSC son pequeños indica una alta concentración de los datos de la distribución en los valores centrales de la serie de datos. Estas medidas se utilizan para comparar los grados de variación de los valores centrales en diferentes distribuciones de frecuencias. Los mismos no son afectados por los valores extremos, no se adaptan a la manipulación algebraica, por tal motivo son de poco utilidad. DESVIACIÓN MEDIA.- La desviación media de un conjunto de N observaciones x1 , x2 , x3 ,.............xn , es el promedio de los valores absolutos de las desviaciones (di ) con respecto a la media aritmética o la mediana. Si se denomina como DM a la desviación media, entonces su fórmula matemática será la siguiente:
  103. N d N X X DM N i i N

    i i ∑ ∑ = = = − = 1 1 Esta fórmula es para datos no agrupados. Se toma el valor absoluto en la ecuación, debido a que la primera propiedad de la media aritmética establece que los desvíos (di ) de una serie con respecto a la media aritmética siempre son iguales a cero, es decir: di = 0. Cuando los datos están en una distribución de clases o agrupados se aplica la siguiente fórmula: N d f N f X X DM N 1 i i i N 1 i i i ∑ ∑ = = = − = & En esta fórmula X & es el punto medio de cada clase y fi es la frecuencia de cada clase. La Desviación Media a pesar de que para su cálculo se toman todas las observaciones de la serie, por el motivo de no tomar en cuenta los signos de las desviaciones (di ), es de difícil manejo algebraico. Su utilización en estadística es muy reducida o casi nula, su importancia es meramente histórica, ya que de esta fórmula es la que da origen a la desviación típica o estándar. DESVIACIÓN TÍPICA O ESTÁNDAR Es la medida de dispersión más utilizada en las investigaciones por ser la más estable de todas, ya que para su cálculo se utilizan todos los desvíos con respecto a la media aritmética de las observaciones, y además, se toman en cuenta los signos de esos desvíos. Se le designa con la letra castellana S cuando se trabaja con una muestra y con la letra griega minúscula σ (Sigma) cuando se trabaja con una población. Es importante destacar que cuando se hace referencia a la población él número de datos se expresa con N y cuando se refiere a la muestra él número de datos se expresa con n. La desviación típica se define como: “La raíz cuadrada positiva del promedio aritmético de los cuadrados de los desvíos de las observaciones con respecto a su media aritmética”. La desviación típica es una forma refinada de la desviación media”. Características de la Desviación Típica: * La desviación típica se calcula con cada uno de los valores de una serie de datos. * La desviación típica se calcula con respecto a la media aritmética de las observaciones de una serie de datos, y mide la variación alrededor de la media. * La desviación típica es susceptible de operaciones algebraicas, puesto que para su cálculo se utilizan los signos positivos y negativos de los desvíos de todas las observaciones de una serie de valores, por lo tanto es una medida completamente matemática. * Es una medida de bastante precisión, que se encarga de medir el promedio de la dispersión de las observaciones de una muestra estadística. Las influencias de las
  104. fluctuaciones del azar, al momento de seleccionar la muestra la

    afectan muy poco. Le da gran significación a la media aritmética de la serie de valores. * Es siempre una cantidad positiva. INTERPRETACIÓN DE LA DESVIACIÓN TÍPICA La desviación típica como medida absoluta de dispersión, es la que mejor nos proporciona la variación de los datos con respecto a la media aritmética, su valor se encuentra en relación directa con la dispersión de los datos, a mayor dispersión de ellos, mayor desviación típica, y a menor dispersión, menor desviación típica. Su mayor utilidad se presenta en una distribución normal, ya que en dicha distribución en el intervalo determinado por σ ± X se encuentra el 68. 27% de los datos de la serie; en el intervalo determinado por la σ 2 ± X se encuentra el 95,45% de los datos y entre la σ 3 ± X se encuentra la casi totalidad de los datos, es decir, el 99,73% de los datos; además, existe una regla general de gran utilidad para la comprobación de los cálculos que dice: “una oscilación igual a seis veces la σ , centrada en la media comprende aproximadamente el 99% de los datos”. Ver gráfica. 95,45% 99,73% 34,14% 34,14% 13,59% 13,59% 2,14% 2,14% Media 68,27% σ ± X A la zona limitada por la conoce bajo el nombre de zona normal, ya que se aen de na regla empírica indica que en cualquier distribución normal las probabilidades considera a los datos que c ntro de esa zona, datos normales en relación con el grupo estudiado; los datos que estén por encima o por debajo de dicho intervalo se consideran supranormales e infranormales. U delimitadas entre 1 desviación típica, 2 desviaciones típicas y 3 desviaciones típicas son el 68%, 95% y 99% respectivamente. Ver las graficas siguientes.
  105. Cálculo de la Desviación Típica.- La desviación típica para calcularla

    se procede de ). - Para datos no Agrupados.- Las formulas para determinar la desviación típica de dos formas: A).- Para datos no agrupados en clases, B). - Para datos agrupados en clases. A una S y de una σ son: 1 1 ) ( . . 1 2 2 − = − − = − ∑ ∑ n d n X X S i i 2 2 ) ( . . 2 X X d i i − = −
  106. ula para datos no agrupados y trata de una muestra

    se utilizará como denominador n−1, para corregir el sesgo, Típica en datos no agrupados: Xi , con respecto a la media la misma forma se elevan al cuadrado cada uno de los Xi y se calcula la oblación, según el caso. termine la desviación típica. Xi s importante recordar que cuando se trabaja con la form E se pero si en la muestra n ≥ 50 ,entonces se utilizará n, simplemente. Para caular la desviacián tipica de una poblacián para datos no agrupados, se utilizan las siguientes formulas: Método para calcular la Desviación * Se calcula la media aritmética. * Se calculan los desvíos (di ) de la serie de valores aritmética. * Se elevan al cuadrado cada una de las desviaciones (di )2 , y se determina la sumatoria de esos. De sumatoria de estos; de igual manera se calcula la sumatoria de los Xi y se elevan al cuadrado. Despues de hacer todos estos cálculos se elabora un cuadro estadístico con estos cálculos. * Finalmente se aplica la formula de la desviación típica para datos no agrupados de la muestra o de la p Ej.1 – Los siguientes valores corresponden a la edad de ñiños de una muestra tomada e una población: Xi = ⎨3, 4, 5, 6, 7⎬. De d ) 1 ( ) ( 1 ) ( . . 2 2 2 2 − − = − − = − ∑ ∑ ∑ ∑ n n X X N n n X X S i i i i 3 N d N X i ∑ = ) X i ∑ − = − 2 2 ( . . 4 σ 2 2 2 2 . . X N X N X N X i i i − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = − ∑ ∑ ∑ σ 5 5 25 = = = ∑X X i 5 n
  107. i i d ) X X ( = − 2

    d i 3 3 – 5 = - 2 4 4 4 – 5 = - 1 1 5 5 – 5 = 0 0 6 6 – 5 = 1 1 7 7 – 5 = 2 4 25 X i = ∑ 0 d i = ∑ 10 d i = ∑ Este problema se resolverá utilizando la media aritmética y sin utilizar la media, utilizarán las formulas 1 y 3. as 1 y 3 indican que en promedio, rando los datos como si fueran de una 58 . 1 5 . 2 4 10 1 . . 1 2 = = = − = − ∑ n d S i para ello se ( ) 58 . 1 20 50 ) 4 ( 5 625 135 ( 5 ) 1 ( . . 3 2 2 = = − = − − = − ∑ ∑ n n X X n S i i terpretación.- El resultado obtenido con las formul In las edades de los ñiños de esa muestra se desvian o varian con respecto a la media aritméticaen una cantidad igual a 1.58 años. i este problema se resuelve ahora, conside S población y se aplica la formula 4 y 5, entonces se tiene: . 41 . 1 2 5 10 . . 4 2 = = = = − ∑ N d i σ . 41 . 1 2 25 2 2 = = − ⎞ ⎛ 27 5 625 5 135 . . 5 = − = ⎟ ⎟ ⎠ ⎜ ⎜ ⎝ − = − ∑ ∑ N X N X i i σ 14 . 2 58 . 4 25 . 56 83 . 60 = = − =
  108. En la solución del problema con las formula 4 y

    5 de la población se observa que la σ de la población es menor que la S de la muestra, esto es debido a que la S de la muestra utilizó n-1, para corregir el error producto del sesgo, y la σ de la población no lo utilizó. 2 – Los años de sevicio de 6 obreros son 5, 5, 8, 7, 9, y 11, los mismos corresponde a una muestra tomada de una empresa. Cálcule la desviación típica (S y σ). Se calcula la media 5 . 7 6 45 6 11 9 8 7 5 5 = = + + + + + = X i X i i d ) X X ( = − 2 i d 2 i X 5 5 – 7.5 = - 2.5 6.25 25 5 5 – 7.5 = - 2.5 6.25 25 7 7 – 7.5 = - 0.5 0.25 49 8 8 – 7.5 = 0.5 0.25 64 9 9 – 7.5 = 1.5 2.25 81 11 11 – 7.5 = 3.5 12.25 121 ∑ Xi = 45 0 d i = ∑ 50 . 27 d i = ∑ 365 X2 i = ∑ Con esto datos se aplican las formulas 1, 4 y 5 para calcular la muestra, se deja la formula 3 para que sea aplicada por el participante, el resultado será igual al de la formula 1. Calculos: . 35 . 2 5 . 5 5 5 . 27 1 6 5 . 27 1 . . 1 2 = = = − = − = − ∑ n d S i Ahora se calculará la σ para la población (considerado los datos como de una poblacián). . 14 . 2 58 . 4 6 5 . 27 . . 4 2 = = = = − ∑ N d i σ
  109. . 14 . 2 58 . 4 36 2025 6

    365 6 45 6 365 N X N X . . 5 2 2 i 2 i = = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = σ − ∑ ∑ Interpretación.- El resultado obtenido al aplicar la formula 1, 2, 3, 4 y 5 indica que en promedio, los años de servicios de los trabajadores de la empresa se desvian o dispersan con respecto a su media aritmética en una cantidad igual a 2.35 año según la muestra y de 2.14 años en la poblacion. B) – Para datos Agrupados en Clases.- Para calcular la desviación típica en datos agrupado existen varios criterios en relacion a la corrección del sesgo que se produce al tomar una muestra, en este estudio se considerará la formula que corrige el sesgo de aquellas muestras en estudio; sin embargo, cuando n sea mayor que 50, no es necesario tal corrección. . Existen muchas formulas matemáticas para calcular la desvición típica, queda a juicio del estudiante utilizar la formula que él considere más fácil, siempre y cuando su aplicación sea valedera. B).- Formulas Para calcular la muestra y la población de una desviación típica con datos agrupados en clases: 1 1 ) ( . . 1 2 2 − = − − = − ∑ ∑ n f d n f X X S i i i i & ( ) 1 . . 2 2 2 − − = − ∑ ∑ n n f X f X S i i i i & & Para calcular la S de la formula 1 es necesario calcular el punto medio de cada una de las clases de la distribución, calcular la media aritmética y luego calcular los desvíos de los puntos medios con respecto a la media aritmética. En la formula 2 no es necesario calcular la media. En la formula 3, a X es un valor arbitrario que se toma de los de la distribución, es recomrndable que se escoja el lo más central posible para así facilitar los calculos posteriores. i X & i X & [ ] =→ − − − − = − ∑ ∑ 1 n n ) X X ( f ) X X ( f S . . 3 2 a i i 2 a i i & & ( ) 1 n n K f K f 2 i i 2 i i − − ∑ ∑
  110. El término Ki , en esta formula, viene a ser

    un desvío arbitrario con respecto a una mdia arbitraria . Entonces, a X ) X X ( K a i − = & . Este método para calcular S en datos agrupados, se fundamenta en la propiedad de la desviación típica que establece: “si a cada una de los valores de una serie de datos se le suma una constante, la desviación típica no se altera en sus resultados”. Método para calcular la Desviación Típica en datos Agrupados: * Se calcula la X * Se calcula el de cada una de las clases que integran la distribución de frecuencia, se determinan los desvíos di de los con respecto a la i X & i X & X , luego se elevan al cuadrado los di y se multiplican por fi, y se calcula la 2 i i d f ∑ . * Se calcula la , luego se determina la [∑ ]2. 2 i i X f & ∑ i i X f & * Se elabora un cuadro estadístico y se llevan a este todas los datos calculados. * Se aplica la formula necesaria para calcular la desviación típica. Ejemplos: 3 – Los siguientes datos corresponden a las horas extras trabajadas por los obreros de la empresa RINACA, en un mes (se resolverá considerando los datos como de una S y σ). N d f N X X f i i i i ∑ ∑ = − = − 2 2 ) ( . . 4 & σ 2 2 . . 5 X N X f i i − = − ∑ & σ 2 2 . . 6 ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = − ∑ ∑ N X f N X f i i i i & & σ ( ) N N K f K f N X f N ) X X ( f . . 7 2 i i 2 i i 2 i i 2 a i i ∑ ∑ ∑ ∑ − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − − = σ − & &
  111. CLASES fi i X & X f i & di

    = ( ) X X i − & 2 i i d f ( )2 i i X f & 40 — 44 1 42 42 - 15.26 232.87 1764 45 — 49 6 47 282 - 10.26 631.60 13254 50 — 54 21 52 1092 - 5.26 581.02 56784 55 — 59 75 57 4275 - 0.26 5.07 243675 60 — 64 23 62 1426 4.74 516.75 88412 65 — 69 7 67 469 9.74 664.07 31423 70 — 74 2 72 144 14.74 434.54 10368 135 i =7730 i X f & ∑ 82 . 1 d i − = ∑ ∑ 2 i i d f =3065.92 2 =445680 i i X f & ∑ Para resolver el problema lo primero que se debe hacer es calcular la media aritmética así: 26 . 57 135 7730 = = = ∑ n X f X i & Ahora se calculan los diferentes , para determinar los otro parámetros necesarios (es recomendable que el estudiante realice todos los cálculos) para resolver el problema planteado, en el cuadro de arriba se colocaron los cálculos realizados que son necesarios para resolver el mismo; este se resolverá aplicando las formulas 1, 2, y 3 de la S, considerando los datos como los de una muestra, ya que esta claro que estos pertenecen a una población determinada, luego se calculará la σ de la distribución aplicando: i X & 78 . 4 88 . 22 134 92 . 3065 1 135 92 . 3065 1 . 1 2 = = = − = − = − ∑ n d f S i i ( ) ( ) . 78 . 4 88 . 22 134 93 . 3065 1 135 135 7730 445680 1 . . 2 2 2 2 = = = − − = − − = − ∑ ∑ n n X f X f S i i i i & & Para aplicar la fórmula 3 se toma una media arbitraria a X que en este caso la más céntrica es 57, luego se calculan los desvíos de los puntos medios con respecto a la a X así:
  112. Ki = ( − i X & a X )

    se elabora un cuadro estadístico para resumir los datos y finalmente se procede a buscar la desviación. fi i X & ( − i X & a X ) =Ki fi . Ki fi (ki )2 1 42 - 15 - 15 225 6 47 - 10 - 60 600 21 52 - 5 - 105 525 75 57 0 0 0 23 62 5 115 575 7 67 10 70 700 2 72 15 30 450 135 = ∑ i f 35 = ∑ i i K f 3075 2 = ∑ i i K f ( ) ( ) = − = − = − ∑ ∑ 135 135 35 3075 . . 3 2 2 2 N N K f K f i i i i σ . 76 . 4 71 . 22 135 93 . 3065 135 07 . 9 3075 135 135 1225 3075 = = = − = − = Interpretación.- Los resultados obtenidos con las formulas 1, 2, y 3, indican que el promedio de las horas extras laboradas por los trabajadores se desvían o varían con respecto a su media aritmética en una cantidad igual a 4.78 y 4.76 respectivamente. La misma interpretación se obtiene con los resultados obtenidos con las formulas 4, 5 y 6. 76 . 4 71 . 22 135 92 . 3065 . . 4 2 = = = = − ∑ N d f i i σ . 76 . 4 71 , 22 62 . 3278 135 445680 . . 5 2 2 = = − = − = − ∑ X N X f i i & σ . 76 . 4 135 7730 135 445680 . . 6 2 2 2 = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = − ∑ ∑ N X f N X f i i i i & & σ
  113. La aplicación de la fórmula 7 se deja para que

    el participante la aplique y resuelva el mismo problema, el cual tendrá resultados idénticos a los anteriores. 1 – Los siguientes datos corresponden al número de panes consumidos por un grupo de familia de una urbanización de la ciudad, durante una semana determinada. Para resolver el problema se calcula la media y se procede a llenar el cuadro estadístico siguiente (el estudiante debe realizar los cálculos): Clases fi 30—32 10 33—35 18 36—38 60 39—41 100 42—44 80 45—47 14 48—50 6 ∑ 288 . 0 . 40 288 11520 = = = ∑ n X f X i i & Clases fi i X & i i X f & 2 i i X f & ( ) X X d i i − = & 2 i i d f 30—32 10 31 310 9610 -9 810 33—35 18 34 612 20808 -6 648 36—38 60 37 2220 82140 -3 540 39—41 100 40 4000 160000 0 0 42—44 80 43 3440 147920 3 720 45—47 14 46 644 29624 6 504 48—50 6 49 294 14404 9 486 ∑ 288 11520 464508 3708 = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − = − ∑ ∑ 2 2 2 1 288 11520 288 464508 . . 6 N X f N X f i i i & & σ . 59 . 3 88 . 12 1600 88 . 1612 = = − = . 59 . 3 92 . 12 287 3708 1 288 3708 1 . . 1 2 = = = − = − = − ∑ n d f S i i
  114. Interpretación.- Los resultados obtenido con las formulas 1 y 6

    indican que en promedio, el consumo de pan de trigo del grupo de familias de esa urbanización se dispersa con respecto a su media aritmética en una cantidad igual a 3.59. La aplicación de las formulas 2, 3, 4, 5 y 7 quedan como ejercicios de práctica para el participante, los resultados tienen que ser idénticos a los obtenidos con las formulas 1 y 6. Es muy importante que observe el resultado obtenido con la formula 1 para él cálculo de S y el obtenido con la formula 6 para calcular la σ, ambos resultados son idénticos, lo que indica que cuando la muestra es grande tanto la fórmula para calcular S como la utilizada para calcular la población produce al final el mismo resultado. Es importante señalar que expertos en la materia consideran que cuando las muestras son superiores a 50 datos el error de sesgo ya no se produce o es insignificante y en consecuencia no es necesario utilizar la formula que se encarga de corregir el mismo, por tal razón es conveniente utilizar n y no, n-1. VARIANZA – Es otra de las variaciones absolutas y la misma se define como el cuadrado de la desviación típica; viene expresada con las mismas letras de la desviación típica pero elevada al cuadrado, así S2 y σ2. Las formulas para calcular la varianza son las mismas utilizadas por la desviación típica, exceptuando las respectivas raíces, las cuales desaparecen al estar elevados el primer miembro al cuadrado. La varianza general de la población se expresa de la forma siguiente: . . . . .., ) ( . . 1 2 2 agrupados no datos para N X i ∑ − = − μ σ . . . ..,. ) ( . . 2 2 2 agrupados datos para N X f i i ∑ − = − μ σ & La varianza general de la muestra se expresa así: . . . . ..,. 1 ) ( . . 3 2 2 agrupados no datos para n X X S i − − = − ∑ . . . ..,. 1 ) ( . . 4 2 agrupados datos para n X X f S i i − − = − ∑ & La mayor utilidad de la varianza se presenta en la estadística inferencial.
  115. Propiedades de la Desviación Típica: 1 – La desviación típica

    de una constante k es cero. Si se parte de que la media aritmética de una constante es igual a la constante, esto es así, debida a que al ser todos los datos iguales no habrá dispersión en la serie de datos con respecto a la media aritmética, por lo tanto σ(k) = 0. 2 – Si a cada uno de los valores de una serie de variables se le suma o se le resta una constante K, la desviación típica no se altera. Esta se apoya en la propiedad de la media aritmética que establece “si a cada valor de la serie se le suma una constante, la media de la nueva serie es igual a la media de la serie original más la constante”, igual sucede con la resta, la nueva media vendrá disminuida en el valor de dicha constante. ) ( ) ( i i X K X σ σ = ± 3 – Si a cada uno de los términos de la serie de valores se le multiplica por una constante K, la desviación típica de la serie quedará multiplicada por K, y la nueva desviación típica será igual a la constante K tomada en valor absoluto por la desviación típica original. Esta propiedad se apoya en la propiedad del producto de la media aritmética . .. . ) ( i X K σ ) . ( i K X σ = 2 Para distribuciones normales siempre se cumple que: 68.27 % de los datos se encuentran en el intervalo ( X ± σ). 95.45 % de los datos se encuentran en el intervalo ( X ± 2σ). 99.73 % de los datos se encuentran en el intervalo ( X ± 3σ). Estos valores se cumplen con bastante aproximación, para distribuciones que son Normales y para las que son ligeramente asimétricas 5 – Para dos series de valores, de tamaño n1 y n2 , con variaciones S2 1 y S2 2 , respectivamente, la varianza combinada S2 T de ambas series será 2 1 2 2 2 2 1 1 2 n n S n S n S T + + = DISPERSIÓN RELATIVA. Las medidas de variabilidad, estudiadas hasta ahora, solo permitían medir las dispersiones absolutas de los términos de la muestra. Las medidas, tomadas en esas condiciones, serán de utilidad, solo cuando se trata de analizar una sola muestra; pero,
  116. cuando hay que establecer comparaciones entre distintas muestras, será necesario

    expresar tales medidas en valores relativos, que pueden ser proporciones o porcentajes. Las medidas de dispersión relativas permiten comparar grupos de series distintas en cuanto a su variación, independientemente de las unidades en que se midan las diferentes características en consideración. Generalmente las medidas de dispersión relativas se expresan en porcentajes, facilitando así el estudio con medidas procedentes de otras series de valores La dispersión relativa viene a ser igual a la dispersión absoluta dividida entre el promedio. Existen varias medidas de dispersión relativa, pero, la más usada es el coeficiente de variación de Pearson, este es un índice de variabilidad sin dimensiones, lo que permite la comparación entre diferentes distribuciones de frecuencias, medidas en diferentes unidades. El coeficiente de variación de Pearson se designa con las letras CV. La fórmula matemática es: . 100 x X CV σ = El CV pierde utilidad, cuando la σ es muy cercana a cero. Una serie de valores será más dispersa que otra respecto a su σ mientras que su CV sea mayor. 5 – La venta en el mercado de tres productos, varía de acuerdo al siguiente cuadro. Determine el CV de cada uno y diga cuál de ellos presenta mayor variación y cuál la menor. Producto X S Unidades CV 1 45 5 Bs. 11.11 % 2 450 40 Bs. 8.87 % 3 4500 350 Bs. 7.78 % Para resolver el problema se calcula el CV de cada producto y luego sé determina cuál presenta mayor o menor variación CV = Sx100/ X CV1 = 5x100/45 = 11.11 %. CV2 = 40x100/450 = 8.87 %. CV3 = 350x100/4500 = 7.78 %. Se puede observar que la menor dispersión la presenta el producto 3, por lo tanto, de los 3 productos el que menos varia es ese; por otro lado el de mayor dispersión o variabilidad es el producto 1.
  117. TEORÍA DE LOS MOMENTOS.- Los momentos son indicadores matemáticos de

    diversos valores. Los diversos valores, están es función del parámetro estadístico o valor que se tome, para ser fijado como punto de referencia. Sean X1 , X2 , X3 , ..........Xn , los valores que toma la variable Xi ; se define entonces, momento mi de orden r con respecto al promedio aritmético ( X ) de los valores de la variable Xi elevados a la potencia r; siendo r cualquier valor comprendido entre,1 , 2, 3,....,n. Matemáticamente: n d n ) X X ( m r i r i i ∑ ∑ = − = Los momentos se pueden definir también como las potencias de los desvíos di con respecto a un determinado valor, que puede ser la media aritmética, el origen cero o una media arbitraria. En estadística son importantes los momentos 1, 2, 3 y 4 con respecto a la media aritmética y el momento 1 con respecto al origen que viene a ser igual a la media aritmética Formulas para determinar los momentos con respecto a la media aritmética A) – Para datos no agrupados 0 ) ( . . 1 1 1 1 = = − = − ∑ ∑ n d n X X m i i 2 2 2 2 ) _ ( . . 2 S n d n X X m i i = = = − ∑ ∑ n d n X X m i i ∑ ∑ = − = − 3 3 3 ) ( . . 3 n d n X X m i i ∑ ∑ = − = − 4 4 4 ) ( . . 4 B) – Para datos agrupados
  118. 0 ) ( . . 1 1 1 1 =

    = − = − ∑ ∑ n d f n X X f m i i i i & 2 2 2 2 ) ( . . 2 S n d f n X X f m i i i i = = − = − ∑ ∑ & n d f n X X f m i i i i ∑ ∑ = − = − 3 3 3 ) ( . . 3 . & n d f n X X f m i i i i ∑ ∑ = − = − 4 4 4 ) ( . . 4 . & Descripción de los Momentos: 1. - El primer momento con respecto a la X es siempre igual a cero, este momento es similar a la primera propiedad de la X . 2. – El segundo momento con respecto a la X es siempre igual a la varianza. 3 – El tercer momento con respecto a la media aritmética se utiliza para determinar el coeficiente de asimetría SKm . 4– E l cuarto momento con respecto a la media aritmética es un valor que se utiliza para determinar el coeficiente de kurtosis, de una serie de valores. Formula de los momentos con respecto al origen cero: . . . . .,. ) 0 ( . . 5 1 1 agrupados no datos en X n X n X m i i = = − = − ∑ ∑ agrupados datos para X n X f n X f m i i i i . ,. .. ) 0 ( . . 6 1 1 = = − = − ∑ ∑ & & Procedimiento para Calcular los mi de una serie de datos: 1. – Se calcula la media aritmética. 2. – Se determinan los mi de los Xi y de los de la serie de valores con respecto a la media aritmética. i X & 3. – Se determinan las ∑di con respecto X para los datos no agrupados y la ∑fi di para los datos agrupados según el caso. 4. – Se elabora un cuadro estadístico con los datos calculados. 5. – Se aplican las formulas para calcular los momentos según el caso.
  119. 1. – Sean los siguientes datos los años de servicio

    de un grupo de trabajadores. Determine el m1 , m2 , m3 y m4 con respecto a la media aritmética. Solución.- Lo primero que se hace es calcular la X y luego se procede a calcular los d1 , d2 , d3 y d4 con respecto a la X después se aplica la fórmula para calcular los momentos de datos no agrupados. Xi (Xi - X ) = d1 (Xi - X )2 = d2 (Xi - X )3 = d3 (Xi - X )4 = d4 5 (5 – 8) = -3 9 -27 81 6 (6 – 8) = -2 4 -8 16 7 (7 – 8) = -1 1 -1 1 9 (9 – 8) = 1 1 1 1 13 (13 – 8) = 5 25 125 625 ∑Xi =40 ∑d = 0 ∑d2 = 40 ∑d3 =90 ∑d4 = 724 8 5 40 = = = ∑ n X X i . 0 5 0 ) ( 1 1 1 = = = − = ∑ ∑ n d n X X m i i 2 – La siguiente distribución de frecuencia corresponde al consumo de azúcar trimestral de un grupo de familias. Determine el m1 , m2 , m3 y el m4 con respecto a la media aritmética. CLASES fi 5 —7 5 8 —10 10 11 —13 15 14 —16 30 17 —19 15 20 —22 10 23 —25 5 ∑ 90 8 5 40 ) ( 2 2 2 = = = − = ∑ ∑ n d n X X m i i . 18 5 90 ) ( 3 3 3 = = = − = ∑ ∑ n d n X X m i i . 8 . 144 5 724 ) ( 4 4 4 = = = − = ∑ ∑ n d n X X m i i
  120. Solución.- Lo primero que se hace es elaborar un cuadro

    estadístico, luego se calcula la X y posteriormente se determinan los desvíos d1 , d2 , d3 y d4 con respecto a la media y finalmente con los datos obtenidos en el cuadro se aplica la fórmula para obtener los momentos en datos agrupados. CLASES fi i X & i i X f & fi . di fi .di fi .d2 fi .d3 fi .d4 5 —7 5 6 30 -9 -45 405 -3645 32805 8 —10 10 9 90 -6 -60 360 -2160 12960 11 —13 15 12 180 -3 -45 135 -405 1215 14 —16 30 15 450 0 0 0 0 0 17 —19 15 18 270 3 45 135 405 1215 20 —22 10 21 210 6 60 360 2160 12960 23 —25 5 24 120 9 45 405 3645 32805 ∑ 90 1350 0 0 1800 0 93960 . 0 . 15 90 1350 = = = ∑ n X f X i & . 0 90 0 ) ( 1 1 1 = = = − = ∑ ∑ n d f n X X f m i i i i & . 20 90 1800 ) ( 2 2 2 = = = − = ∑ ∑ n d f n X X f m i i i i & 0 90 0 ) ( 3 3 3 = = = − = ∑ ∑ n d f n X X f m i i i i & . 1044 90 93960 ) ( 4 4 4 = = = − = ∑ ∑ n d f n X X f m i i i i & 4.- La siguiente distribución de frecuencia corresponde al consumo de azúcar de un grupo de familias. Determine el m1 con respecto al origen.
  121. CLASES fi 5—7 5 8—10 10 11—13 15 14—16 30

    17—19 10 20—22 15 23—25 5 ∑ 90 Cuadro resumen CLASES fi i X & i i X X & & = − 0 i i X f & 5—7 5 6 6-0 = 6 30 8—10 10 9 9-0 = 9 90 11—13 15 12 12-0 =12 1 80 14—16 30 15 15-0 = 15 450 17—19 15 18 18-0 = 18 270 20—22 10 21 21-0 = 21 210 23—25 5 24 24-0 = 24 120 ∑ 90 1350 El momento m1 con respecto al origen cero (0), siempre es igual a la media aritmética. . 0 . 15 90 1350 ) 0 ( 1 1 = = = = − = ∑ ∑ X n X f n X f m i i i i & & Medidas de Asimetría y Kurtosis Simetría.- Según el Diccionario de la Real Academia Española es la “Regularidad en la disposición de las partes o puntos de un cuerpo o figura, de modo que posea un centro, un eje o un plano de referencia”. Es por lo tanto la armonía de posición de las partes o puntos similares uno respecto de otros y con referencia a puntos, líneas o planos determinados. Se puede generalizar diciendo que es una proporción de las partes entre sí y con el todo. En estadística se dice que una distribución de datos es simétrica si se le puede doblar a lo largo de un eje vertical de una manera tal que coincidan los dos lados de la distribución. Las distribuciones que no tienen simetría con respecto al eje vertical se les llama sesgada o asimétrica. Una distribución sesgada a la derecha tiene una cola prolongada del lado derecho de la distribución y una cola más corta del lado izquierdo de la misma; esta asimetría se le denomina positiva, cuando la cola de la distribución del lado izquierdo es más larga que la del lado derecho, entonces la asimetría es negativa.
  122. En una distribución simétrica la media, la mediana y la

    moda son iguales. La simetría se mide por medio del coeficiente de asimetría. Una distribución simétrica tiene un coeficiente de asimetría igual a cero. Cuando una distribución de frecuencia es asimétrica, la media, la mediana y la moda se alejan una de otra, es decir, las tres medidas de posición son diferente; mientras más se separe la media de la moda, mayor es la asimetría. Si la distribución de frecuencia es asimétricamente negativa, la cola de la curva de distribución se encuentra hacia los valores más pequeños de la escala de las X y si la distribución es asimétricamente positiva la cola de la distribución se ubica hacia los valores más grandes de la escala de las X. Karl Pearson un estudioso de la estadística designo el coeficiente de asimetría con las letras SK y determinó la fórmula para su cálculo, al cual se le denominó primer coeficiente de asimetría de Pearson S Mo X SK ) ( 1 − = Esta fórmula se puede transformar por medio de la relación: ( ) ( ) ( ). 3 3 3 Md X Mo X Md X X Mo Md X X Mo − = − → − − = − → − − = ( Md X Mo X − = − 3 ), si ahora se sustituye 3( X - Md) en el primer coeficiente de asimetría de Pearson, se tiene otro coeficiente de asimetría utilizando la mediana que se le denomina segundo coeficiente de asimetría de Pearson, este es más preciso que el primero S Md X SK ) ( 3 2 − = Arthur Bowley otro estudioso de la estadística determinó que el coeficiente de asimetría se podía calcular por medio de los cuartiles y utilizó el coeficiente de asimetría por medio de cuartiles (skq ), y la formula es 1 3 2 3 1 2 Q Q Q Q Q SK q − − + = En donde, Q1 , Q2 y Q3 son los cuartiles 1, 2 y 3 respectivamente. El valor de SKq varía entre 1 y −1; según Bowley una distribución de frecuencia con un coeficiente de asimetría igual a 0.1, se considera como ligeramente asimétrica y con un valor mayor 0.3 se le considera marcadamente asimétrica. El coeficiente de asimetría se puede calcular también en función de los momentos, siendo el momento m3 el parámetro utilizado para tal efecto. El coeficiente de asimetría según los momentos se designa con las letras SKm y sé calcula mediante la formula 3 3 S m SK m =
  123. En esta fórmula m3 es el momento tres con respecto

    a la media aritmética y S3 es la desviación típica elevada a la potencia tres. Este coeficiente es el más confiable de todos los antes descritos, asi que para cualquier cálculo se debería utilizar este, ya que es un parámetro que utiliza todos los datos de la serie de valores. Si en una serie de valores la X > Md > Mo, entonces la distribución de frecuencia presenta una curva asimétrica positiva; si la X =Md = Mo = 0 , la curva de la distribución es simétrica y si la distribución presenta una curva en la que el Mo > Md > X l , entonces se dice que la curva de la distribución asimétrica negativa. Sí la curva de una distribución de frecuencia es sesgada, la media tratara de ubicarse hacia el extremo o lado opuesto, de la serie de valores, donde se concentran los datos. Es bueno hacer referencia que en una asimetría positiva a > Md y en una asimetría negativa la X < X Md. Si en una distribución de frecuencia, los intervalos de las clases que la conforman presentan frecuencias balanceadas en cada uno de ellos y no presentan ninguna aglomeración especial en los extremos y, además, presenta una concentración de los datos en el centro de la distribución, entonces se dice que la distribución de frecuencia es simétrica. Cuando la curva de una distribución de datos es simétrica el SK = 0, esta es una de las características de la curva Normal o Campana de Gauss. Si la mayoría de los datos de una serie de valores están ubicados en el centro de la distribución y, además existe una dispersión medianamente hacia los extremos mayores o menores de las variables, entonces se afirma que la curva de la distribución es Ligeramente Asimétrica. Ejemplo CLASES 1 f1 CLASES 2 f2 3—5 5 3—5 8 6—8 10 6—8 12 9—11 25 9—11 20 12—14 40 12—14 40 15—17 20 15—17 25 18—20 12 18—20 10 21—23 8 21—23 5 TOTAL 120 TOTAL 120 En este ejemplo la distribución 1 es ligeramente asimétrica positiva y la distribución 2 es ligeramente asimétrica negativa. La mayoría de las distribuciones de casos reales por lo general son ligeramente asimétricas. Una distribución de datos es marcadamente asimétrica si la mayoría de los datos de la misma se encuentran ubicados en los extremos mayores o menores de las variables que conforman la distribución. Si la mayoría de los de los datos de una serie de valores se encuentra situados en el extremo de las clases menores de la distribución, entonces la
  124. curva de la distribución de frecuencia presenta una asimetría positiva,

    siendo en este caso el SK > 0; y si por el contrario esa mayoría se encuentra en los extremos de las clases mayores de las variables, entonces la serie de valores presenta una curva con una asimetría negativa, luego el Coeficiente de asimetría será mayor que cero, es decir, SK>0 Ejemplos: CLASES 3 f3 CLASES 4 f4 3—5 15 3—5 5 6—8 25 6—8 10 9—11 40 9—11 15 12—14 60 12—14 60 15—17 15 15—17 40 18—20 10 18—20 25 21—23 5 21—23 15 TOTAL 170 TOTAL 170 En la distribución 3 los datos presentan una curva marcadamente asimétrica positiva y el caso 4 la curva de la distribución es marcadamente asimétrica negativa. Existen distribuciones de frecuencias que presentan curvas fuertemente marcadamente asimétricas y otras que las curvas son ligeramente asimétricas. Considerar la asimetría de una curva de frecuencia marcadamente o ligeramente asimétrica, es un asunto de criterio del investigador, puesto que no existen reglas rígidas establecidas que determinen las líneas divisorias o parámetros entre ligeramente o marcadamente asimétrica; Sin embargo cuando la mayoría de los datos de una distribución de frecuencia se ubican en los extremos mayores o menores de las variables se puede afirmar con certeza que la curva de la distribución es marcadamente asimétrica. Algunos investigadores como Arthur Bowley determinaron que si se aplica el SKq y ese coeficiente de asimetría obtenido es menor que 0.3 (sin considera el signo) se puede afirmar que la curva de la distribución es ligeramente asimétrica, en caso contrario la curva de la distribución sería marcadamente asimétrica. Otros investigadores utilizan el coeficiente de asimetría según los momentos (SKm ) para tales efectos, pero no existe criterio en cual ha de ser el coeficiente especifico que marque él límite entre ligera y marcadamente. Sin embargo, en este estudio se considerará que un coeficiente de asimetría según los momentos comprendido entre − 0.30 ≤ SKm ≤ 0.30, sería un buen límite para considerar una curva de distribución como ligeramente asimétrica, de lo contrario sería marcadamente asimétrica. El SKm es el coeficiente de asimetría de mayor precisión y confiabilidad, puesto que este, utiliza para su cálculo todos los valores de la serie de datos. Es bueno afirmar que cuando el coeficiente de asimetría de una curva de distribución es marcadamente asimétrico no se puede utilizar la media aritmética como medida de tendencia central, puesto que esta es afectada altamente por los valores extremos de una serie de datos, en su lugar es recomendable utilizar la mediana como medida de posición.
  125. KURTOSIS8 (CURTOSIS).- Es el grado de apuntamiento o altura de

    la curva de una distribución de frecuencia. La finalidad de la Kurtosis es determinar si la distribución de los términos de una serie de valores responde a una curva normal o no. Se utiliza para observar el promedio o posición de la distribución, así como la media, la mediana y la moda, se puede en esta observar la asimetría, el grado de concentración de los datos, en fin, para observar en forma general el comportamiento de una serie de datos en una distribución de frecuencia. Por medio de la Kurtosis se determinará si la distribución de frecuencia es demasiado puntiaguda, normal o muy achatada. El grado de apuntamiento o altura de una curva de distribución se determina por medio del coeficiente de Kurtosis, el cual se calcula utilizando el momento cuatro de una serie de valores con respecto a su media aritmética. La Kurtosis se designa con la letra K4 y la fórmula de cálculo es: 4 4 4 S m K = En esta fórmula m4 es el momento cuatro con respecto a la media aritmética y S4 es la desviación típica elevada a la cuarta potencia, K4 es el coeficiente de Kurtosis. Tomando en cuenta la Kurtosis el k4 de una curva de distribución puede ser: Mesocurtica, Platicurtica y Leptocurtica. Mesocurticas.- Es aquella curva de una distribución de frecuencia que no es ni muy alta ni muy achatada, es la llamada curva normal. La curva Mesocurtica tiene un coeficiente de Kurtosis igual a tres, es decir, K4 = 3. Leptocurtica.- Es aquella curva de la distribución que presenta un apuntamiento o altura relativamente más alta que la curva Mesocurtica, en esta los datos se encuentran más concentrados alrededor del máximo valor. El coeficiente de Kurtosis para curva Leptocurtica es mayor de tres, es decir, K4 > 3. Platicurtica.- Es la curva de una distribución de frecuencia que presenta un achatamiento más pronunciado que la Mesocurtica, encontrándose los datos más dispersos alrededor del máximo valor de la distribución. En esta curva el coeficiente de Kurtosis es menor de tres, es decir, K4 < 3. En la gráfica 1 de Kurtosis se pueden observar los tres tipos de Kurtosis antes descritos, siendo la primera curva Platicurtica (azul), la segunda Mesocurtica (roja) y la última es Leptocurtica(amarilla):
  126. GRAFICO I Problemas Relacionados con la asimetría y la (Kurtosis)

    curtosis 1 – En la siguiente distribución de frecuencia, determine el coeficiente de asimetría utilizando los métodos de Pearson, de Bowley y el de los momentos, interprete los resultados y haga un análisis de los diferentes resultados y diga cuál es el resultado más recomendado en este caso; encuentre la Kurtosis e interprete los resultados. KURTOSIS 1° PLATIKURTICA 2° MESOKURTICA 3° LEPTOKURTICA CLASES fi 10—12 1 13—15 5 16—18 15 19—21 40 22—24 15 25—27 10 28---30 9 ∑ 95
  127. Solución.- Para resolver el problema lo primero que hay que

    hacer es calcular la X y determinar los desvíos di con respecto a la media, luego se elabora un cuadro estadístico con el resumen de los cálculos necesarios para determinar la asimetría y la curtosis. Además, se tendrá que calcular la mediana, la moda, el Q1 el Q3 , y después de realizar todos esos cálculos se procede a buscar la asimetría y la curtosis con las formulas respectivas. En el siguiente cuadro se encuentran resumidos la mayoría de los cálculos necesarios, el resto se calcularan aparte. CLASES fi i X & i i X f & di fi. di fi .d2 fi .d3 fi .d4 10—12 1 11 11 -10.07 -10.07 101.40 -1021.15 10282.95 13—15 5 14 70 -7.07 -35.35 249.92 -1766.97 12492.45 16—18 15 17 255 -4.07 -61.05 248.47 -1011.29 4115.94 19—21 40 20 800 -1.07 -42.80 45.80 -49.00 52.43 22—24 15 23 345 1.93 28.95 55.87 107.84 208.12 25—27 10 26 260 4.93 49.30 243.05 1198.23 5907.28 28---30 9 29 261 7.93 71.37 565.96 4488.10 35590.60 ∑ 95 2002 0.38 1510.40 1945.76 68649.77 Se recomienda al participante que debe realizar los cálculos de los parámetros que solo aparecen sus resultados X = 21.07, Mo = 20.0, Q1 = 18.71, Q2 = Md = 20.49, Q3 = 23.55, S = 4.41, S2 = 19.46, S3 = 85.82, S4 = 378,82. 27 . 0 99 . 3 07 . 1 99 . 3 0 . 20 07 . 21 1 = = − = − = S Mo X SK El resultado indica que la curva de distribución es ligeramente asimétrica positiva. 44 . 0 99 . 3 74 . 1 99 . 3 ) 49 . 20 07 . 21 ( 3 ) ( 3 2 = = − = − = S Md X SK El resultado indica que la curva de la distribución es marcadamente asimétrica positiva. . 26 . 84 . 4 28 . 1 71 . 18 55 . 23 ) 49 . 20 ( 2 55 . 23 71 . 18 2 1 3 2 2 1 o Q Q Q Q Q SK q = = − − + = − − + = El resultado indica que la curva es ligeramente asimétrica positiva. Para calcular el coeficiente de asimetría según los SKm se cálcula primero el m3 así:
  128. 48 . 20 95 76 . 1945 3 3 =

    = = ∑ n d f m i i 32 . 0 40 . 63 48 . 20 3 3 = = = S m SK m El coeficiente SKm indica que la curva de la distribución es marcadamente asimétrica positiva. Si se observan los diferentes coeficientes de asimetría se puede notar que el SK2 y el SKm son marcadamente asimétricos y los otros son ligeramente asimétricos, esto es así por cuanto él valor obtenido con el SK2 y el SKm son más precisos que los otros, lo que indica que se debe preferir el resultado de estos últimos por razones obvias. Siempre el SKm será más preciso que cualquier otro coeficiente de asimetría, ¿Por qué? Los resultados obtenidos con los diferentes coeficientes de asimetría indican que esta es positiva, es decir, con un sesgo hacia la cola de la derecha. Para calcular el K4 se calcula el m4 así: 63 . 722 95 77 . 68649 4 4 = = = ∑ n d f m i i Ahora se procede a calcular el K4 aplicando la formula . 86 . 2 8 . 252 63 . 722 4 4 4 = = = S m K El resultado indica que el apuntamiento de la curva es achatado, esto se observa en el grafico 2 la primera curva (de color verde), es decir, la curva es platicurtica. Observe la gráfica 1 donde se puede ver la curva normal (de color rojo) y se puede observar la kurtosis y la simetría. La asimetría positiva se puede observar en la parte derecha de la gráfica. GRAFICO 2
  129. 2.- En la siguiente distribución de frecuencia determine el SK1

    , SK2 , SKq y el skm, interprete los resultados y diga cual es el más recomendado; encuentre la curtosis e interprete el resultado. CLASES fi 10—12 9 13—15 10 16—18 15 19—21 40 22—24 15 25—27 5 28—30 1 ∑ 95 Solución.- Para resolver este problema se debe calcular la X y los desvíos di con respecto a esta, también es necesario calcular la Md, el Mo, el Q1 , el Q3 , la S, el m3 , el m4 , elaborar un cuadro estadístico y finalmente aplicar las formulas respectivas. En el siguiente cuadro se resumen los cálculos para tales efectos. Se recomienda al estudiante realizar todos los cálculos pertinentes.
  130. CLASES fi i X & i i X f &

    di fi .di fi .d2 f i . d 3 fi .d4 10—12 9 11 99 -7.93 -71.37 565.96 - 4 4 8 8 . 1 0 35590.60 13—15 10 14 140 -4.93 -49.30 243.05 - 1 1 9 8 . 2 3 5907.28 16—18 15 17 255 -1.93 -28.95 55.87 - 1 0 7 . 8 4 208.12 19—21 40 20 800 1.07 42.80 45.80 4 9 . 0 0 52.43 22—24 15 23 345 4.07 61.05 248.47 1 0 1 1 . 2 9 4115.94 25—27 5 26 130 7.07 35.35 249.92 1 7 6 6 . 9 7 12492.45 28—30 1 29 29 10.07 10.07 101.40 1 0 2 1 . 1 5 10282.95 ∑ 95 1798 -0.35 1510.47 - 1 9 4 5 . 7 6 68649.77 Los resultados obtenidos de los diferentes cálculos son: X = 18.93, Mo = 20.0, Q1 = 16.45, Q2 = Md = 19.91. S = 3.99, S3 = 63.40, S4 = 252.80, m3 = −20.48, m4 = 722.63 Ahora se procederá a calcular los diferentes coeficientes de asimetría así: 27 . 0 99 . 3 07 . 1 99 . 3 0 . 20 93 . 18 1 − = − = − = − = S Mo X SK Si observa puede ver que este problema es casi idéntico al anterior, solo las frecuencias fueron cambiadas de la parte alta de las variables hacia la parte baja de las mismas, por tal razón todos sus cálculos son idénticos en valor absoluto al anterior, lo que indica que ahora la asimetrías obtenidas es negativas, es decir, con sesgo hacia la . 44 . 0 99 . 3 74 . 1 ) 51 . − = − = 99 , 3 19 93 . 18 ( 3 ) ( 3 2 − = − = S Md X SK 32 . 0 40 . 63 48 . 20 3 3 − = − = = S m SK m 26 . 0 84 . 4 28 . 1 − = − 45 . 16 29 . 21 ) 51 . 19 ( 2 29 . 21 45 . 16 2 1 3 2 3 1 = − − + = − − + = Q Q Q Q Q SK q
  131. izquierda; si observa la gráfica 3 de asimetría y Kurtosis

    podrá notar las variaciones que hay en ambas curvas. La Kurtosis es idéntica a la anterior y la simetría tiene un sesgo a la izquierda, es decir, asimetría negativa. Para calcular la Kurtosis se procede así: . 86 . 2 80 . 252 63 . 722 4 4 4 = = = S m K La curva de la distribución es platikurtica. La interpretación es idéntica a la del problema anterior. Se puede ver que la curva más alta es la normal (roja) o Mesocurtica y la más achatada es la curva de la distribución en estudio, y en este caso es platikurtica. GRAFICO KURTOSIS Y ASIMETRÍA 0 10 20 30 40 50 60 1i ASIMETRIA - 9 10 15 40 15 5 1 CURA NORMAL 1 5 15 50 15 5 1 11 14 17 20 23 26 29
  132. 3.- Dada la siguiente distribución de frecuencia determine el SK1

    , SK2 , SKq , SKm e intérprete los resultados y diga cuál de esos coeficientes es el más recomendado para este caso; calcule el K4 e intérprete su resultado. CLASES fi 10—14 5 15—19 10 20—24 25 25—29 60 30—34 25 35—39 10 40—44 5 ∑ 140 Solución.- Para resolver el problema primeramente se debe calcular la X , los desvíos di con respecto a la X , la Md, el Mo, el Q1, el Q2, la S, el m3 , el m4 . Para trabajar mejor se debe elaborar un cuadro estadístico con todos los cálculos necesarios para resolver el problema. Se recomienda al estudiante realizar todos los cálculos. Los siguientes son los diferentes cálculos necesarios para resolver el problema. Se recomienda al participante efectuar los diferentes cálculos de todos los parámetros utilizados. X = 27.00, Mo = 27.00, Q1 = 23.50, Q2 = Md = 27.00. Q3 = 30.50, S = 6.27, S3 = 246.24, S4 = 1543.37, m3 = 0, m4 = 5267.86. CLASES fi i X & i i X f & di fi .di fi .d2 fi .d3 fi .d4 10—14 5 12 60 -15 -75 1125 -16875 253125 15—19 10 17 170 -10 -100- 1000 -10000 100000 20—24 25 22 550 -5 -125 625 -3125 15625 25—29 60 27 1620 0 0 0 0 0 30—34 25 32 800 5 125 625 3125 15625 35—39 10 37 370 10 100 1000 10000 100000 40—44 5 42 210 15 75 1125 16875 253125 ∑ 140 3780 0 5500 0 736500
  133. 0 . 0 27 . 6 0 . 0 27

    . 6 0 . 27 0 . 27 1 = = − = − = S Mo X SK 0 . 0 27 . 6 27 . 6 2 = 0 . 0 0 . 27 0 . 27 ( 3 ) ( 3 = − = − = S Md X SK 0 . 0 . 7 0 . 0 5 . 23 5 . 30 0 . 54 5 . 30 5 . 23 2 1 3 2 3 1 = = − − + = − − + = Q Q Q Q Q SK q 0 . 0 24 . 246 0 . 0 m 3 3 = = = S SK m El resultado obtenido con los diferentes coeficientes de asimetría indica que la curva de la distribución es simétrica. Se puede observar que cuando una curva de distribución es simétrica, con todos los métodos se logra el mismo resultado, cualquiera de ellos es valedero, pero si se tuviese que escoger uno en especial el más recomendado seria el SKm , ya que para su cálculo toma en cuenta todos los datos de la serie de valores. Para él cálculo de la Kurtosis se procede así: . 41 . 3 37 . 1543 86 . 5267 4 4 4 = = = S m K El resultado indica que la curva de la distribución de frecuencia es leptocurtica (Roja), es decir, la gran mayoría de los datos se encuentran ubicados alrededor de las medidas de tendencia central, además, la curva de la serie de valores es más alta que la curva normal (Azul). Observe que la gráfica de la curva leptokurtica, es más alta que la otra curva la normal. De la misma forma se puede observar que ambas curvas son simétricas, es decir, parten del mismo punto y no presentan sesgo en todo su recorrido y esto es así debido a que su coeficiente de asimetría es igual a cero. Lo único que varía entre ellas es la Kurtosis.
  134. CURVA LEPTOKURTICA 0 10 20 30 40 50 60 70

    12 17 22 27 32 37 42 1 CURVA NORMAL 2 CURVA LEPTOKURTICA 2 – Dada la siguiente distribución de frecuencia determine el SK1 , el SK2 , el SKq , el SKm , haga un análisis cada uno de estos y diga cuál es el más recomendado, tomando en cuenta la precisión de cada uno. Determine, además, el K4 e interprete el resultado. Se desea tomar una medida de posición central, ¿cuál sería la más adecuada? CLASES fi 40—44 2 45—49 7 50—54 23 55—59 75 60—64 21 65—69 6 70—74 1 ∑ 135 Solución.- Para resolver el problema se debe calcular primero la X luego se determinan los desvíos con respecto a la X , se calcula la Md, el Mo., el Q1 , el Q3 , la S, el m3 y el m4 . Para facilitar el estudio es conveniente elaborar un cuadro estadístico con todos los parámetros necesarios. En el siguiente cuadro se resumen gran parte los parámetros necesarios para resolver el problema.
  135. CLASES fi i X & i i X f &

    di fi .di fi .d2 fi .d3 fi .d4 40—44 2 42 84 -14.74 -29.84 434.54 -6405.05 94410.42 45—49 7 47 329 -9.74 -68.18 664.07 -6468.07 62999.03 50—54 23 52 1196 -4.74 -109.02 516.75 -2449.42 11610.24 55—59 75 57 4275 0.26 19.50 5.07 1.32 0.34 60—64 21 62 1302 5.26 110.46 581.02 3056.16 16075.42 65—69 6 67 402 10.26 61.56 631.60 6480.27 66487.60 70—74 1 72 72 15.26 15.26 232.87 3553.56 54227.32 ∑ 135 7660 -0.26 3065.92 -2231.23 305810.37 Se recomienda al participante realizar los cálculos de los parámetros aquí utilizados: X = 56.74, Md = 56.87, Mo = 56.95, Q1 = 54.62, Q3 = 59.12, S = 4.76, S3 = 108.23, S4 = 515.77, m3 =-16.53, m4 = 2265.26. . 04 . 0 76 . 4 21 . 0 76 . 4 95 . 56 74 . 56 )........ 1 − = − = − = − = S Mo X SK a Este coeficiente indica que la curva de la distribución es ligeramente asimétrica positiva. Con este resultado se observa que la curva de la serie de valores es casi simétrica. . 10 . 0 76 . 4 ) 16 . 0 ( 3 76 . 4 ) 8 . 56 74 . 56 ( 3 ) ( 3 )....... 2 − = − = − = − = S Md X SK b Se puede observar que este resultado es un poco mayor que el obtenido con SK1; la curva de acuerdo con este, es ligeramente asimétrica positiva. . 0 . 0 5 . 4 62 . 54 12 . 59 )..... 1 3 2 3 1 = = − 0 . 0 ) 87 . 56 ( 2 12 . 59 62 . 54 2 − + = − = Q Q SK c q − + Q Q Q
  136. Con este coeficiente se observa que la curva es simétrica

    ya que su coeficiente de asimetría es igual a cero. Se puede concluir que este coeficiente no es lo suficiente preciso, puesto que esa curva de distribución no es simétrica, como se puede observar en la distribución de la serie de valores. 15 . 0 23 . 108 53 . 16 )..... 3 3 − = − = = S m SK d m Este resultado indica que la curva de la distribución es ligeramente asimétrica negativa, este es bastante parecido al obtenido con el SK2 , los cuales se acercan bastante a la realidad, por lo tanto, el resultado más recomendado para tomar una decisión seria el SKm , por cuanto en el cálculo del mismo intervienen todos los valores de la serie de datos. Se pudo detectar que en el orden de prioridades referente al coeficiente de asimetría los más indicados serian el SKm , luego el SK2 y el menos recomendado seria el SKq por no adaptarse a la realidad. Para calcular el K4 se procede de la siguiente manera: . 39 . 4 95 . 515 26 . 2265 4 4 4 = = = S m K De acuerdo con este resultado la curva de la distribución es Leptocurtica, por ser mayor que el coeficiente de Kurtosis de la curva normal. Este resultado indica que la mayoría de los datos se encuentran ubicados alrededor de la moda y por lo tanto la curva en cuestión presenta un apuntamiento bastante alto. La medida de posición central más adecuada es la media aritmética puesto que en este caso no es afectada por valores extremos por ser la curva de distribución ligeramente asimétrica negativa como se puede observar en la siguiente grafica. Observe la gráfica de ASIMETRÍA Y Kurtosis.
  137. 0 10 20 30 40 50 60 70 80 37

    42 47 52 57 62 67 72 Curva Leptocurtica Curva Normal 3.- Los años de servicio de un grupo de trabajadores son 9, x, 10, 8, 6 y 7. El primer momento con respecto al origen de esa serie de valores es de 7.5 y el m2 con respecto a la X es de 2.92. Determine el SK2 y el SKm ; de esos valores. Se desea tomar una medida de posición central, ¿ cuál es la más indicada para el caso?. Explique brevemente. Solución.- Lo primero que se debe hacer es calcular el valor de x, para ello se procede así: La X es igual al primer momento con respecto al origen, entonces, . 5 . 7 = X El número de datos n = 6, m2 = S2 = 2.92, ahora se aplica la formula de la media así: . 40 . 40 7 6 8 10 9 X X X X X X X n n X X i i i i + = → + = + + + + + = ∴ = → = ∑ ∑ ∑ ∑ . 5 40 45 40 5 . 7 6 . = → − = ∴ + = → = ∑ X X X x X X n i Ahora se calcula la Md de la siguiente serie de valores, los cuales se han ordenado: 5, 6, 7, 8, 9 y 10, la mediana en este caso será: Md
  138. . 5 . 7 2 8 7 = + =

    Md ( Esto es así, por ser n un número par). Con estos datos se puede calcular el SK2. 0 6 0 6 ) 5 . 7 5 . 7 ( 3 ) ( 3 2 = = − = − = n Md X SK De acuerdo con el SK2 la curva de la serie de valores es simétrica y esto es así, debido a que la X = Md = 7.5. La medida de tendencia central más recomendada seria la media debido a que este promedio para su cálculo utiliza todos los valores de la serie de datos. Para calculr el SKm se calcula S y los desvíos con respecto a la media de la serie de valores. S2 = 2.92. S3 = 4.99. . 70 . 1 92 . 2 = = S CLASES di d3 5 -2.5 -15.62 6 -1.5 -3.38 7 -0.5 -0.12 8 0.5 0.12 9 1.5 3.38 10 2.5 15.62 ∑ 0 0 . 0 99 . 4 0 3 3 = = = S m SK m Cuando la curva de una serie de valores es simétrica siempre el coeficiente de asimetría será igual a cero usando cualquiera de los coeficientes de asimetría. Cuando la curva de una serie de valores se le calcula el SKm , el resultado obtenido es el más adecuado y preciso de los coeficientes en cuestión.
  139. La medida de tendencia central más recomendada en este caso

    es la media aritmética a pesar de que esta es igual a la mediana, pero la X es más confiable por utilizar esta todos los datos de la serie para su cálculo 3.- Los pesos en Kg, de una familia son 4, 35, 39, 40, 42, 48 y 58. Para realizar una ál es la más adecuada?. Explique brevemente. investigación se requiere tomar una medida de posición. ¿Cu Solución. – Para tomar la decisión es necesario calcular el SKm . Para calcular el SKm se determina la X de los valores y los desvíos di con respecto a esta, se determina la S, la S3,el di , el d2 y el d3 de los datos y la sumatoria de estos, luego se calcula el m3 y se procede a determinar el SKm , se elabora un cuadro estadístico con el sumen de los datos requeridos; y se aplica la formula respectiva para este caso. El siguiente cuadro resum s datos n sarios pa s cálculos. re e lo ece ra lo Xi di d2 d3 4 - 1156 -39304 34 35 -3 9 -27 39 1 1 1 40 2 4 8 42 4 16 64 48 10 100 1000 58 20 400 8000 ∑Xi = 266 ∑di = 0 ∑d2 = 1686 ∑d3 = -30258
  140. . 38 7 266 = = = ∑ n X

    X i . 3738 ., 52 . 15 86 . 240 7 3 = = = = = S n S i 1686 2 ∑d . 57 . 4322 7 30258 3 3 − = − = = n d m . 16 . 1 3738 57 . 4322 − = − = m SK De acuerdo con el resultado, la curva de la distribución es marcadamente asimétrica res extremos, en su lugar se utilizará la mediana como medida de posición central, or no ser esta, afectada por los valores extremos. , se le dejan al participante para que los calcule e ndo su opinión al respecto. 70, X, 60, y 80 corresponden al peso en kg. De un grupo de profesores. El coeficiente de variación de esa serie de datos es de 19,285 %, el m4 con respecto a la media aritmética es de 109.492 y el K4 es de 1,840. Se requiere hacer Cuál es la y para ello se procede así: CV = 19,285 %, m4 = 109492, K4 = 1,840, n = 5, ahora se aplica la formula de la media negativa, lo que indica que existen valores extremos, por lo tanto la media aritmética no se puede utilizar como medida de posición central por ser esta afectada por los alo v p Los coeficientes SK1 , SK2 y skq intérprete los resultados da 7. – Los siguientes datos 90, una investigación y para ello es necesario tomar una medida de posición. ¿ medida de posición más adecuada? olución. – Lo primero que se debe hacer es calcular el valor de X, S así: . 300 80 60 70 90 X X X X X nX n X X i i i i + = → + + + + = ∴ = → = ∑ ∑ ∑ ∑ 62 . 15 ... 52 . 59506 52 . 59506 840 , 1 109492 4 4 4 4 4 4 = → = → = = ∴ = → = S S S K m S m K 4 4 S . 62 . 15 . 62 . 15 52 , 243 ., 94 , 243 52 , 59506 2 2 4 2 = → = = → = = = → = S S S S S S S
  141. Calculado S se procede a calcular la media así: .

    0 . 81 0 . 81 282 , 1 282 , 19 = = = CV X 9 1516 = ∴ = X 100 . . 62 . 15 100 . . x x S . X 300 X 405 0 . 81 x 5 X n i + = ∴ = = ∑ 300+X = 405 X = 405 – 300 X = 105. Después de calculado X sé p ederá a ca ar los des di con respecto a la media aritmética y finalmente se calcula el SKm Se procederá ahora a elaborar un cuadro estadístico para facilitar los cálculos. Se procede ahora a calcular el m3 , siendo S3 = 3811,40 e los cálculos a utilizar. roc lcul víos . 792 5 3960 3 3 = = = ∑ n d m i . 21 . 0 792 3 = = = m SK Ahora se calculara el SKm El siguiente cuadro resum 40 . 3811 3 S m Xi (Xi- X ) = di d3 60 -21 -9261 70 - -1331 11 80 -1 -1 90 9 729 104 24 13824 ∑Xi = 405 ∑di = 0 ∑di = 3960
  142. la serie de datos es ligeramente asimétrica ción más recomendada

    para el estudio es la media aritmética. Se le recomienda al participante calcular el SK2 , el mismo debe ser muy parecido al SKm . 8. – La media aritmética de dos números es igual a 60 y su desviación típica es igual a 0. Determine esos números. De acuerdo con el resultado la curva de positiva, por lo tanto la medida de posi 2 Solución: Datos: X1 =?; X2 =? ; X = 60; S = 20; n = 2 De la formula de la media para datos no agrupados se tiene e elevan al cuadrado ambos miembros de la ecuación y se elimina denominador ). 1 ....( 120 2 60 ..,. 2 2 1 2 1 2 1 X X X X X X n X X i + = → + = + = = ∑ La formula de la S para datos simples es: n 2 ) X 2 X ( 2 ) X 1 X ( n 2 ) X i X ( S − + − = ∑ − = Remplazando por los valores conocidos se tiene 2 3600 2 X 120 2 2 X 3600 1 X 120 2 1 X 20 + − + + − = → − + − = 2 2 ) 60 2 X ( 2 ) 60 1 X ( 20 S
  143. → + − + + − = ⎟ ⎟ ⎟

    ⎟ ⎠ ⎞ ⎜ ⎜ ⎛ 2 2 3600 2 X 120 2 2 X 3600 1 X 120 2 1 X 20 ⎜ ⎜ ⎝ Despejando en (1), X1 = 120−X2 , y reemplazando en (2) se 2 3600 2 X 120 2 2 X 3600 1 X 120 2 1 X 400 + − + + − = 3600 2 X 120 2 2 X 3600 1 X 120 2 1 X 800 + − + + − = ) 2 ...( 7200 2 X 120 2 2 X 1 X 120 2 1 X 800 + − + − = tiene ( ) ( ) 7200 2 X 120 2 X X 120 120 2 X 120 800 + − + − − − = 2 2 2 2 2 X 7200 2 X 120 2 12 14400 2 2 X 2 X 240 14400 800 + + − + − + − = X 0 7200 2 X 2 X 240 800 + + − = 2 2 0 800 7200 2 X 240 2 2 X 2 = − + − 0 ) 40 2 X )( 80 2 X : tiene .. se .. notable .. producto .. Aplicando ;.. 0 3200 2 X 120 2 2 : tiene .. se .. ecuacion .. la .. toda .. 2 .. entre .. Dividiendo ;.. 0 6400 2 X 240 2 2 X = − − = + − = + − 2 X ( ( )( ) ( ) ( ) . 40 2 X .. y .. 80 1 X 0 40 2 X .. y .. 0 80 1 X . .. 0 40 2 X . 80 1 X = = ∴ = − = − ⇒ = − − Los números buscados son 40 y 80.
  144. TEORIA DE PROBABILIDADES (CAPÍTULO 4) BJETIVO: Desarro O llar las

    propiedades de la teoria de los grupos que se pueden formar con un conjunto de elementos dado, iferenciándose entre sí por el número de elementos que entran en cada grupo, por la osibles arreglos de un conjunto de datos es por medio de un DIAGRAMA DE ÁRBOL, sibles arreglos de uno ó varios eglos probables de objetos de obabilidades. Al enumerar los orma de un árbol, llamado método de la REGLA nteo ó también aplicando las azonamiento del diagrama de árbol; el mismo se define así: " Si una acción puede fectuarse, de a maneras diferentes, una segunda acción puede efectuarse de b maneras iferentes, una tercera acción puede efectuarse de c maneras diferentes, y así s diferentes en que es en el orden mencionado está dado por: . De cuantas maneras pueden combinarse los pantalones con las camisa o viceversa. probabilidades. CONTENIDOS: Definición y propiedades de las probabilidades, tipos y caracterstica de cada una, solucion de problemas aplicando el Spss.13.0. EORIA DE PROBABILIDADES T Teoría Combinatoria TEORÍA COMBINATORIA.- Es la rama del Álgebra que se encarga del estudio y propiedades de d clase de esos elementos y por el orden de colocación de esos elementos. ARREGLO DE OBJETOS.- Es la acción de arreglar, componer u ordenar objetos eterminados en los estudios de probabilidades. Una forma útil de contar todos los d p que es una gráfica en donde se presentan todos los po eventos en forma de árbol. Los procedimientos de cálculo para hallar el número de arr un conjunto, son indispensables en el estudio de pr arreglos, es útil contar todos los posibles arreglos en la f ar el diagrama de árbol; también se puede aplic MULTIPLICATIVA o principio multiplicativo del co técnicas de la teoría combinatoria (variación y combinación). PRINCIPIO DE MULTIPLICACIÓN.- El mismo está basado en el método de r e d sucesivamente para n acciones, entonces el número total de manera pueden efectuarse todas estas accion axbxc...xn". PROBLEMAS.- Un joven tiene cuatro camisas de los siguientes colores: roja (R), lanca (B), negra (N) y verde (V), también posee dos pantalones, gris(G) y azul (A) b ¿
  145. Camisa Pantalones Arreglos G RG N ponentes: letas P Como

    se puede observar en el diagrama de árbol M hay 12 arreglos posibles. Los resultados obtenidos con el diagrama de árbol también se pueden, obtener aplicando la regla multiplicativa: En el caso primero tenemos que multiplicar 4x2 = 8 posibles arreglos; en el segundo problema se multiplica 2x3x2=12 posibles arreglos el mismo resultado que se logró con el diagrama de árbol. R A RA G BG B A BA J G NG A NA G VG V A VA Un restaurante de la localidad ofrece un menú de tres com 1.- Aperitivo: Sopa (S), o Ensalada(E). 2.- Plato Principal: Bisté (B), Carite (C), o Pavo (P). 3.- Postre:Torta (T), o Helado (H). Construya un diagrama de árbol, indicando el número posible de comidas comp (aperitivo, plato principal y postre) que se pueden consumir. Aperitivo. principal Postre Arreglos T SBT B H SBH T SPT S P H SPH T SCT C H SCH M T EBT B H EBH E T EPT H EPH T ECT C H ECH
  146. VARIACIÓN.- Dado un conjunto de m objetos o elementos, se

    llaman variaciones de esos elementos tomados de n en n, al conjunto formado por todas las colecciones de n elementos elegidos entre los elementos dados, considerando como distintas dos ento o en el orden de colocación de los mismo. N! Esta es una notación matemática que recibe el nombre FACTORIAL y se define s los números consecutivos decrecientes que comienzan en 1 es entero positivo tenemos: = n(n-1) (n-2) (n-3)..................1. 6! = 6x5x4x3x2x1 =720. En particular, 1! = 1; por definición, 0! = 1. iones: n elementos dados, considerando distintas, dos eterminar si es una variación o una cualquiera, según el enunciado del problema y con los mismos colecciones que difieran en algún elem como el producto de todo hasta n, entonces si n N! Formula de las Variac COMBINACIONES.- Se llama combinación de m elementos tomados de n en n al conjunto de todas las colecciones de ( ) colecciones cuando difieran en uno o más elementos. Formula de las combinaciones: ALGUNAS OBSERVACIONES PARA CALCULAR VARIACIONES Y COMBINACIONES Para diferenciar en la resolución de un problema y d combinación se hace lo siguiente: 1.-Se forma un grupo elementos de ese grupo se trata de formar otro grupo, si se consigue formar otro grupo diferente, el problema en cuestión es una variación, si por el contrario no se logra formar otro grupo, el problema es una combinación. Cuando en el grupo entran todos los elementos y los grupos difieran en el orden de colocación, son variaciones, de no ser así son combinaciones. 2.- Cuando una persona forma un grupo y otra persona que no haya visto la formación del mismo es capaz de decir en que orden se colocaron los elementos, entonces se afirma que el grupo formado es una variación, si por el contrario no se puede decir el ! n m − ( )( )( ) .! m V = ,n m ( )( ) 1 2 .. .......... 3 2 1 , + − + − − − − = n m n m m m m m n Vm ( ).! .! , n m n n m − m C = .!
  147. orden de colocación de los elementos que conforman el grupo,

    entonces, el mismo es una combinación. 1.-¿Cuántos números de 3 cifras pueden hacerse con las cifras 1,2,3,4,5 y 6? que sean diferentes?. 541. Los dos números formados tienen los mismos elementos aunque los números son diferentes, por tal razón es una variación, orden de colocación de sus elementos. andos cada Razonamiento: Formamos una suma cualquiera con tres de las cifras dadas......-.1 + 2 + 3 = 6, con los mismos números formamos otra suma ... ...3 +2 +1 = 6, como las dos sumas son iguales , entonces el problema es una combinación , por no influir el orden tres pinturas de diferentes colores, que dio un color determinado, e echaron las tres pinturas, por lo tanto es una una bandera de tres colores se puede decir en que orden están 3.- Se tienen 4 pinturas de colores diferentes. ¿ Cuantos colores pueden obtenerse Se forma otra mezcla con los 4 colores A +D + B + C = Color, se observa como las an el mismo color puesto que no influye el orden de colocación de los elementos, entonces es una combinación. Solución: Luego, uántos números de 3 cifras pueden hacerse, que Con los mismos elementos se forma otro número 321 Razonamiento: Se forma un número cualquiera de 3 cifras, ejemplo 154, con esos mismos elementos se forma otro número por influir el 2.- Con los números 1,2,3,4,5 y 6, ¿Cuántas sumas diferentes de 3 sum una pueden hacerse?. de colocación de sus elementos. En una mezcla de es imposible decir en que orden s combinación. En colocados los colores, por lo tanto es una variación. mezclando los 4 colores en la misma proporción?. Razonamiento; se forma una mezcla con los 4 colores A + B + C+ D = Color. dos mezclas d Elementos de que disponemos.........................m = 4 . Elementos que entran en el grupo......................n = 4 . ( ) color C ...... 1 ! 0 ! 4 ! 4 ! 4 4 ! 4 ! 4 4 , 4 = = − = 4.- Con las sean diferent cifras 1,2,3,4,5 y 6.¿ C es?. Razonamiento: Se forma un número de 3 cifras 123
  148. Como los dos números formados son diferentes el problema es

    una Variación, por influir el orden de colocación de los elementos. Solución: Elementos de que se disponen m = 6. problema de a, entonces al V4,2 = 4x3 =12 este es el número de cifras que se inician con 5. as cifras del número 876321, calcular cuántos números de 4 cifras pueden formarse con la condición de que empiecen en 8 y terminen en 1. Elementos de que se disponen m = 6. Elementos que entran en la formación de cada número n = 3. Entonces: V6 ,3 = 6.5.4 = 120 Números diferentes. 5.- Con los números 1, 2, 3, 4, 5 y 6. ¿Cuántas sumas diferentes de 3 sumandos cada una pueden hacerse?. Es una Combinación por no influir el orden de colocación de los elementos. Solución: Elementos que entran en la formación de cada suma n = 3 PROBLEMAS DE FORMACIÓN DE NÚMEROS.- Cuando en un ( ) Sumas x x x x x x x C Lueg ..... 20 4 5 2 3 4 5 6 ! 3 !. 3 ! 3 4 5 6 ! 3 6 ! 3 ! 6 ,...... 3 , 6 = = = = − = combinatoria se dice que uno o más elementos estarán fijos en un problem se tomen como fijos. Ejemplo: componente m y n de las variaciones o combinaciones se les restará el número de elementos que 1.- Con los números 1,2,9,7 y 5, calcular cuántos números de 3 cifras empiezan con 5. Razonamiento como el problema es de formación de números es importa el orden, por lo tanto es una variación. Se dice que el número 5 tiene que iniciar los números de 3 cifras entonces tendrá la forma 5XX y como hay un número fijo entonces m =5-1 = 4 y n =3-1 = 2 luego la variación es: 2.- Con l Razonamiento: este es un problema de formación de números por lo tanto es importante el orden, en consecuencia es una variación. Los números de 4 cifras tendrán las siguientes formas generales: 8XX1 esto indica que habrán 2 números fijos por lo tanto m =6-2 = 4 y n = 4-2 = 2 y la solución se expresa así V4,2 = 4x3 = 12, se pueden formar 12 números de 4 cifras que empiecen en 8 y terminen en 1. 3.- Con las cifras del número 98753. Calcular en cuántos números de 3 cifras interviene el número 8.
  149. Razonamiento: este es un problema de formación de números por

    lo tanto es importa el orden, en consecuencia es una variación. La forma general de un número de 3 cifras es XXX y las diferentes posiciones que puede ocupar el 8 son: 8XX, X8X y XX8 como se eros de 3 cifras pueden formarse. como es una formación de números es importa el orden de los elementos, es en consecuencia una variación y la solución es la siguiente: como m = 6 es = 4 y n = 4-1 = 3, en consecuencia la variación total será:.3V4,3 cifras terminar en número par habrá que multiplicar el resultado por drá que a siguiente: 4V4,2- marse con la condición de que las 3 primeras cifras sean pares y las 2 últimas sean impares?. observa el número 8 estará fijo y por lo tanto m = 5-1 = 4 y n =3-1 = 2 luego la variación es: V4,2 = 4x3 = 12, pero como el número 8 aparece en tres posiciones, entonces el resultado es: 3V4,2 =3x12 = 36 que es el número de veces donde aparece el número 8. 4.-Con los números 8,5, 7, 9, 1 y 0. Calcule cuántos núm Razonamiento: y n = 3 se tiene que V6,3 = 6x5x4 el valor de V6,3 =120. La forma general de un número de 3 cifras es XXX pero en nuestro caso el cero iniciará algunos números y eso no serán de 3 cifras por lo tanto se le tendrán que restar al total de 120, puesto que los números que se inician con cero tienen la forma siguiente: 0XX, entonces habrá un número fijo y por lo tanto el valor de m = 6-1 = 5 y el n = 3-1 =2 luego los números que no son de 3 cifras son las siguientes: V5,2 = 5x4 = 20, entonces el resultado final será: V6,3-V5,2 = 120-20 = 100 . 5.- Con las cifras del número 98764. Calcule cuántos números pares de 4 cifras se pueden formar. Razonamiento: como es una formación de números influye el orden, por tal razón una variación. Los números pares son aquellos que terminan en cero o cualquier número par; la forma general de un número de cuatro cifras es XXXX en nuestro caso la forma de los números será: XXX8, XXX6 y XXX4 como se puede observar hay un número fijo, entonces m = 5-1 =3x4x3x2 =72 número pares de 4 cifras que se pueden forma. 6.- Con las cifras del número 80342. Calcule cuántos números pares de 3 cifras se pueden formar. Razonamiento: es una variación por ser una formación de número en donde importa el orden de colocación de los elementos. La forma general de los números pares de 3 cifras en este caso es: XX0, XX2, XX4 y XX8, como se puede notar hay un elemento fijo, luego m = 5-1 = 4 y n = 3-1 = 2 entonces la variación es: V4,2 = 4x3 =12 pero como hay 4 formas de las 4, así: 4V4,2 = 4x12 = 48 pero los números que se inician con cero de la forma siguiente: 0X2,0X4 y 0X8 no forman números de 3 cifras ya que el cero a la izquierda no tiene ningún valor, por lo tanto estos números son de 2 cifras y se ten calcular cuántos son y posteriormente restársele al total de 48 para ello determinaremos el valor de m =5-2 = 3 y n = 3-2 = 1 y la variación será : 3V3,1 =3x3 = 9 este es el número de cifras que se tendrá que restársele al total de 48 de la form 3V3,1 = 48-9 = 39 es la cantidad de números pares de 3 cifras que se pueden formar. 7.- Con los números del 1 al 9 ambos inclusive. ¿Determine cuántos números de 5 cifras pueden for
  150. Razonamiento: este es un problema de formación de números por

    lo tanto es una variación, en este problema hay dos clases de números para la formación de los grupos, s números PARES y los IMPARES. Los números a formar son de la siguiente forma: PPPII; los grupos que se pueden formar con los números pares vienen dado por la variación de estos (2, 4, 6 y 8) en donde m = 4 y n = 3 por tanto, la variación de estos es: V4,3 = 4x3x2x = 24. Los grupos que se pueden formar con los números impares (1,3,5,7 y 9) son: V5,2 = 5x4 = 20 . Para obtener el resultado final se multiplica variación de números pares (24) por la variación de los números impares (20) ), en 3 5,2 eros de 5 cifras que se pueden rmar en los que las 3 primeras cifras son pares y las dos últimas son impares. 8.- En una reunión hay 8 mujeres y 6 hombres. Calcule cuántos grupos pueden rmarse, en los que estén presente 4 mujeres y 3 hombres. blema no influye el orden de colocación de cada una e sus integrantes, es por lo tanto una combinación. El grupo tendrá la forma general MMMHHH, para su solución primero se dejan los hombres fijos y se calcula el e calcular el grupo que se forma con los hombres de siguiente manera: ero y el orden 1A2B3C4D. Dejando las letras fijas los eros 1, 2, 3 y4 pueden variar de 4 en 4, es decir m = 4 y n = 4 y por lo tanto: lo la este caso tenemos: xV = 24x20 = 480 viene a ser la cantidad de núm V4, fo fo Razonamiento: como en este pro d siguiente: M grupo que se puede formar con las mujeres de la forma siguiente: Si se dejan las mujeres fijas se pued ( ) mujeres de grupos x x .. .. ... 70 2 3 4 !. 4 !. 4 ! 4 8 ! 4 4 ,. 8 = = = − = x x x x x x x C 5 6 7 8 ! 4 5 6 7 8 ! 8 la Luego el resultado final de este problema será la multiplicación del grupo de mujeres por la del grupo de hombres así: C8,4xC6,3 = 70x20 = 1400 ,son los grupos que se pueden formar en los que estén presentes 4 mujeres y 3 hombres. 9.-Encuentre los diferentes grupos que se pueden hacer con 4 cifras y 4 letras con la ondición de que en todos, letras y números vayan alternados y en cada grupo entren c las letras y todos los números. azonamiento: como este problema es una formación de letras con núm R de colocación es importante, es entonces una variación, en la que hay 2 clases de elementos para formar cada grupo. a forma general del grupo es: A1B2C3D4 y L núm ( ) . bres hom .. de .. grupos .. 20 4 x 5 x 6 ! 3 x 4 x 5 x 6 ! 6 C 2 x 3 ! 3 !. 3 ! 3 6 ! 3 − 3 ,. 6 = = = =
  151. V4,4 = 4x3x2x1 = 24 ; si ahora se dejan

    fijos los números las letras se pueden calcular así: V4, 4 = 4x3x2x1 = 24 teniendo los 2 grupos el de letras y el de números se pueden de empezar por las letras o por los números entonces él úmero 576 se tiene que multiplicar por 2 que son la forma como puede empezar = 1.152 que es la cantidad e grupos que se pueden hacer de acuerdo con las condiciones dadas en el problema. s. ¿ Cuántas palabras pueden hacerse biendo que cada palabra está formada por 3 consonantes y 2 vocales?. n de colocación de cada palabra, entonces es una ariación. La forma general de las palabras será: CCCVV. Las variaciones de las ltado es: 5,2 = 14.400 pero como no está determinada la posición de las letras en la formación de cada palabra significa que cada una de las palabras formadas puede variar de todas s, es decir: se artir 5 helados de diferentes sabores entre 2 luye el orden de entrega de los helados es una combinación s números de 4 cifras pueden rmarse con la condición de que empiecen en 2 y terminen en 8. Resultado.- 12. el número 738642; determine en cuántos números de 3 cifras terviene él número 7. Resultado.- 60. multiplicar entre si de la siguiente manera: V4,4 x V4,4 = 24x24 = 576. Como en este problema se pue n cualquiera de los grupos que se formen, así tenemos: 576x2 d 10.- Se dispone de 10 consonantes y 5 vocale sa Razonamiento: como influye el orde v vocales en este caso serán: V5, 2 xV10 , 2 = 5x4 = 20 y las variaciones de las consonantes serán: V10, 3 = 10x9x8 = 720 ahora se multiplican las variaciones de las vocales por las variaciones de las consonantes y el resu V las maneras posible V5,5 = 5x4x3x2x1 = 120 , por lo tanto el resultado final será: 5,2XV10,3XV5,5 = 20x720x120 = 1.728.000 que es la cantidad de palabras que V pueden formar con las condiciones establecidas. 1.- De cuántas maneras se pueden rep 1 niños, dándole 2 helados a cada niño. azonamiento: como no inf R Al primer niño se le puede dar C5,2 =10 maneras diferentes; pero al darle 2 helados al primero nos quedan 3 helados para formar grupos de 2 en 2 así: C3,2 = 3 formas diferentes. El resultado final será la multiplicación de C5,2 xC3,2 = 10x3 = 30 formas de epartir los helados. r OBLEMAS PR 1.- Con las cifras del número 836214; determine cuánto fo 2.- Con las cifras d in 3.- Con las cifras del número 978054; calcule cuántos números de 5 cifras pueden formarse. Resultado.- 600.
  152. 4.- Con las cifras del número 9876541; calcule cuántos números

    de 5 cifras se pueden y úmero 9280541; calcule cuantos números pares de 3 cifras se en formar. Resultado.- 10 y te entre un grupo de 12 personas de las cuales 9 son Administradores y 3 son .- 378. e ir estido sabiendo que se pondrá una pieza de cada una de las antes mencionadas?. Se cuenta con 10 profesores, 6 profesoras y 4 estudiantes para formar una .- Se dispone de 10 juguetes diferentes. ¿ De cuántas maneras diferentes se pueden e un barco se necesitan 5 maquinistas 3 pilotos y un apitán. , 6 pilotos y 3 capitanes? Resultado.- 3.360. as distintas de baile se odrán formar tomando siempre parte en ellos las 5 muchachas? .Resultado.- 40. 4.- ¿Cuántas partidas de ajedrez se podrán hacer entre 11 competidores? Resultado.- presentes tres números pares y dos impares. Resultado.- 60. l menos ha de haber dos estudiantes en cada sidencia? Resultado.- 2.940 hacer con la condición de que la primera cifra de la izquierda sea un 7 la tercera un 8 la quinta cifra sea 1. Resultado12. 5.- Con las cifras del n pued 6.- ¿Cuántos números de 5 cifras, sin que haya ninguna repetida, pueden formarse con las cifras del sistema decimal?. Resultado.- 27.216. 7.- ¿Cuántos números pares de 4 cifras se pueden formar con los números 7, 5, 2 y 3? Resultado.- 6. 8.- Para formar el tren directivo de una compañía se deben elegir 4 Administradores un Geren Gerentes. ¿Cuántos trenes directivos se pueden formar? Resultado 9.- Un Gerente de una empresa es invitado a una reunión y dispone de 7 pantalones, 6 chaquetas, 10 corbatas, 5 camisas y 10 pares de zapatos. ¿ De cuántas maneras pued v Resultado.- 21.000. 10.- comisión. ¿Cuántas comisiones se pueden formar sabiendo que en cada comisión tienen que estar 5 profesores, 3 profesoras y un estudiante? Resultado.- 30.240. 11 repartir entre 3 niños dándole 3 juguetes a cada niño?. Resultado.- 16.800. 12.- Para formar la tripulación d c ¿Cuántas tripulaciones diferentes pueden formarse sabiendo que se disponen de 8 maquinistas 13.- En una fiesta hay 5 muchachas y 8 jóvenes. ¿Cuántas parej p 1 55. 15.- Con las cifras del numero 64123587. Calcular cuántos números se pueden formar con la condición de que estén 34.5 16. - Ocho estudiantes deben repartirse en tres residencias distintas de El Tigre. ¿De cuántas maneras pueden hacerlo si a re
  153. 17. - Se forman banderas tricolores a franjas horizontales con

    los 7 colores del arco iris. Averiguar: lores siguientes: rojo, ta Mata) en la administración pública y empresarial. Las probabilidades son de gran portancia en la estadística. Para iniciar el estudio de las probabilidades es necesario predecir el sultado final de ese proceso aun sin haberlo realizado. Ej. Cuando los químicos de predecir uno de ellos en una prueba en particular. Ej. Los experimentos lacionados con juego de envite y azar, no se pueden predecir los resultados de los erimento leatorio; generalmente se le designa con la letra S o E. Ej. El espacio muestral al lanzar ir una cara ó un sello. pacio muestral de lanzar un dado está formado por varios A.- ¿Cuántas banderas se podrán formar? Resultado.- 210. B.- ¿Cuántas tendrán la franja superior roja? Resultado.- 30. C.- ¿Cuántas tendrán la franja superior roja y la inferior azul? Resultado.- 5. D.- ¿En cuántas de ellas intervendrá uno al menos de los dos co amarillo. Resultado.-150. 18.- Se dispone de 7 personas para formar comisiones de 3 personas. Se supone que en las comisiones no existe ninguna jerarquía, o sea, que las 7 personas desempeñan la misma labor. En estas condiciones: A.- ¿Cuántas comisiones distintas se pueden formar? Resultado.- 35. B.- ¿En cuántas de ellas intervendrán una determinada persona, llamémosle Petra? .Resultado.-15. ROBABILIDADES (Hamlet Ma P La teoría de probabilidades es muy extensa y sus aplicaciones han adquirido mucha importancia im definir una serie de términos básicos para su mejor comprensión. Experimento Deterministico.- Es aquel experimento en el que es posible re combinan oxigeno más hidrógeno el resultado es agua; este experimento no es necesario realizarlo para conocer el resultado. Experimento Aleatorio.- Es aquel que puede dar lugar a más de un resultado, por lo que, no se pue re ganadores del 5 y 6 en un domingo cualquiera ó el resultado del Kino puesto que en estos casos pueden haber múltiples resultados. Espacio Maestral.- Es el conjunto de los posibles resultados de un exp a un dado es: S = {1, 2 3 ,4 ,5 ,6} esto es así puesto que un dado tiene 6 caras numeradas de 1 al 6 y cualquiera de estas puede salir. El espacio muestral de lanzar una moneda es: S = {c, s}, esto es así puesto que al lanzar una moneda puede sal Sucesos ó Eventos.- Es todo aquel resultado o grupo de resultados que pueden dar origen un experimento aleatorio. También se puede decir que es un subconjunto del espacio muestral. Ej. El es
  154. eventos: { 1 },{ 2 }, { 3 }, {

    4 },{ 5 } y {6}. Los eventos pueden ser simples ó compuestos. Eventos Simples.- Son aquellos eventos cuyas características son las de estar constituidos por un solo elemento; por lo tanto no se pueden descomponer en otros elementos. Ej. Al lanzar un dado se pueden obtener 6 eventos simples que serian el 1, 2, , 4, 5 y 6 respectivamente. Los eventos simples son mutuamente excluyentes. o pueden ocurrir multáneamente al realizar una sola vez un experimento. Se dice que dos eventos A y B , si sale una cara con un 3, no uede salir otro número en este mismo lanzamiento. njunto vacío, {Ø}. ventos Dependientes.- Son aquellos sucesos en los que el conocimiento de la d de obtener 2 cartas de basto al sacar sucesivamente 2 cartas de una baraja e 40 cartas. Al sacar la primera carta la probabilidad de obtener basto es de 10/40 y al de obtener basto es de 9/39, en este caso la segunda xtracción depende de la primera que tenía como probabilidad 10/40 y la segunda os son independientes si la currencia de uno cualquiera de ellos no afecta la probabilidad de la ocurrencia de 3 Eventos Mutuamente Excluyentes.- Son aquellos eventos que n si son mutuamente excluyentes si y solo si, su intersección es el conjunto vacío, es decir A∩B = Ø. Ej. El resultado obtenido al lanzar un dado p Eventos Compuestos.- Son aquellos eventos que se pueden descomponer en una combinación de eventos. Ej. Obtener un número par al lanzar un dado, el espacio muestral de este evento es: E = {2, 4, 6}, este es el evento par del lanzamiento de un dado, pero este evento se puede descomponer en 3 eventos simples a saber {2}, {4}: y ⎨6⎬. Eventos Imposibles.- Son aquellos sucesos que nunca ocurren. Ej. Obtener un 7 al lanzar un dado normal, esto es imposible por cuanto un dado normal tiene solamente 6 caras por lo tanto este resultado es el co Eventos Seguros.- Son aquellos sucesos constituidos por todos los eventos simples del espacio muestral. Ej. Al lanzar un dado sacar cualquiera de sus caras. Eventos Exhaustivos.- Dos eventos A y B son colectivamente exhaustivos si su unión es la totalidad del espacio muestral, es decir, A∪B = E. E verificación de uno de ellos altera la probabilidad de verificación del otro. Se dice que dos o más eventos son dependientes si la ocurrencia de uno cualquiera de ellos afecta la probabilidad de la ocurrencia de alguno de los otros eventos. Ej. Consideremos la probabilida d no sustituirla quedaran en el paquete 39 cartas de las cuales 9 son de basto, en la segunda extracción la probabilidad e extracción tendrá ahora 9/39 como se puede observar la probabilidad de la segunda extracción es afectada por la primera. Eventos Independientes.- Se dice que dos ó más event o ninguno de los otros sucesos. Ej. el evento de obtener simultáneamente un 2 al lanzar un dado y sello al tirar una moneda, está compuesto de 2 sucesos independientes, puesto que la ocurrencia de un 2 en el dado no afecta la probabilidad de la aparición de sello en la moneda y viceversa.
  155. Eventos complementarios - Dos eventos A y Ā son complementarios

    si y solo si, se cumple que: P(A) + P(Ā) = P(S), es decir, son eventos mutuamente excluyentes y su nión es el espacio muestral, entonces tenemos, P(A) + P(Ā) = P(S), pero P(S) = 1, políticos de ganar una elección eterminada, etc. ntajes, también se pueden expresar con números ecimales. Es una condición de esta cátedra que siempre sé resuelvan las fracciones con les y el mismo se representa en orcentaje. La probabilidad de cualquier evento se representa con la letra P. a enfoques o escuelas que tratan de dar una definición de la probabilidad: La . u entonces, P(A)+ P(Ā) = 1 P(A) = 1- P(Ā), donde P(Ā), se lee probabilidad de A complemento. Eventos no Mutuamente Excluyentes.- Son aquellos eventos que pueden verificarse simultáneamente. A estos eventos también se les llaman Sucesos Compatibles. CORRIENTES QUE DEFINEN LA PROBABILIDAD Diariamente se escuchan afirmaciones que llevan implícito el concepto de probabilidad como por ejemplo los pronósticos del tiempo que indican las probabilidades de lluvia; los galenos indican la probabilidad que tiene un enfermo de curarse si realiza al pie de la letra sus tratamientos farmacológicos, los docentes especulan sobre las posibilidades de éxito del estudiantado si dedican más tiempo al estudio, las compañías encuestadoras predicen las oportunidades que tienen los d La Teoría de la Probabilidad es una rama de las matemáticas que se encarga de los eventos que se realizan al azar o fenómenos aleatorios, como a menudo se les denominan. Se define la probabilidad como un número comprendido entre 0 y 1, que se le asigna a un evento para señalar su posibilidad de ocurrencia. Por lo general las probabilidades se expresan en porce d que se expresan las probabilidades de un problema dado; los resultados de esos cocientes deben tener por lo menos 4 decima p Se le asigna la probabilidad de 1 al evento que con certeza ocurrirá y se le asigna la probabilidad de 0 a un suceso que no puede ocurrir; se le asigna una probabilidad de 0.5 a un fenómeno que tenga la misma posibilid d de suceder o de no suceder. Se le asigna una probabilidad 0 ≤ P ≤ 0.5, a un fenómeno que tenga más posibilidades de no suceder que de suceder; y se le asigna una probabilidad 0.5 < P ≤ 1 a un evento que tenga más posibilidades de suceder que de no suceder. La probabilidad es una característica que interviene en todos los trabajos experimentales. Es necesario obtener un procedimiento lógicamente sólido para que dichos enunciados tengan validez científica. En otras palabras, en virtud de que la probabilidad en definitiva, es un cuantificador o medida de la posibilidad de ocurrencia de un suceso al que se le asocia un grado de incertidumbre, se debe estudiar la forma en que esta medida puede ser obtenida. Existen tres Clásica, La de Frecuencia Relativa y La Subjetiva Escuela Clásica.- Esta plantea que si un suceso puede ocurrir en a formas y fallar en b formas posibles, entonces el número total de formas posibles en que puede ocurrir o
  156. no ocurrir es a + b. Sí a + b

    formas son igualmente probables, la probabilidad P de que el suceso ocurra se define como el cociente P = a /a + b, y la probabilidad q de que el suceso no ocurra se define como el cociente q = b / a + b, en otras palabras, la probabilidad de que ocurra o no un suceso, se define como el cociente del número de casos favorables entre el número de casos posibles, siendo todos estos casos igualmente robables. Relativa.- Este enfoque surge por la necesidad de asignar robabilidades a aquellos eventos considerados no simétricos. Los seguidores de esta efinición.- Si se considera un suceso que puede verificarse o fallar al efectuar una al hace hincapié en la probabilidad que resulta de una opinión, reencia, o juicio personal sobre una situación determinada. El enfoque subjetivo s datos experimentales sean escasos o imposibles de obtener. aplica a problemas de toma de decisiones tales como onstrucciones de plantas, compras de equipos, licitaciones de contratos, etc. La de la ma de decisiones. Los defensores de esta corriente tratan de buscar soluciones a la asignación de probabilidades de aquellos eventos que solo ocurren una vez o que no p Ej. Al tirar un dado una sola vez puede salir una cara cualquiera de las 6 que posee el dado, todas igualmente probables; la obtención de un 3 en el lanzamiento del dado, es una de las diferentes caras que posee el dado, se dice que hay un caso favorable para que salga el 3 entre 6 casos posibles; en este caso se tiene que a = 1(caso favorable de obtener un 3), b = 5 (caso no favorable para obtener un 3), de modo que la probabilidad de acertar es: P=1 / 1 + 5 = 1 / 6 y la probabilidad de fallar es: P = 5 /1 + 5 = 5 / 6 Escuela de la Frecuencia p corriente afirman que solo a partir de experimentos realizados varias veces en las mismas condiciones, es posible asignar probabilidades a los eventos de un experimento aleatorio. En términos generales el empeño de esta teoría es destacar que cuando el número de experimentos aumenta, la frecuencia relativa del evento se estabiliza y se acerca bastante a un valor determinado que podría ser prácticamente igual a la probabilidad del evento con un elevado grado de certeza. D prueba, sí sé observa que ese suceso se verifica m veces en un total de n pruebas bajo las mismas condición esenciales, entonces la razón m/n se define como la probabilidad P de que el suceso se verifique en una cualquiera de las pruebas, entonces, P = m/n. En esta definición de frecuencia, la probabilidad es un número estimado y la confianza de esta estimación aumenta con n, es decir, cuando el número de observaciones crece. La probabilidad de la frecuencia relativa está basada en un gran número de experimentos y observaciones, y muy a menudo se le llama probabilidad Empírica, Estadística, A Posteriori o Teoría Objetiva. Esta es la definición más utilizada en la teoría de probabilidades. TEORÍA DE LA PROBABILIDAD SUBJETIVA.- Existen varios sucesos de sumo interés cuyas probabilidades no se pueden calcular tomando en cuenta los métodos de frecuencia relativa ni con la teoría de la probabilidad clásica. Surge entonces, el punto de vista subjetivo el cu c denominado también probabilidad personal, asigna a los eventos probabilidades, aun cuando lo Los que toman decisiones utilizando este tipo de probabilidad se fundamentan en sus propias experiencias personales y en muchos casos en presentimientos. Este enfoque de la probabilidad personal se c probabilidad personal se ha vuelto sistemáticamente popular entre los teóricos to
  157. pueden estar sometidos a experimentos repetidos. La asignación de probabilidades

    a un evento en estas condiciones, más que un juicio arbitrario, es un juicio de valor. AXIOMAS DE LA TEORÍA DE PROBABILIDADES.- Los axiomas de las nocen como propiedades de las robabilidades y son: n número no negativo, es decir: (xi)≥0. .- La suma de las probabilidades de todos los sucesos posibles, mutuamente unidad, es decir: P (X1) + P(X2) + (X3)+.............+ P(Xn) = 1 .- La probabilidad de cualquier suceso varía entre 0 y 1, es decir 0 ≤ P(XI) ≤ 1. rra y no ocurra es igual a la nidad. Si se designa con P la probabilidad de que un evento ocurra y con q la = 1 − q y la robabilidad de que el evento no ocurra es: q = 1 − p. Es importante destacar que las probabilidades se deben expresar por lo menos con 4 EOREMAS FUNDAMENTALES DE LA TEORÍA DE PROBABILIDADES .-TEOREMA DE LA SUMA O DE LA “O “ .- Para sucesos Incompatibles (aquellos que no pueden ocurrir simultáneamente o al no de ellos, esto es P(A o B) es igual a la probabilidad de A, o sea, (A), más la probabilidad de B, es decir, P(B)“, simbólicamente así: P (A) + P(B). (A o B o C o N) = P(A) + P ( B ) + P(C) +.....................+ P(N) . Ej.: probabilidades son los fundamentos básicos de las reglas del cálculo de las probabilidades de eventos; estas reglas también se co p 1.- La probabilidad de todo evento o suceso es u P 2 excluyentes de un experimento aleatorio es la P 3 4.- La suma de las probabilidades de que un suceso ocu u probabilidad de que el evento no ocurre, se tiene entonces: P + q = 1, luego la probabilidad de que un suceso ocurra es: P p decimales y luego a estos expresarlos en porcentaje. T 1 Para su mejor estudio el teorema de la suma se divide en dos casos: A mismo tiempo) o Excluyentes; el teorema se enuncia así: “ Sean A y B dos eventos mutuamente excluyentes, entonces la probabilidad de obtener al menos u P P(A o B) = Este teorema se puede generalizar para A, B, C,.................N, que se excluyan mutuamente y tienen P1 , P2 , P3 , Pn, probabilidades de ocurrir, así : P 1.- Se saca al azar una carta de una baraja de 40 cartas. ¿Cuál es la probabilidad de que sea un As o un Rey?
  158. Solución : la probabilidad de sacar un as es 4/

    40 y la probabilidad de sacar un rey es /40, luego la probabilidad buscada se encontrará así: si se llama P(A)= 4 / 40 entre los sucesos) no Mutuamente Excluyentes. El teorema se enuncia así: “Sean A y B dos eventos comp es de ve q enen por lo menos un suceso simple en común; la probabilidad de obtener al m nos uno de ellos, esto es P(A o B) es igual a la prob id el to e ir ), la probabilidad de B, o sea P(B) menos la probabilidad de la intersección d mbos eventos, es decir P(A∩B)”. Simbólicamente se puede expresar así P(A o B) = P(A) + P (B) − P(A∩B). j. Si llamamos A, el evento de obtener una cara en la moneda y B, al muestra de un dado es seis, (1,2,3,4,5,6). El espacio uestral de ambos eventos será la multiplicación de sus espacios muéstrales, es decir, pacio muestral de ambos eventos: S 1 S 2 S 3 S 4 S 5 S 6 S 4 obtener un as y probabilidad de obtener un rey se le denominara B, entonces P(B) = 4 / 40, entonces: P(A o B) = P(A) + P(B), luego P(A o B) = 4 /40 + 4 / 40 = 8 / 40 = 1 / 5 = 0.200 = 20.0 %. . B.- Si los eventos son Compatibles (aquellos que pueden verificarse simultáneamente, es decir cuando hay eventos que son comunes o que hay intersección o atibl , es cir e ntos e ue ti abil ad d even A, s dec , P(A más e a : E 2.- Se lanza una moneda y un dado al aire. ¿ Cuál es la probabilidad de obtener una cara en la moneda o un dos en el dado? Solución : suceso de obtener un 2 en el dado; el espacio muestral de una moneda es 2, (cara y sello) mientras que el espacio m 2x6 = 12. El gráfico nos indica el es C 1 C 2 C 3 C 4 C 5 C 6 C 1 2 3 4 5 6 Eventos de A = ⎨1C, 2C, 3C, 4C, 5C, 6C⎬, P(A) = 6 / 12; el evento B = ⎨2C, 2S ⎬, luego P(B) = 2 / 12, los eventos que son comunes a ambos, es decir, que se interceptan n: (A o B) = P(A) + P(B)−P(A∩B), −1 / 12 = 7 / 12 = 0.5883 = 58.33 %, por lo tanto, esa es la OBABILIDAD CONDICIONADA.- La probabilidad de que ocurra un evento B rrido algún otro evento A, se denomina PROBABILIDAD so A∩B = ⎨2C⎬, luego, P(A∩B) = 1 / 12, ahora se aplica el teorema de la suma para datos compatibles. Tenemos: P P(A o B) = 6 / 12 + 2 / 12 probabilidad buscada. PR cuando se sabe que ha ocu
  159. CONDICIONADA y se designa como P(B/A). Él símbolo P(B/A) se

    lee como la probabilidad de que ocurra B sabiendo que ocurrió A o sencillamente probabilidad de B dado A Las probabilidades condicionadas están relacionadas a probabilidades ociadas a los eventos definidos en subpoblaciones o espacios muéstrales reducidos. Se dice que la probab fecta por la ocurren leatorio. La se llama la as ilidad de ocurrencia de un evento dado es condicionada, si esta se a cia de otro evento presente. Definición.- Sean A y B dos eventos asociados a un experimento a robabilidad que ocurra el evento B, dado que ocurrió el suceso A p probabilidad condicionada del suceso B, esta se simboliza por P(B/A) y se calcu mediante la fórmula: ( ) ( ) ( ) , A P A El conjunto P(A∩B), se le denomina probabilidad conjunta de los eventos A y B. El conjunto A∩B se define como la intersección de A y B, es decir, los eventos comunes entre A y B. B A P B P ∩ = Si P(A) = 0, entonces P (B/A), no está definida. ( ) ( ) ( ) , A P B A P A B P ∩ = Entonces, P(A∩B) = P(A) P(B/A). Si P(B/A) ≠ P(B), se dice que el evento B es dependiente del evento A. del suceso A, luego: robabilidad Compuesta. j. Un curso de matemáticas avanzada está formado por 10 administradores, 30 dores, 10 ingenieros y 5 conomistas aprueban el curso con 20 puntos. Se seleccionó un al azar un participante l mismo y se detecto que la calificación obtenida en el curso había sido de 20 puntos. ¿Cuál es la probabilidad de que ese participante sea un ingeniero? Solución: si llamamos A al evento en que un participante obtuvo una calificación de puntos; si denominamos como B el evento de seleccionar un ingeniero y si amamos A∩B, los eventos comunes entre A y B, tenemos los siguientes sucesos: de participantes en este caso será el espacio muestral, que en el problema nteado es de 50, por lo tanto los diferentes eventos serán: Luego P(A) = 18 / 50. B = ⎨10 ing. con 20 ptos., 20 ing., con menos de 20 ptos.⎬ . A∩B = , luego P(A∩ = 10 / 50. Sí P(B/A) = P(B), se dice que el suceso B es independiente P(A∩B) = P(A) P(B), esta fórmula recibe el nombre de la P E 3.- ingenieros y 10 economistas. Al finalizar el curso 3 administra e de 20 ll El total pla A = ⎨3 admist., 10 ing. 5 econ., ⎬ , ⎨10 ing. con 20 puntos⎬ B)
  160. ) ( ) ( ) ( , 9 5 18

    0 50 18 50 10 = = = P ADMINISTRACION INGENIERO ECONOMISTA TOTAL 1 ∩ = B A P B A P A Por lo tanto 5/9=0.5556 = 55.56 %, es la probabilidad de extraer un ingeniero con 20 puntos. Este problema se puede resolver también aplicando una tabla o matriz de doble entrada donde se observan todos los eventos: Aprobaron Con 3 10 5 18 20 puntos. No Aprobaron 7 Con 20 puntos 20 5 32 TOTAL 10 30 10 50 En la tabla se observa que el espacio muestral de 50 se redujo a 18, que vienen a ser los nteamiento del problema; por otro lado los ste caso son 10, que vendrían a ser los casos uscada será el cociente que resulta de dividir osibles (CP), así: casos posibles de acuerdo con el pla probaron con 20 en e ingenieros que a favorables, por lo tanto la probabilidad b os casos favorables (CF) entre los casos p l .%. 56 . 55 5556 . 0 9 5 18 10 = = = = = CP CF P 4.- Se lanza un dado y se obtiene un número par. ¿Cuál es la probabilidad de que el to común entre los sucesos A y B será ∩B. El espacio muestral del lanzamiento de un dado es 6, ahora bien los diferentes a serán: A = ⎨2, 4,6⎬, entonces P(A) A P(A∩B) = 1 número obtenido sea múltiplo de 3? Solución: Sea A, el evento de obtener un número par, y sea B el evento de obtener n número múltiplo de 3, entonces el even u A eventos del problem = 3/6 B = ⎨3, 6⎬. ∩B = ⎨6⎬, luego /6 ( ) ( ) ( ) .%. 33 . 33 3333 . 0 3 1 6 3 6 1 = = = = ∩ = A P B A P A B P
  161. Este problema también se puede resolver aplicando una tabla o

    matriz de doble entrada, De 3 Múltiplos de 3 AL en donde se observan todos los eventos del problema planteado, observemos la siguiente tabla: Números Múltiplos Números no TOT Eventos que Son pares 3 6 2, 4 Eventos que No son pares 3 1, 5 3 TOTAL 2 4 6 Solución: En esta tabla se observa que los eventos pares en total son 3, por lo tanto el espacio muestra original que era 6 se redujo a 3. En la fila de los eventos que son pares se observan los que cumplen con la condición de ser múltiplo de 3, por lo tanto es un solo caso favorable, de la misma forma se observa que solo hay 3 caso posibles de úmeros pares, luego la probabilidad buscada será el cociente que resulta de: n .%, 33 . 33 3333 . 0 3 ! = = = = CP CF P esta es la probabilidad buscada. ROBABILIDAD PRODUCTO.- Se conoce como probabilidad producto de 2 onjunta. En la probabilidad producto es muy importante el uso de la letra onjunta se designa así: P(A∩B) = P(AB)= P(A y B), si esta, se multiplica por P(A), así: P eventos A y B en el espacio muestral E, la probabilidad de que los 2 sucesos se den simultáneamente. La probabilidad de ocurrencia simultanea de 2 o más eventos reciben el nombre de robabilidad c p “Y”, esta letra es característica en la gran mayoría de los problemas relacionados con la probabilidad producto, ya que esta se utiliza muy a menudo en el enunciado del roblema. . La probabilidad c p cualquiera de estos términos significa lo mismo. La formula de la probabilidad conjunta se obtiene de la formula de la probabilidad ondicional, c ( ) ( ) ( ) ( ) ( ) ( ) ( ) A B P A P B A P A P B A P A B P . . = ∩ → ⎥ ⎤ ⎢ ⎡ ∩ = . Esta la fó A P ⎦ ⎣ rmula para calcular la probabilidad producto o lo que es lo mismo, la probabilidad conjunta. La formula de la probabilidad conjunta para eventos independientes será: P(A∩B) = P(A) P(B). La fórmula para calcular la probabilidad conjunta de eventos dependientes será: P(A∩B) = P(A) P(B/A).
  162. Si en un experimento aleatorio pueden ocurrir los sucesos A,

    B, C, .......,N (A∩B∩C∩.......∩N) = P(A) P(B) P(C)..........P(N). De la misma forma si en un (A∩B∩C∩.........∩N) = s de suma importancia en los problemas de probabilidad conjunta diferenciar los o sin sustitución los primeros se refieren a los experimentos que se realizan se vuelven a colocar en el mismo lugar donde se realiza el experimento aleatorio. .- ¿Cuál es la probabilidad de obtener 2 caras en 2 lanzamientos al aire de una e sacar una cara en una oneda es 1/2. Si llamamos A, el evento de sacar cara en el primer lanzamiento y se a formula: olución: Para que los eventos A y B sean independientes tiene que cumplirse que (A∩B) = P(A) P(B) = 0.65 x 0.40 = 0.26, por lo tanto los eventos A y B no son conjunta obtenida, ue es 0.26. atro números 3 y después otro úmero diferente de 3 en 5 tiros de un dado equilibrado?. dado tiene una probabilidad de 1/6, puesto que el espacio muestral independientemente, entonces: P experimento aleatorio pueden ocurrir los sucesos A, B, C,........., N dependientes, entonces: P P(A) P(B/A) P(C/A∩B).............P(N/A∩B∩C∩............∩N − 1). E eventos aleatorios con reposición o sustitución de los eventos aleatorios sin reposición y Los eventos aleatorios con reposición son característicos de los eventos independientes. Los eventos sin reposición son característicos de los sucesos dependientes. 5 moneda normal de 5 bolívares? Solución: Los eventos son independientes y la probabilidad d m llama B el evento de sacar cara en el segundo lanzamiento, entonces: P(A) = P(B) = 1/2. Luego la probabilidad conjunta para eventos independientes se calcula con l P(A∩B) = P(A) P(B). = 1/2 x 1/2 = 1/4 = 0.25 = 25.0 %, esta es la probabilidad buscada. 6.- Si la probabilidad de un evento A es igual 0.65, la probabilidad de un evento B es de 0.40 y la probabilidad conjunta de A y B es igual a 0.20. Determine entonces si los eventos A y B son independientes. S su probabilidad conjunta sea igual a 0.20, para ello aplicamos la formula de la probabilidad conjunta de eventos independientes de esta forma: P independientes puesto que la probabilidad conjunta entre A y B es igual a 0.20 de acuerdo con los datos dados y esta es diferente de la probabilidad q 7.- ¿ Cuál es la probabilidad de sacar primero cu n Solución: Los 5 tiros del dado son independientes, el obtener un número determinado en un
  163. del lanzamiento de un dado posee 6 eventos diferentes. Ahora

    bien la probabilidad de obtener un número diferente de 3 es: 1 − 1/6 = 5/6. Si llamamos A, B, C y D los eventos de obtener un 3 y llamamos E el suceso de sacar un número diferente de 3, entonces las probabilidades de A, B, C, D E, serán: = P(D) = 1/6, y P(E) = 5/6, por ser el problema una probabilidad onjunta de eventos independientes se aplicará a siguiente formula: ∩D∩E) = P(A) P(B) P(C) P(D) P(E) = (1/6) x (5/6) = 5/ 7776 = 0.0006 = 6 %, esta es la probabilidad conjunta solicitada. de 40 cartas, si se sustituye la primera carta antes de mar la segunda? ora se aplica la formula de la probabilidad conjunta para eventos dependientes así: 10 = 1/100 = 0.01 = 1.0 %, esta es la probabilidad uscada. araja de 40 cartas, si no se sustituye la primera carta ntes de sacar la segunda carta? de sacar la segunda carta sin reposición, entonces la y P(A) = P(B) = P(C) c P(A∩B∩C 4 0.0 8.- ¿Cuál es la probabilidad de sacar 2 ases consecutivos en 2 cartas tomadas al azar de un juego ordinario de barajas to Solución: Este es un problema de probabilidad conjunta para eventos independientes por cuanto son suceso aleatorio con sustitución. El espacio muestral es 40; un juego de barajas tiene 4 ases, por lo tanto la probabilidad de sacar un as es P(4/40)= 1/10. Si llamamos A, el evento de sacar la primera carta y B el suceso de sacar la segunda carta, entonces: P(A) = P(B) = 1/10, ah in P(A∩B) = P(A) PB) = 1/10 x1/ b 9.- ¿Cuál es la probabilidad de sacar 2 ases consecutivos en 2 cartas tomadas al azar de un juego ordinario de una b a Solución: Este es un problema de probabilidad conjunta para eventos dependientes por cuanto no hay sustitución del primer evento al sacar el segundo. Si llamamos A, el suceso de tomar la primera carta, entonces la probabilidad de A será P(A) = 4/40 = 1/10, si ahora llamamos B el evento probabilidad de B será (B) = P(B/A)= 3/39, esto es así por cuanta B depende de A, al ocurrir el suceso A entonces en el juego de cartas quedan 39 barajas de las cuales 3 son ases. Ahora aplicamos la formula de la probabilidad conjunta para eventos dependientes se tiene: P(A∩B) = P(A) P(B/A) = 1/10x 3/ 39 = 1/130 = 0.0077 = 0.77 %, esta es la probabilidad conjunta buscada. 10.- Una caja contiene 100 bombillos, se sabe que hay 15 defectuosos. Se toman 2 bombillos aleatoriamente sin remplazarlos. ¿Cuál es la probabilidad de que los 2 bombillos estén defectuosos?
  164. Solución: Lo primero que se observa es un experimento sin

    reposición, por lo tanto la probabilidad a buscar es la conjunta para eventos dependientes. Si se llama A, el evento de sacar el primer bombillo defectuoso, entonces la probabilidad de A será P(A)= 15/100, y si llamamos B el suceso de sacar el segundo bombillo defectuoso, entonces su probabilidad será: P(B) = P(B/A) = 14/99, esto es así por ser B un suceso dependiente de la ocurrencia de A, es decir, que al ocurrir el evento A, entonces quedan en la caja 99 bombillos de los cuales solo 14 serán defectuoso. Ahora se aplica la formula de la probabilidad conjunta para sucesos dependientes así: P(A∩B) = P(A) P(B/A) = 15/100 x 14/99 = 21/ 990 = 0.0212 = 2.12 %, esta es la probabilidad conjunta buscada. s. Se extraen de la caja aleatoriamente 3 cepillos sin remplazarlos. ¿ Cuál es la probabilidad de que sean extraídos de la caja en el orden Solución: nto de extraer el primer cepillo verde, entonces su probabilidad de xtraerlo será P(V) = 6/15, si ahora se llama B el evento de sacar en la segunda 40 , esta es la probabilidad conjunta buscada. resuelvan un determinado problema son 2/3 3/4 respectivamente. Encuentre la probabilidad de que el problema sea resuelto eamente en solución del mismo. Para ello calculamos la probabilidad de fallar de A y B así: = 1−P(B) = 1−P(B) = 1−3/4 =1/4.. Si la probabilidad de fallar A se le denomina ue: 11.- Un comerciante recibe en su negocio una caja con un pedido que contiene 6 cepillos verde, 4 blancos y 5 azule verde, blanco y azul?. Como la extracción de los cepillos de la caja es sin reemplazo, entonces los sucesos a obtener son eventos dependientes. El total de cepillos es de 15; si se denomina con V el eve e extracción un cepillo blanco, entonces su probabilidad de salir será P(B) =P(V(/B) = 4/14, esto es así por ser B un evento que depende de la ocurrencia de V, por lo tanto al salir el primer evento verde en la caja quedan 14 cepillos, finalmente se denomina con A, el suceso de la extracción del tercer cepillo que será azul y su probabilidad de salir es P(A) = P(A/V∩B) = 5/13, con estos datos se aplica la siguiente fórmula: P(V∩B∩A∩) = P(V) P(B/V) P(A/V∩B) = 6/15 x 4/14 x 5/13 = 4/91 = 0.0440 = 4. % 12.- Las probabilidades de que A y B y cuando menos por uno de los dos. Solución: Este problema quedará resuelto si A y B no fallan simultán la P(A) = 1−q, entonces, q =1−P(A) = 1−2/3 = 1/3, luego la probabilidad de fallar el evento B es así: q P(A1 ), entonces la de fallar B será P(B1 ), luego tenemos que P(A1 ) = 1/3 y P(B1 ) =1/4, ahora calculamos la probabilidad conjunta de A1 y B1 así: P(A1 ∩B1 ) = p(A1 ) P(B1 ) = 1/3 x 1/4 = 1/12, esta es la probabilidad conjunta de fallar A y B, ahora bien, para saber cual es la probabilidad de acertar aplicamos la formula: P = 1−q, como q = 1/12, esta es la probabilidad de fallar conjuntamente A y B, entonces se tiene q P = 1−1/12 = 11/12 = 0.9167 = 91.67 %, esta es la probabilidad de que el problema sea resuelto cuando menos por uno de los dos.
  165. 13.- Se tiene una caja con 20 fusibles, se sabe

    que 5 fusibles están defectuosos. Se eligen al azar 2 fusibles y se retiran de la caja en forma sucesiva sin remplazar al primero. ¿Cuál es la probabilidad de que ambos fusibles sean defectuosos? Solución: De acuerdo con el planteamiento del problema se trata de una probabilidad conjunta para eventos dependientes, ya que el mismo es sin sustitución. Si se denomina con A, el evento de sacar el primer fusible defectuoso, entonces la robabilidad de ocurrencia será: be que ocurrió A, ntonces en la caja quedan 19 fusibles de los cuales 4 son defectuosos. Ahora ilidad e sacar 2 fusibles defectuosos consecutivamente. ETIDAS.- s repetidas son de ez, una vez. l suceso ocurra es la probabilidad de acertar. De la misma forma, un evento no ocurre en una prueba, se acostumbra a decir que el suceso falla, y que la = 1 − P ada ula (n, r) pr qn−r , si r ≤ n. En esta fórmula n es el número total de suceso, r es el número total de aciertos, n−1 es el número total de fallar, C es la com inación de los eventos n y r, p es la robabilidad de acertar un evento determinado, q es la probabilidad de fallar y P1 es la robabilidad buscada. Recuerde que en los problemas donde se aplica este teorema la p P(A) = 5/20, si ahora llamamos B el suceso de sacar el segundo fusible defectuoso, la probabilidad de ocurrencia será: P(B) = P(B/A) = 4/19, esto es así debido a que el evento B depende de la ocurrencia de evento A y como se sa e aplicamos la formula de la probabilidad conjunta para sucesos dependientes así: P(A∩B) = P(A) P(B/A) = 5/20 x 4/19 = 1/19 = 0.0526 = 5.26 %, esta es la probab d UCESOS DE PRUEBAS REP Los sucesos de prueba S gran importancia en el cálculo de probabilidades y sus aplicaciones. Este problema se presenta cuando un experimento u observación se repite cierto número de veces bajo las mismas condiciones. Se dice que un suceso simple interviene en una prueba si necesariamente ocurre o deja de ocurrir una sola vez. Se dice que un suceso simple interviene en pruebas repetidas si necesariamente bajo exactamente las mismas condiciones, ocurre o deja de ocurrir, cada v Si un evento ocurre en una prueba, se acostumbra a decir que se acierta, y que la probabilidad de que e si probabilidad de que el suceso no ocurra es la probabilidad de fallar. TEOREMA 1 (Ley del binomio).- Sea P la probabilidad de acertar y q la probabilidad de fallar en un suceso de una prueba. Entonces la P1 de exactamente r aciertos en n pruebas repetidas está d por La form P1 = C b p p palabra EXACTAMENTE es la clave. Ej. 14.- Calcular la probabilidad de obtener exactamente 3 cuatros en 5 lanzamientos de un dado normal.
  166. Solución: Cada tiro del dado es una prueba, llamaremos acertar

    el acto de obtener un cuatro. La probabilidad de obtener un 4 en el dado o acertar es de 1/6, entonces p = /6, la probabilidad de no obtener un 4, es decir, la probabilidad de fallar es: ica a 1 así: P1 = C (n, r) pr qn−r 1 1−1/6 =5/6 = q, como n = 5, r = 3, n−r = 2, p =1/6, C(5,3) = 10, ahora se apl la formula del teorem 032 . 0 7776 6 6 6 10 P 5 1 = = = ⎟ ⎜ ⎟ ⎜ = 2 250 25 x 10 5 1 2 3 ⎞ ⎛ ⎞ ⎛ 15.- Una moneda de 5 bolívares se lanza 8 veces al aire. ¿Cuál es la probabilidad de obtener exactamente 6 caras? = 8, = 6, = 2, aplicando la fórmula del orema 1 se tiene: ⎠ ⎝ ⎠ ⎝ 0.0322 = 3.22 %, esta es la probabilidad buscada. Solución: Es muy importante que observe en este tipo de problemas la palabra clave: exactamente, tal y como lo anuncia el teorema 1.. En un lanzamiento de una moneda la probabilidad de obtener una cara es de 1/2 y la probabilidad de fallar es también de 1/2, por lo tanto p = q = 1/2. En este problema n r n−r p = q = ½, te ( ) ( ) . ... 256 2 1 2 2 2 buscada ad probabilid x x ⎠ ⎝ ⎠ ⎝ TEOREMA 2.- Sea P la probabilida . .. .. .%,.. 94 . 10 1094 . 0 28 1 8 8 6 , 8 , 1 la es que x r n = = = d de acertar y q = 1−p la probabilidad de llar de un suceso en una prueba. Entonces la probabilidad P2 de obtener por lo sta fórmula es similar a la del teorema 1, pero para deter n este odo los valores de n y finalmente se sum matoria es la probabilidad buscada. En la aplicación de esta rmula hay una frase clave que es: por lo menos, lo cual significa que se deben tomar 6.- Una moneda de 5 bolívares se lanza al aire 8 veces. ¿Cuál es la probabilidad de que por lo menos aparezcan 6 caras? 7 8 1 1 2 6 x C q p C r n r = ⎟ ⎞ ⎜ ⎛ ⎟ ⎞ ⎜ ⎛ = = − P fa menos r aciertos en n pruebas está dada por la relación ∑ − ≤ = n n ) r , n ( 2 . n r . ,......... q p C P = r r r = n r E minar la probabilidad e caso se calculan t an todas las probabilidades y el resultado de la su fó las probabilidades desde r hasta n y luego sumarlas todas y esa será la probabilidad buscada. Ejemplo: 1
  167. Solución: Este es un problema que se resuelve aplicando el

    teorema 2 por cuanto presenta la palabra clave por lo menos, que indica la aplicación de la fórmula del teorema mencionado. En el lanzamiento de una moneda la probabilidad de acertar es /2 y la de fallar es 1/2 por lo tanto la , 6) (1/2)6 (1/2)2 1 p = q =1/2, n = 8, r = 6 y n – r = 2, C(8,6) = 28, C(8,7) = 8, C(8,8) = 1 aplicando la formula tenemos: P2 = ∑ C(n, r) pr qn-r = ∑ C (8, 8) (1/2)8 + C (8, 7) (1/2)7 (1/2) + C (8 % 45 . 14 1445 . 0 256 2 2 2 8 8 8 2 buscada. 37 1 x 28 1 x 8 1 8 8 8 P = = = + + = ∑ , esa es la probabilidad 7.- La probabilidad de que un hombre de 50 años viva 20 años más, es de 60.0 . Dado un grupo de 5 hombres de 50 años, ¿cuál es la probabilidad de que por lo enos 4 hombres lleguen a 70 años? olución: De acuerdo con el planteamiento del problema se trata de sucesos de ruebas repetidas tal y como lo plantea el teorema 2, por cuanto presenta la frase clave or lo menos. En este problema la probabilidad de que un hombre viva 70 años es: a probabilidad que llegue a 70 años es: 60/100 = 6/10 = p, la probabilidad que no egue a los 70 años es 4/10 = q, n = 5, r = 4 y n – r = 1. Aplicando la fórmula el teorema 2 se tiene: 1 = ∑ C (n, r) pr qn–r = ∑ C(5,5) (6/10)5 + C(5, 4) (6/10)4 (4/10) = , esta es la robabilidad buscada. 1 % m S p p L ll d P 7776 / 100000 + 5 x 5184 / 100000 = 7776 / 100000 + 25920 / 100000 = 1053 /3125 =0.3370 =33.70 % p
  168. EL PROGRAMA INFORMATICO SPSS 13 Y EL ANALISIS ESTADISTICO (CAPITULO

    5) OBJETIVO: Aplicar los principios básicos del programa computacional de Estadística SPSS 13.0 en la resolución de problemas relacionados con la n de SPSS. Características del SPSS. Instalar el programa SPSS. Estructura del SPSS. Archivos de datos del chivos de síntesis del SPSS. Estadística Descriptiva. CONTENIDO: Definició SPSS. Editor de Datos del SPSS. Transformar datos mediante el SPSS. Modificar Archivos de datos en el SPSS.El Visor del SPSS. Ar Análisis Estadístico con el SPSS. Aplicación del SPSS en estadística descriptiva. Solución de problemas estadísticas con el SPSS. CURSO DE SPSS (2006) (MATERIAL TOMADO DE LA RED) http://www.mailxmail.com/curso-software-analisis-estadistico/introduccion El principal objetivo de este curso es capacitar al participante, en el manejo del paquete ndo gráficos, tablas o Dentro de los objetivos secundarios encontramos: • Conocer las principales a, así como los tadística descriptiva, haciendo énfasis n los procedimientos de SPSS que nos permiten calcularlas. Identificar los métodos empleados para la captura y procesamiento de las variables de respu os en el análisis descriptivo. • Reconocer cada uno de los diferentes tipos de gráficos con que cuenta SPSS, exhibie on que cuenta SPSS para generar tablas personalizadas, evidenciando las diferentes aplicaciones que se pueden realizar con ellos. estadístico SPSS, inculcado los conceptos y forjando los conocimientos necesarios para que pueda realizar diversos análisis descriptivos de datos, emplea estadísticos y que a su vez esté en capacidad de interpretar los resultados extrayendo sus respectivas conclusiones. ventanas del programa detallando cada uno de los elementos que las componen, así como sus aplicaciones. • Aprender a utilizar los diversos sistemas de ayuda con que cuenta el programa, evidenciando sus fortalezas y debilidades, así como las aplicaciones que se pueden realizar con ellos. • Reconocer los métodos para la importación de datos con que cuenta SPSS, definiendo las diferentes fuentes compatibles con el program requerimientos necesarios para realizarla. • Examinar cada uno de los procedimientos con los que cuenta SPSS, para transformar los datos e incluso para crear nueva información a partir de la existente. • Conocer las principales medidas de la es e • esta múltiple, abordando los procedimientos emplead ndo la forma de crearlos, modificarlos y/o personalizarlos. • Aprender los procedimientos c
  169. LECCIÓN 1 - INTRODUCCIÓN SPSS es un poderoso paquete para

    el análisis estadístico y la gestión de datos, fue diseñado en un principio para las ciencias sociales en la década de los 70’s. Con el pasar El objetivo de este curso es hacer una pequeña introducción al paquete, para que usted se haga una impresión de los diferentes tes del programa y la forma de emplearlos en el análisis descriptivo de datos. INICIAR EL PROGRAMA SPSS 13 Para conectarse al SPSS 13 existen dos opciones, la primera es mediante el acceso directo, si lo hay (Ver Figura I), Figura I del tiempo se observo que su aplicación se extendía a la mayoría de las ramas de la ciencia que utilizan la estadística para el análisis de datos y se fueron agregando nuevos módulos para pruebas estadísticas especializadas. componen SPSS 13.0 para Windows.lnk y la segunda es utilizando el recorrido Inicio...... Programas..... SPSS para windows..... SPSS 13.0 en español. Al ejecutar el programa por cualquiera de las dos formas se abre automáticamente el asistente de inicio (ver Figura 1.0), donde se nos plantea la interrogante ¿Qué desea hacer?, lo cual comprende 6 alternativas: Figura 1.0
  170. * Ejecutar el tutoríal. * Introducir datos. * Ejecutar una

    consulta creada anteriormente. * Crear una nueva consulta mediante el asistente de base de datos. * Abrir una fuente de datos existente. En la parte inferior de de esas opciones se observar una ventana que muestra aquellos archivos de datos que han sido usados por el SPSS, si es la primera vez que se inicia desde su instalación expondrá la opción de Más archivos, la cual al ser elegida abre una ventana de exploración para la ubicación de archivos en formato (*.sav); en otras palabras, archivos correspondientes a datos del SPSS 13. * Abrir otro tipo de archivo. Debajo de esta alternativa se puede observar una casilla con el registro de los diferentes archivos que se han utilizado, tales como archivos de texto, bases de datos, hojas de cálculo, archivos de sintaxis, archivos de resultados, etc. Sin embargo, si es la primera vez que se inicia desde su instalación mostrará la alternativa: Más archivos, la que al seleccionarse abre una ventana de exploración para la localización de archivos en cualquier formato. LECCIÓN 2 - TIPOS DE ARCHIVOS Antes de continuar es necesario aclarar los tipos de archivos que genera SPSS, los cuales son:
  171. 1. Archivos de Datos: son los archivos generados por el

    sistema (SPSS), en los cuales se contiene la información (casos y variables). Este tipo de archivos se generan con la extensión *.sav y son propios del paquete. 2. Archivos de resultados: son los archivos generados por el sistema, en los cuales se plasman todos los resultados de los procesos que se han realizado con el paquete, tales como gráficos, tablas o estadísticos. Este tipo de archivos se identifican con la extensión *.spo y son propios del paquete. 3. Archivos de sintaxis: son los archivos generados por el sistema, en los cuales se puede acceder a los diferentes procesos del paquete mediante la utilización de palabras clave o líneas de código. Este tipo de archivos se identifican con la extensión *.sps y son propios del paquete. Una vez aclarado este concepto, procederemos a seleccionar la opción Abrir una para ubicar el archivo en C:\Mis documentos\Cap1.sav; una vez ubicado ar. fuente de datos existente en el asistente de inicio, y hacemos clic en Aceptar. Inmediatamente se abre una ventana de exploración o navegación (Figura 2) con la cual podemos ubicar de forma fácil un archivo dentro de nuestro PC o dentro de la red. Para nuestro caso, vamos a ubicar el archivo Cap1.sav, el cual debes descargar con antelación. Para efectos del curso vamos a suponer que ya descargaste los respectivos archivos adjuntos y que se encuentran en la carpeta mis documentos de su ordenador. Después de aclarar este punto, continuamos para lo que empleamos la ventana de navegación hacemos clic en Acept
  172. Una vez que hemos abierto el archivo podemos observar que

    los datos son representados en el Editor de datos del SPSS (Figura 3), antes de continuar haremos una pequeña descripción de esta ventana, ya que es la principal del programa por lo que es necesario conocer su contenido. LECCIÓN 3 - PARTES EDITOR DE DATOS DE SPSS El editor de datos de SPSS es la ventana principal del paquete; en ella encontramos las herramientas fundamentales del programa, además esta ventana es la única que nos permite observar la información (Datos y Variables), en su forma original (desagrupada), para tener una idea más clara debemos conocer algunos conceptos fundamentales. Antes de conocer las partes del editor de datos es necesario conocer como está diseñada la estructura de los datos en SPSS. Variable 1 Variable 2 Caso 1 Observaciones Observaciones Caso 2 Observaciones Observaciones Tabla 1. Estructura del Editor de datos Al observar la tabla 1, notaremos que las columnas representan las variables o preguntas y las filas contienen las observaciones, mediciones o respuestas de dichas preguntas. Cada caso contiene las respuestas de un individuo a la totalidad de las preguntas o variables. artes de la ventana El editor de da Com b ows, el editor de datos del SPSS posee una barra de m cuales podemos encontrar diferentes aplicaciones, procedimientos o procesos. En SPSS se cuenta con diez diferentes menús desplegables como los son (Archivo, Edición, Ver, Datos, P tos se divide en 5 partes: 1. Barra de menús: o cualquier programa basado en am iente Wind enús desplegables, dentro de los
  173. T menús serán explorados a lo largo del curso. ransformar,

    Analizar, Gráficos, Utilidades, Ventana y Ayuda). Algunos de estos 2. Barra de herramientas: En procedimientos mas comúnmente utilizados en el en donde aparecen cada uno de los procesos, procedimientos o elementos que posee el pro o entraremos en detalle de esta acción. LECCIÓN 4 - BARRA DE HERRAMIENTAS Por defecto la barra posee las funciones: Abrir archivo Guardar archivo Imprimir esta barra se encuentran los programa, aunque se puede personalizar el contenido de esta barra mediante la opción menú Ver... Barra de herramientas (Figura 4) al hacer clic nos abre un nuevo cuadro de diálogo llamado mostrar barra de herramientas (Figura 5) en el cual encontraremos la opción personalizar en la parte inferior derecha; al hacer clic en ella, se abre un nuevo cuadro llamado Personalizar barra de herramientas (Figura 6) grama. Por el momento n
  174. Como podemos observar estos tres iconos son comunes en casi

    todos los programas de Windows, por lo cual no entraremos en detalle de ellos. ar cuadro de diálogo ima acción y solamente una. Se activan después de realizar alguna operación en el paquete. Ir a gráfico Este icono nos permite ir rápidamente al último gráfico realizado cambiando a la ventana de resultados y mostrando el gráfico. Ir a caso Como su nombre lo indica nos permite ir a un caso específico, es decir, ir a la posición donde se ubica dicho caso dentro del archivo de datos que se encuentre abierto. Variables Cuando seleccionamos este icono se abre un nuevo cuadro de diálogo (Figura 7), en Recuper Este icono nos permite acceder de forma rápida a los últimos procedimientos que hayamos efectuado en SPSS; es decir, nos muestra los diferentes cuadros de diálogo (ventanas) que hayamos ejecutado (entrado) con anterioridad como frecuencias, gráficos, tablas, etc. Lo que hace es abrir nuevamente el procedimiento seleccionado. Deshacer Rehacer Este par de iconos también son comunes en la mayoría de los programas de Windows, con la diferencia que solo nos permite deshacer o rehacer la últ donde aparece toda la información de cada una de las variables (el nombre, la etiqueta, si hay o no valores perdidos, el nivel de medida, los valores y las etiquetas de cada valor).
  175. La forma de utilizarlo es haciendo clic sobre la variable

    que deseemos en la lista, de manera que la ventana se actualiza y nos enseña la información de la variable seleccionada. Buscar Este icono nos permite ubicar un valor dentro de una variable, es decir, nos permite enc na combinación de caracteres dentro de los registros. Dado que generalmente se utilizan números para representar una categoría (hombre = 0 y mujer la variable *****” (**** = nombre de la variable). La forma de seleccionar una variable es hacer clic sobre ella en el editor de datos, con lo cual el nombre de la variable en la frase cambiará por el de la variable seleccionada. lo más aso ontrar un número o u =1), y a su vez, las bases de datos poseen múltiples variables, sería ilógico esperar que la búsqueda se realice en todo el archivo, es por este motivo que al activar el icono aparece en la parte superior del cuadro de diálogo (Figura 8) la frase “Buscar datos en Podemos observar en el cuadro de diálogo Buscar, una pequeña casilla en la parte inferior izquierda la cual nos da la posibilidad de pedirle que la búsqueda sea exacta posible; esta opción sólo se utiliza en variables alfanuméricas. Por último tenemos el botón Buscar siguiente quien nos permite pasar de un caso o registro encontrado al siguiente. LECCIÓN 5 - BARRA DE HERRAMIENTAS (PARTE II) Insertar c Como su nombre lo indica nos permite ingresar un nuevo caso; es decir, las respuestas de un nuevo individuo. Hago énfasis en las respuestas ya que generalmente se trabaja con encuestas pero también pueden ser observaciones o mediciones si trata de un experimento. Insertar variable
  176. Nos permite ingresar una nueva variable o pregunta, no necesariamente

    tiene que ser respondida por todos los individuos; sin embargo, se recomienda que las variables que se empleen en el archivo cuenten con la mayor cantidad de respuestas ya que es posible que al sacar conclusiones de la información se infiera en la totalidad de la población y solo un fragm rpretación de los datos. Segmentar archivo • Analizar todos los casos, no crear los grupos: esta opción nos permite trabajar con todos los casos de la base y sacar resultados (Estadísticos), con todos los casos u observaciones. • Comparar los grupos: esta opción nos permite comparar los resultados de cada uno de los grupos, de la variable seleccionada. • Organizar los resultados por grupos: esta opción nos permite ver de forma organizada los resultados (gráficos, tablas, estadísticos) por cada uno de los grupos. Esta opción es bastante útil si nosotros deseamos hacer un análisis separado de la muestra por algún tipo de “rangos”, como por ejemplo el género, la región o la fecha etc. La forma de utilizar la segmentación es seleccionar una de las dos últimas opciones e ingresar la variable o las variables que deseamos utilizar como rango y luego darle Aceptar, después de esto cada procedimiento (tablas, gráficos o estadísticos) que le pidamos al programa no lo mostrara de acuerdo a la segmentación. En capítulos posteriores lo utilizaremos para notar su operación. sto se hace con el fin de poder sacar algún resultado representativo de la población y no de la muestra, profundizaremos más os capítulos posteriores. ente haya respondido la pregunta, lo que causa una mala inte Este icono nos permite dividir nuestra base de datos en distintos grupos de acuerdo a la variable que utilicemos para la segmentación; al hacer clic sobre el icono se abre un nuevo cuadro de diálogo (Figura 9), en el que aparecen tres posibilidades. Ponderar Ponderar es dar un peso o valor diferente a cada uno de los casos; es decir, darle mayor importancia a unos valores que a otros, e acerca de este tema en l Seleccionar casos
  177. Esta opción selecciona sólo aquellos casos que cumplan una condición

    especificada por el investigador; adicionalmente el programa también nos permite tomar un fragmento de los casos ya sea de forma arbitraria o no de acuerdo a los criterios que necesitemos. LECCIÓN 6 - OTRAS PARTES DEL EDITOR Etiquetas de valor a de las categorías a la que corresponde cada valor dentro de una variable. Usar conjuntos La barra de posición la encontramos ubicada debajo de la barra de herramientas, esta barra al igual que en Excel, nos indica la fila (caso), la columna (variable) y el valor que Esta opción nos permite observar los valores de los datos o la categoría a la que corresponde; es decir, cuando está activada vemos en el editor de datos las palabras de cada uno de los rangos de las variables (Figura 10) y por el contrario cuando está desactivada vemos los números que les corresponde dentro de cada variable (Figura 11). Es útil para hacerse una ide Este icono nos permite generar o utilizar conjuntos de variables, es útil cuando trabajamos con preguntas de respuesta múltiple o tenemos variables que podemos agrupar para hacer un análisis específico. 3. Barra de posición:
  178. corresponde a la posición seleccionada. Esta barra es un parámetro

    netamente informativo. 4. Vistas del editor de datos: El editor de datos cuenta con dos vistas, la primera es la vista de datos (Figura 13), en la cual podemos visualizar cada uno de los datos (variables y casos); debemos recordar que los casos se representan en las filas y las variables en las columnas. Está es la visión Al igual que en una hoja de calculo SPSS cuenta con un área de trabajo; es decir, un espacio determinado en casos, esta área es de 33.000 variables y 2’000.000 de casos, lo cual nos garantiza que podremos manejar Vista de variables La segunda vista que posee el editor de datos es la vista de variables, y es sin ninguna duda la parte más importante del paquete, de la correcta definición de nuestras variables depende la efectividad de nuestro análisis. La forma de seleccionar esta vista es sencillamente hacer clic sobre la pestaña vista de variables que aparece en la parte inferior izquierda de la ventana; una vez hecho esto podremos ver que la forma en el editor de datos cambia (Figura 14). por defecto del programa. el cual podemos ingresar nuestras variables y cualquier base de datos, hay que notar que para aquellos que tienen la versión estudiantil el número de casos se reduce a 1500. LECCIÓN 7 - VISTA DE VARIABLES
  179. Al observar la parte superior del área de trabajo, notaremos

    que la estructura ha en la fila principal tenemos diferentes propiedades que ya vienen ropiedades son: e generar algún tipo de análisis, comprobar que estén correctamente diligenciados cada uno de los campos. Ta na de las variables de nuestra base o archivo. Por lo tanto la estructura de la vista de variables es: Propiedades Propiedades cambiado, vemos que establecidas en el paquete, estas p Cada una de ellas tiene un propósito específico y es necesario antes d mbién podemos notar que ahora las filas corresponden a cada u Variable1 Definición Definición Variable2 Definición Definición Tabla 2 Estructura Vista de Variables Es importante hacer notar que en esta vista existe una gran diferencia con la vista de s continuar. Ahora conocerem datos (Figura 15), esto es debido que en la vista de variables vamos a definir las características de las variables, es decir, sus propiedades y no vamos a modificar los datos, lo único que realizamos en esta sección es ingresar información adicional de las variables la cual será utilizada en por el programa en el análisis. Una vez aclaradas las diferencias estructurales de las vistas, podemo os cada una de las propiedades de las variables las cuales son:
  180. 1. Nombre El nombre de la variable es la forma

    de identificarla, cada variable debe tener un nombre único y sus características son: • Su longitud no puede superar los ocho (8) caracteres en las versiones hasta la 11.5 y 64 caracteres en la versión 12. Puede ser alfanumérica es decir letras y números. • El primer carácter debe ser siempre una letra. • No se puede utilizar palabras clave (reservadas) como AND, OR y NOT. • No se pueden utilizar caracteres específicos (+, -, *, /, !, ”, #o espacios en blanco). Generalmente 8 caracteres no son suficientes para identificar una variable, por lo que es recomendable utilizar las tres primeras letras de cada palabra de la frase, bre de los datos de que contiene; es decir, i el tipo de caracteres que encontraremos en los registros. Es aconsejable ible tener los datos de forma numérica para estos a la variable que estamos editando, con lo cual la activaremos, en ese momento podemos ver un pequeño cuadrado con unos puntos suspensivos, haciendo clic en el cuadro activaremos el cuadro de diálogo tipo de variable (Figura 16). Los tipos que maneja SPSS son: Estado Civil = estciv Nivel de confianza = nivdecon No necesariamente se debe seguir esta forma, lo realmente importante es que el nom de la variable le permita identificar a que se hace referencia fácilmente. LECCIÓN 8 - VISTA DE VARIABLES (PARTE II) 2. Tipo El tipo de la variable especifica la forma identif ca trabajar las variables de forma numérica ya que el análisis estadístico es una ciencia matemática y para su correcto funcionamiento es necesario realizar las operaciones con números. En algunos casos no es pos casos el paquete nos permite trabajarlos como una cadena de caracteres. La forma de activarlo es haciendo clic en la casilla tipo correspondiente
  181. • Numérico: una variable numérica cuyos valores son números y

    se muestran de elimitador decimal “1,000.00”. • Punto: una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y con la coma como delimitador decimal “1.000,00”. • Notación científica: una variable numérica cuyos valores son demasiado grandes o pequeños por lo cual se utiliza un exponente con signo que representa una potencia en base diez. • 1’000.000.00 = 1.0E+6 ó 0.000001 = 1.0E-6 • SPSS nos permite representarlo de varias formas como 1000000, 1.0E6, 1.0D6, 1.0E+6, • 1.0+6. La notación es útil cuando manejamos cifras extremas de lo contrario es mejor manejarlo de forma numérica. entana aparece un listado donde podemos seleccionar el formato de fecha que nos sea más útil forma estándar, es decir, asume la notación por defecto de Windows para la separación decimal (Enteros (,) Decimales) “1000,00”; es el tipo mas usado. • Coma: una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y con el punto como d • Fecha: una variable numérica cuyos valores representan uno de los diferentes formatos de fecha-calendario u hora-reloj (Figura 17). Se puede introducir la fecha utilizando como delimitadores barras, guiones, puntos, comas, o espacios. Al observar el cuadro de diálogo, notaremos que en la parte derecha de la v o el que mejor se acomode a nuestros datos.
  182. LECCIÓN 9 - VISTA DE VARIABLES (PARTE III) • Dólar:

    una variable numérica cuyos valores representan sumas de dinero en dólares (Figura 18), al seleccionarla se actualiza el listado, en donde debemos seleccionar uno de los formatos preestablecidos. • Moneda personalizada: una variable numérica cuyos valores representan sumas de dinero, al seleccionarla se actualiza la ventana y el listado nos presenta las cinco opciones que tenemos para elegir (Figura 19). La diferencia con el tipo dólar es que nos permite trabajar con 5 tipos de moneda ionar alguno, el programa desconocerá el origen de la moneda y solo tendrá en cuenta que es un tipo de moneda diferente al dólar. e, este ancho incluye los dígitos enteros y los decimales, por ejemplo: Anchura 5 = xxx.xx ó x,xxx.x ó xx,xxx donde x representa un número aleatorio. No debemos cometer el error de pensar que una vez establecida la anchura ya no podremos encontrar una cifra con mayor cantidad de números; ya que esta opción es diferentes; al selecc • Cadena: variable cuyos valores no son numéricos y por ello, no se utilizan en los cálculos. Pueden contener cualquier tipo de caracteres siempre que no exceda la longitud máxima de 255; las mayúsculas y las minúsculas se consideran diferentes ya que trabaja bajo el código ASCII. También se conoce como variable alfanumérica. 3. Anchura Determina el máximo de dígitos que podemos esperar en una variabl
  183. para darle una idea al investigador de las cifras que

    encontrará cuando le pida al paquete información de las variables; es decir, no restringe la cantidad de números sino que es un parámetro informativo, el cual le brinda a la persona que opere el programa una idea de los rangos máximos que puede tomar esta variable, pero no impide sobrepasarlo. 4. Decimales Determina el máximo de dígitos decimales que tendremos, las cifras que superen su longitud serán aproximadas hacia arriba, si superan el valor 5 de lo contrario serán aproximadas hacia abajo, es decir: 1.07X si X <= 5 entonces se aproxima a 0 es decir = 1.07 1.07X si X > 5 entonces se aproxima a 10 es decir = 1.08 Estas dos columnas (Anchura y Decimales) pueden ser editadas directam te desde la ventana de Tipo de variable (Figura 20) ya que esta ventana nos da la posibilidad de Hay que notar que cuando seleccionamos Tipos de variables como Fecha estas activan ya que el formato de la fecha esta predefinido y no podemos inda la posibilidad de utilizar una etiqueta en la cual en definirlas. opciones se des alterarlo, la única opción que tenemos es escoger otro formato de fecha. LECCIÓN 10 - VISTA DE VARIABLES (PARTE IV) 5. ETIQUETA Dado que generalmente los ocho (8) caracteres del nombre no son suficientes para describir la variable, SPSS nos br podemos describir la variable mediante la utilización de un máximo de 255 caracteres. El uso de la etiqueta es bastante útil ya que facilita la interpretación de los resultados (Tablas o Gráficos), a las personas que no han participado en la generación de los procedimientos y desconocen el significado del nombre de la variable. El uso de la etiqueta es opcional, el programa en caso de no existir una etiqueta utiliza el nombre de la variable para generar los resultados. Podemos darnos cuenta de las etiquetas manteniendo el cursor sobre el nombre de la variable en la vista de datos.
  184. En la figura 21, se aprecia claramente la diferencia que

    existe al utilizar las etiquetas y las etiquetas de valor en los resultados. Antes de continuar con la propiedad valores, debemos ver primero las propiedades perdidos y medida ya que el uso de etiquetas de valor está determinado por estas propiedades y en este momento no sería muy clara su • No • No responde o se niega a responder la pregunta no lo afecta EJ: preguntarle a una persona era vez, si no se ha casado nunca esta pregunta EJ: en la variable género (sexo), tenemos los valores (1 = mujeres y 2 = hombres), visar el archivo nos damos cuenta que tenemos en algunos registros el ente cometemos el error de pensar que este es un valor perdido, pero rlos ya que de no definición. 6. Perdidos Los valores perdidos son razones por las cuales no obtenemos una respuesta coherente de algún entrevistado; es decir, es una razón que me indica la causa por la que él entrevistado no me aporta información. Dentro de los valores perdidos podemos encontrar: sabe • No aplica o sencillamente soltera la edad a la que se caso por prim no lo afecta. Debemos tener claro que los valores perdidos son razones y no errores, generalmente tendemos a confundir un valor perdido con un valor que no esta dentro de nuestro rango. después de re valor 3, generalm no lo es, este tipo de valores los debemos considerar como errores ya sea de digitación o de captura y la forma de corregirlos es ir hasta la fuente (entrevistas) y determinar a que grupo pertenecía el individuo. Si no podemos determinar el grupo y los valores son muy pocos es recomendable prescindir de estos casos. SPSS maneja dos tipos de valores perdidos; el primero es perdido por el sistema, el cual se identifica por la ausencia total de datos es decir casillas vacías y la segunda es datos perdidos definidos por el usuario que corresponden a razones por las que no obtuvimos información. Sea cual sea el tipo de valor perdido debemos defini
  185. hacerlo el programa hará los cálculos contando con estos valores

    lo cual afectará severamente los resultados. La forma de definirlos es activando la casilla correspondiente a perdidos, una vez activa observaremos de nuevo el cuadradito en la parte derecha con los respectivos puntos suspensivos, al hacer clic sobre él, se abrirá la ventana de Valores Perdidos (Figura 22) la cual nos ofrece tres posibilidades. un máximo de tres valores perdidos que tendremos en nuestra variable, pueden tomar los valores que deseemos. Se recomienda que exista una distancia considerable • Rango más un valor discreto opcional: se utiliza cuando tenemos varios o de un rango y no hay nos brinda la opción de (PARTE V) 7. Columnas y Alineación Estos dos parámetros son netamente de formato; es decir, de presentación y sus efectos únicamente son apreciables en la vista de datos. La primera propiedad (columna) nos indica el ancho de la columna y la segunda la alineación dentro de la casilla. La columna al igual que en una hoja de cálculo, podemos alterarla de forma directa en la vista de datos colocando el cursor al lado de la columna hasta que aparezca el indicador, hacemos clic y lo sostenemos arrastrando hasta obtener el ancho deseado. 8. Medida • No hay valores perdidos • Valores perdidos discretos: son entre los valores representativos y los perdidos con el fin facilitar su identificación. parámetros de valores perdidos los cuales se encuentran dentr valores representativos de grupos dentro de ellos, además ingresar un valor discreto adicional (Un número específico). LECCIÓN 11 - VISTA DE VARIABLES Es el parámetro más importante de las variables, de su definición depende el tipo de análisis que podemos realizar, dentro de la estadística se han catalogado cuatro diferentes escalas de medida, pero para SPSS estas escalas se resumen en tres: • Nominal: son variables numéricas o de cadena cuyos valores indican una categoría de pertenencia, sin tener un orden dentro de sus categorías. Un ejemplo de variable nominal puede ser el género, la raza, el estado civil, etc. El programa asume que las variables de cadena son siempre variables Nominales.
  186. • Ordinal: son variables numéricas cuyos valores indican una categoría

    de pertenencia y poseen un orden lógico dentro de sus categorías. Un ejemplo de variable ordinal puede ser el nivel de ingresos, categoría del vehículo, nivel educativo, etc. numéricas cuyos valores representan una magnitud y no una categoría. Un ejemplo de variable de escala puede ser la edad, años estudiados, la istancia en metros, la altura, el sueldo, etc. 9. Valores Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite la ble, ya sea en los resultados o en la vista de representar cada categoría es necesario Nominal u Ordinal. La primera casilla corresponde al valor o número, en ella debemos digitar el número al que deseamos dar la etiqueta; la segunda casilla es la etiqueta de valor, en ella digitamos la categoría a la que corresponde ese valor (máximo 60 caracteres) y la tercera casilla corresponde a las etiquetas añadidas, es decir, las categorías que ya hemos ingresado. Es necesario añadir antes de aceptar ya que si no lo hacem uier operación de añadir o de cambiar pendiente. Si deseamos cambiar una etiqueta que ya hayamos añadido, la forma de hacerlo es seleccionándola en la casilla (hacer clic sobre ella), editar ya sea el número o la etiqueta y posteriormente hacer clic en Cambiar. Si • Escala: son variables d Es claro que estas definiciones no son Estadísticas, sencillamente las utilizo por que son a mi manera de pensar la forma más sencilla de entenderlas. Quiero aclarar que este curso está dirigido a todas esas personas que deseen aprender a manejar el paquete sin tener conocimientos de estadística y su área de trabajo sea dentro de otra rama científica. interpretación de los valores de una varia datos. Debido a que se utilizan números para crear una pequeña leyenda que nos permita ver en letras el significado de la categoría a la que corresponde cada número. Las etiquetas de valor no deben exceder los 60 caracteres y se utilizan si: • La variable es categórica, es decir • Se tienen valores perdidos definidos por el usuario. • Para ingresar las etiquetas de valor debemos activar la casilla correspondiente y sucesivamente hacer clic sobre el cuadradito con lo cual se abre la ventana Etiquetas de valor (Figura 23); en esta ventana encontramos tres casillas. os se perderá cualq
  187. por el contrario deseamos eliminarla la seleccionamos y hacemos clic

    en eliminar con lo que desaparece del listado. 5. Área del procesador Nos indica el estado del procesador, posee diversos estados de acuerdo del proceso que este realizando, es bastante útil cuando le pedimos un proceso al paquete y contamos con múltiples registros; en algunos casos la base es tan extensa que puede tardar bastante tiempo la ejecución del resultado, en estos casos generalmente se tiende a pensar que el programa se bloqueo, antes de determinarlo es importante saber cual es el estado del procesador. Además, cuando la licencia caduca, en esta área encontramos el A bla de frecuencias para conocer la ventana de resultados del SPSS, debem archivos los catalogamos con la extensión .spo). Antes de generar resultados necesitamos abrir un archivo de datos, así que a r... datos.... o hacemos clic en el icono de acceso directo mensaje el procesador no esta disponible. LECCIÓN 12 - TABLAS DE FRECUENCIAS Generando tablas de frecuencias hora vamos a generar una ta os recordar que este tipo de (* v mos al menú archivo... abri en la barra de herramientas. Una vez que le pedimos abrir al programa obtenemos una ventana de exploración con la cual vamos a ubicar el archivo Cap1.sav que se encuentra en la ubicación (C:\Mis documentos\Cap1.sav), una vez ubicado lo seleccionamos y le damos abrir. Ahora vamos a generar una tabla de frecuencias, para esto debemos ir al menú ANALIZAR... ESTADÍSTICOS DESCRIPTIVOS... FRECUENCIAS... (Figura 24). Al dar clic en el procedimiento frecuencias surge una nueva ventana llamada FRECUENCIAS (Figura 25).
  188. En la figura 25 podemos observar que el cuadro de

    diálogo se divide en 3 partes. La primera corresponde a la lista de variables, en ella encontramos todas las variables que posee nuestro archivo. El programa nos permite saber el tipo de variable al que El símbolo (<) indica que son cadenas cortas es decir que poseen menos de 8 caracteres, si encontramos el símbolo (>) esto indica que son cadenas largas, más de ocho (8) caracteres. Generalmente este tipo de variables contienen el nombre o la dirección de los encuestados. Si observamos la lista de variables notaremos que las variables están por su etiqueta y no por el nombre, esto es útil si desconocemos el archivo y su contenido, pero si es un archivo que hemos creado o su contenido es familiar, sería más aconsejable manejarlo SPSS pertenece cada una de ellas mediante el icono que se encuentra a su izquierda, diferenciando si son variables numéricas o de cadena. para variables numéricas para variables de cadena por el nombre de las variables. Antes de continuar vamos a ver como se puede cambiar la forma de representar las variables en la lista, para hacerlo es necesario cerrar por un momento la ventada de Frecuencias, luego volveremos a ella. La forma de cerrarla es haciendo clic en cancelar. LECCIÓN 13 - MODIFICANDO OPCIONES DE Una vez cerrada la ventana nos dispondremos a cambiar la forma de representar las variables en la lista, para esto debemos ir al menú Edición... opciones, al hacer clic en opciones se abre un nuevo cuadro de diálogo (Figura 26).
  189. En este cuadro se manejan todas las opciones del paquete;

    al observarlo notaremos que en la parte superior hay una serie de pestañas, cada una de ellas corresponde a un proceso específico del paquete, dentro de estos procesos encontramos (General, Visor, Visor de borrador, etiquetas de los resultados, gráficos, interactivos, tablas pivote, datos, moneda y procesos). Al seleccionar uno de ellos la venta cambiará y nos mostrará las opciones que cada uno maneja. Por el momento nos concentraremos en la pestaña General, en ella encontraremos la opción de listas de variables, en la parte superior izquierda. Esta sección nos permite manipular la forma como deseamos que se representen las ncias; nuevamente abrimos la opción frecuencias en el menú Analizar... Estadísticos descriptivos... Frecuencias, al hacer clic en frecuencias aparecerá el cuad notaremos que ahora las variables se representan con el nombre y a su vez, se encuentran en orden . listas de variables en los diferentes procedimientos del programa. En nuestro caso deseamos que las listas se determinen por el nombre de las variables y en orden alfabético. Para hacerlo debemos hacer clic en el círculo que se encuentra a la izquierda de Mostrar nombres y el de Alfabético (Figura 27). Una vez hecho esto hacemos clic en Aplicar y luego en Aceptar, con lo que los cambios son aplicados. Para comprobar el efecto realizado en las listas de variables, vamos a continuar con la realización de una tabla de frecue ro Frecuencias. Si nos fijamos en la lista de variables, alfabético (Figura 28)
  190. La segunda parte en la que se divide la ventana

    de Frecuencias, es la casilla de selección, en ella se muestran las variables que han sido escogidas para el análisis. La forma de escoger las variables es hacer doble clic sobre ellas ó seleccionándolas y luego hacer clic en el botón Ingresar (Figura 29). Una vez seleccionadas veremos como las variables aparecen en la casilla de selección y también se activan los iconos correspondientes a Aceptar y Pegar, los cuales permanecerán inactivos mientras no seleccionemos, por lo menos una variable. diálogo se denomina las opciones de análisis, dentro de estas opciones encontramos Estadísticos (nos permiten solicitar los l). LECCIÓN 14 - VISOR DE RESULTADOS Visor de resultados En esta ventana se representan de forma gráfica todos los procedimientos (Tablas, Gráficos o Estadísticos) que se hayan ejecutado en el programa. SPSS cuenta con dos tipos diferentes de Ventanas de resultados, el primero es el Visor de Resultados (Figura 31) donde se muestra de forma interactiva los resultados de los procesos y los La tercera parte que conforma el cuadro de estadísticos descriptivos y de resumen opcionales para las variables numéricas), Gráficos (solicitar la creación de gráficos de barras o histogramas para estas variables) y Formato, el cual nos permite cambiar el formato de la tabla de frecuencias. Esta parte la analizaremos en los capítulos siguientes. Por el momento nos limitaremos a generar una tabla de frecuencias para las variables Género (categoría de precio del vehículo principal) y estciv (estado civi
  191. organiza en forma jerárquica de acuerdo con el orden que

    se hayan realizado; la segunda ventana Visor de Borrador (Figura 32), muestra los resultados en formato de texto, el cual podemos abrir por medio de cualquier lector de texto. La principal diferencia de estas dos ventanas, es que en el visor de Borrador no puedo modificar el formato de los resultados, además se pierden las propiedades interactivas de los objetos. Mientras que en el visor de Resultados puedo ordenar y editar los resultados o inclusive generar nuevos procesos. En la Figura 33 podemos observar que la ventana de resultados está dividida en tres a través de los diferentes análisis realizados; la segunda es el visualizador de resultados en el cual obtenemos la imagen de los resultados y ferentes procedimientos del paquete. Dado que el visor de resultados es más completo y contiene propiedades de edición, nos concentraremos en el estudio de esta ventana. partes. La primera de ellas es el navegador de resultados, está sección nos permite explorar los resultados que hemos obtenido la tercera es las opciones de ventana, en la cual encontramos los di
  192. Debemos señalar la variable Género y añadirla, luego señalar la

    variable estciv y añadirla (Fig.1-30). Una vez añadidas a la casilla de selección hacemos clic en aceptar con lo cual se abrirá la ventana de resultados y nos mostrará la tablas de frecuencias para estas variables. Antes de analizar los resultados vamos a conocer un poco sobre la estructura de esta Navegador de resultados ventana y los elementos que la conforman. LECCIÓN 15 - NAVEGADOR DE RESULTADOS Básicamente el navegador de resultados tiene una estructura de árbol, en la cual podremos identificar, los procesos así como las propiedades de cada uno de los procesos.
  193. Para efectos del curso definiremos proceso a cualquier tipo de

    análisis que realicemos con el paquete; es decir, que consideraremos como proceso la generación de frecuencias, las tablas de contingencia, la generación de un gráfico, etc. Si nos fijamos en la figura 35 podremos observar que en este caso tenemos dos procesos, el primero corresponde a el análisis de frecuencias y el segundo a un análisis explorar (estos procesos serán examinados con mayor dedicación en los capítulos posteriores). ue están presentes en todos los procesos del paquete, los cuales son el Titulo y las notas. Podemos ver en la gráfica 35 que algunos de los resultados tienen en su izquierda un libro cerrado y otros uno abierto, esto se debe a que el programa nos brinda la posibilidad de ocultar o ver un resultado simplemente haciendo clic en el signo que se encuentra a su izquierda, cuando el signo es (+) nos indica que ese resultado está oculto y si es (–) nos indica que está desplegado o abierto. Nosotros podemos ocultar una propiedad o un proceso, ya que su forma de ejecución es exactamente igual. Además de esto el navegador también nos permite organizar los resultados a nuestro criterio y es tan sencillo como seleccionar la propiedad o el procedimiento que Debajo de cada proceso encontraremos una serie de propiedades que nos permiten describir de forma más explicita el contenido y el objetivo del proceso. Para cada proceso varia sus propiedades, pero hay dos q
  194. deseemos reubicar y arrastrarlo hasta la posición deseada. A través

    del curso utilizaremos constantemente esta ventana y podremos comprender de una mejor manera su beneficio. Visualizador de resultados La segunda parte de esta ventana la compone el visualizador de resultados, en ella podremos ver representados todos los resultados de los análisis que hemos realizado con el programa, a su vez, las opciones de ocultar o mostrar del navegador serán ejecutadas en el visualizador; es decir, si nosotros elegimos ocultar no veremos esa información y solo la volveremos a ver hasta que elijamos la opción mostrar en el navegador (Figura 36). ugar donde podemos acceder a la edición de los objetos creados (Tablas, gráficos, estadísticos, etc). Para poder activar la edición es LECCIÓN 16 - OPCIONES DEL VISOR Opciones de ventana Adicionalmente, está ventana es el l necesario ubicar el puntero del ratón sobre el objeto que deseamos modificar y hacer doble clic, con lo que se abrirá el editor correspondiente a objeto seleccionado. La tercera parte que compone esta ventana es la que corresponde a las opciones, en ella encontramos diferentes funciones que nos permiten realizar algunos procedimientos del paquete. Si nos fijamos en la Figura 37, podremos notar que algunos de los iconos de la barra de herramientas son los mismos que encontramos en la ventan Editor de Datos, aunque también aparecen unos iconos nuevos.
  195. Adicionalmente, podemos apreciar que en la barra de menús han

    desaparecido los elementos correspondientes a Datos y Transformar y en su lugar se encuentran los menús Insertar y Formato. Esto se debe a que los menús Datos y Transformar contiene procedimientos que sólo son aplicables a los datos (registros y variables), cuando están desagrupados. De igual manera los menús Insertar y Formato contienen procedimientos que sólo pueden ser aplicados a los resultados. Los nuevos iconos que encontramos en la barra de herramientas son: Designar ventana Este icono se utiliza cuando tenemos más de una ventana de resultados abierta. Lo que hace es comunicarle al programa que todos los resultados que generemos se deben representar en la ventana designada. Cuando tenemos más de una ventana abierta el programa adhiere los resultados nuevos a la última ventana que se haya abierto, lo cual puede ocasionar confusión y posiblemente pérdida de la información. Para evitarlo debemos activar este icono, en la ventana que deseemos utilizar para los nuevos resultados. Para designar una ventana hacemos clic en el icono de manera que su color desaparezca. Dentro del menú Insertar (Figura 38) se encuentran los procedimientos salto de página, eliminar salto de página, nuevo encabezado, nuevo título, nuevo título de página, nuevo texto, grafico 2-D interactivo, grafico 3-D interactivo, grafico antiguo, nuevo mapa, archivo de texto y objeto. Seleccionar últimos resultados Como su nombre lo indica, nos permite seleccionar los resultados del último procedimiento ejecutado. Es de bastante utilidad cundo tenemos un número considerable de resultados.
  196. Cuando seleccionamos la opción Insertar Objeto, se abre un nuevo

    cuadro de diálogo, en el que aparecen dos opciones de selección. La primera corresponde a crear nuevo (Figura 40), su función es generar un nuevo objeto proveniente de alguno de los programas que se encuentran instalados en el PC. La segunda opción corresponde a crear desde un archivo (Figura 41), la cual nos permite importar un archivo o un vínculo a este archivo.
  197. Estas opciones se utilizan cuando necesitamos agregar información a los

    resultados, o se quiere generar el reporte completo dentro del visor de resultados. A su vez, en el menú Formato se encuentran las opciones Alinear a la derecha. Centrar y Alinear a la izquierda, las cuales se utilizan de la misma forma que en el editor de datos. Para ter ivos de las diferentes ventanas. ventana Editor de Datos (Figura 42) nos aparecen stas opciones se habilitan cuando estamos guardando También se puede observar el botón Variables, esta opción abre un nuevo cuadro de diálogo (Figura 43), en donde se puede seleccionar las variables que deseamos guardar. Por defecto todas las variables son seleccionadas. Generalmente se utiliza cuando vamos a guardar un archivo de datos para ser utilizado en una hoja de cálculo. minar este capítulo inicial conoceremos la forma de guardar los arch LECCIÓN 17 - GUARDAR ARCHIVOS Guardando un archivo Para guardar un archivo se debes ir al menú Archivo, seleccionar la opción Guardar como y hacer clic en ella. Inmediatamente se abre una ventana de exploración (Figura 42), está ventana es típica de las aplicaciones de Windows, así que no haremos una explicación detallada de ella. Cuando guardamos archivos en la tres opciones en la parte inferior; e en un tipo de formato diferente a *.sav, es decir, en extensiones como Excel, SAS, etc.
  198. La otra diferencia que podemos resaltar es la opción Pegar,

    la cual veremos en casi todos los cuadros de diálogo del programa. Esta opción lo que realiza es pegar los comandos del procedimiento que estamos realizando en la ventana de sintaxis. La ventana de sintaxis nos permite trabajar los procedimientos del paquete mediante palabras de código, lo que es particularmente ventajoso cuando manejamos análisis continuos; es decir, cada cierto tiempo tenemos que realizar el mismo análisis a una a. La utilización de la sintaxis reduce el tiempo que se invierte en el procesamiento de los datos y la generación de los reportes o resultados. SPSS nos ermite ir más allá y generar procesos que realicen todo el reporte de forma automática, ente capítulo aprenderemos la forma de crear un archivo de datos ya sea ingresando la información directamente en el editor de datos o mediante la importación de la información de xtern de cálculo. CAPÍTU E HIVOS DE DATOS la información proviene de diferentes fuentes, como lo ediciones o los experimentos. Generalmente esta rentes de elaborar archivos de datos, la primera es creándolo en el editor de datos introduciendo directamente la información (Variables y Casos) y la segund d s terna, en donde los datos se encuentran y cuyo formato debe ser compatible con el programa. Creando archivos de datos Para generar un archivo de datos en SPSS, es preciso cumplir dos parámetros fundamentales. El primero es tratar de introducir la información de forma numérica; para lo cual es necesario otorgar números de identificación a las variables categóricas o a las que contengan valores perdidos estipulados por el usuario. La segunda es definir base de datos actualizad p agregándolo simplemente en las tareas programadas del ordenador. En el sigui sde una fuente de datos e a como una hoja LO II - L CCIÓN 1 - ARC En los procesos de investigación pueden ser las encuestas, las m información es recopilada en diversos programas de computadora que permiten organizarla, de acuerdo a sus características. SPSS ofrece dos formas dife a es importan o información de de una fuente ex previamente organizados las propiedades de las variables (ver capítulo I), de acuerdo a las características de la información que contiene cada variable. A manera de ejemplo vamos a generar un archivo que contenga la siguiente información.
  199. Antes de generar el archivo en el programa, se debe

    otorgar un valor numérico representativo a cada una de las opciones de pertenencia de las variables categóricas, así como a cada uno de los valores perdidos que el usuario desee estipular. No se le asignan valores a las variables donde la información representa magnitudes como la edad, la distancia, el peso o las ventas, ya que sus valores no representan pertenencia si no cantidad. Variable: Estado civil Esta variable contiene cinco diferentes categorías, cuatro de ellas representan un estado civil diferente, y la última representan la razón por la que no obtuve información del individuo. Soltero = 1 Casado = 2 Divorciado = 3 Viudo = 4 No responde =9 Variable: Nivel de educación : a = En esta variable encontramos cinco categorías con un orden lógico, ya que NO pueden existir personas con título universitario sin hacer de antemano la primaria. Teniendo esto en cuenta los valores son Primaria = 1 Secundari 2 Universidad =3 Postgrado =4 Master =5 Después de otorgar los códigos para cada una de las variables (Tabla 4), procederemos a crear el archivo de datos correspondiente. Para ello debemos abrir el programa mediante la ruta Inicio... Programas... SPSS for Windows... SPSS 11.5 para Windows. Al abrir surge el asistente de inicio al que daremos cancelar, con lo cual aparecerá la ventana Editor de datos vacía (Figura 44), lista para comenzar a generar el archivo. CAPÍTULO II - LECCIÓN 2 - DEFINIR VARIABLES (PARTE I) Para empezar a ingresar los datos, SPSS nos ofrece dos posibilidades; la primera es definir las propiedades de las variables antes de introducir los datos y la segunda es definirlas después de ingresar los casos. La definición de las propiedades de las variables se puede emplear como orientación en el ingreso de los casos, por lo que es recomendable utilizar la primera opción.
  200. Para definir las variables se debe seleccionar la pestaña vista

    de variables en el editor de datos (Figura 45), donde se localizan las propiedades o características. Nos ubicamos en la primera casilla de la columna Nombre y comenzaremos con la definición, cumpliendo con los criterios establecidos por SPSS para las propiedades de las variables Lo primero que se debe hacer es definir un nombre para cada variable, cumpliendo con los parámetros necesarios como no superar los ochos caracteres, comenzar con una letra, no tener espacios en blanco, etc. Teniendo esto en cuenta los nombres de las variables quedarán (Tabla 4) (ver capítulo I). Número de encuesta: id Estado civil: estciv Nivel de educación: nivedu Edad en años: edad Tipo: Los caracteres que encontramos en las variables corresponden a valores numéricos ya sean representativos de pertenencia o de cantidad; por lo tanto debemos seleccionar el tipo numérica para todas las variables. Ancho: Es determinado por el número máximo de cifras que contengan los valores de ada una de las variables incluyendo las cifras decimales. En este caso las variables ero de encuesta, estado civil y Nivel de educación cuentan con valores enteros de una sola cifra y la variable edad en años asume valores enteros de dos cifras. Antes de ingresar el ancho de las variables se debe cambiar primero el numero de decimales a cero o de lo contrario aparece el mensaje El número de cifras decimales es demasiado largo para la anchura del campo (Figura 46). c Núm
  201. E , es decir, (id = Número de encuesta, estciv

    =Estado civil, nivedu = Nivel de educación, ategóricas o las que tengan valores perdidos que el investigador quiera estipular (ver capítulo I). En este caso se definen valores a las variables estciv (Figura 47) y nivedu (Figura 48). etiquetas de valor antes de hacer clic en Aceptar o de lo contrario se perderán la información que no haya sido Añadida. Si se desea modificar algun algún va ar y editar, después de lo cual se activará el botó tiqueta: las etiquetas para las variables serán el nombre que encontramos en la fuente edad = Edad en años). Valores: Solo se definen valores para las variables c Es necesario añadir todos los valores y sus a etiqueta o lor se debe señal n de Cambiar.
  202. CAPÍTULO II - LECCIÓN 3 - DEFINIR VARIABLES (PARTE II)

    Perdidos: Dentro de la información solo tenemos una variable con valores perdidos correspondiente a estciv, el cual debemos definir, o de lo contrario será tomado en todos los análisis que realicemos afectando los resultados. Para definirlo activam gresamos el valor 9 na y alineación son de formato, por lo tanto lo dejamos a Id: Escala Estciv: Nominal os la casilla valores perdidos discretos e in (Figura 49). Debemos recordar que un valor perdido es una razón por la cual no tengo información. El valor 9 me indica que no tuve información por que el entrevistado no respondió; es aconsejable utilizar valores perdidos que estén separados del rango útil para facilitar su identificación. Las propiedades colum preferencia del lector. Medida: Dentro de nuestras variables encontramos los tres tipos de medida con que cuenta SPSS. En su orden las variables son: Nivedu: Ordinal Edad: Escala Una vez terminada la definición de las variables, seleccionamos la vista de datos y comenzamos a ingresar los datos.
  203. Después de ingresar los datos activamos el icono Etiquetas de

    manera que veremos las leyendas de cada uno de los valores (Figura 50). Por último debemos guardar el archivo, para lo cual vamos al menú Archivo... Guardar como, le otorgamos el nombre y la ubicación y seleccionamos guardar. CAPÍTULO II - LECCIÓN 4 - IMPORTAR ARCHIVOS SPSS permite leer información proveniente de diferentes fuentes como lo pueden ser las hojas de cálculo, los archivos planos o de texto e incluso desde bases de datos como Access, FoxPro, o algunas más elaboradas como Oracle. Para importar las bases de datos, SPSS requiere que estas soporten el protocolo ODBC. La estructura utilizada por SPSS para la importación de información esta basada en tres grupos de archivos. Para cada uno de estos tipos de archi do un procedimiento diferente para su importación, algunos de ellos se importan de forma directa a través de una ventana de exploración y otros cuentan con un asistente el cual nos guía paso a paso de hojas de cálculo ngo que comprenda el títu Rango: vo, SPSS tiene estableci en la definición de los datos. Para efectos de este curso, solo haremos referencia al primero de ellos. Archivos Antes de importar un archivo proveniente de una hoja de cálculo ya sea de Excel o de Lotus, es indispensable comprobar con anterioridad si cumple con las características que SPSS requiere. Estas características son: Estructura de datos: Los archivos de SPSS contienen una estructura en sus datos (Ver Capitulo I), en la cual la información, registros u observaciones se encuentra en las filas y las variables en las columnas. Para importar un archivo de Excel es necesario que tenga la misma estructura (variables en columnas y Casos en filas), de lo contrario es necesario adaptar la información. Títulos: En SPSS no se manejan los títulos dentro de los Datos, por lo tanto los archivos que se desean importar no deben contener títulos o no importar el ra lo. SPSS solo importa los datos que se encuentren dentro de un rango establecido por el usuario. Se incluye el nombre de las variables si estas se encuentran en la primera fila del rango.
  204. Para entender mejor la forma de importar archivos desde Excel

    vamos a importar la información contenida en el archivo Encuesta.xls, el cual debes descargar desde www.spssparatodos.com. Para efectos del curso asumiremos que ya lo descargaste y se encuentra en C: \Mis documentos\Encuesta.xls. Antes de extraer la información del archivo comprobaremos si cumple con los requisitos de SPSS, para ello es necesario abrirlo primero en Excel (Figura 52). El objetivo que se persigue abriendo el archivo es identificar las características de la información que contiene, para lo cual debemos reconocer la existencia de títulos, filas sin información, la estructura de los datos y el rango de información que se desea importar. Si nos fijamos en la figura 52, observaremos que en las primeras seis (6) filas, encontramos un título y tres filas sin información; este rango no debe ser importado ya que no incluye información útil para el programa. Ahora debemos comprobar la estructura de los datos y verificar que las variables se encuentren en las columnas y los casos o registros se ubiquen en las filas. Si nos fijamos en el archivo vemos como en la fila 7 se encuentran los nombre de las variables y cada una de ellas está ubicada en una tima columna con información que para este caso es columna J y la Fila 307. El rango de información se encuentra establecido desde la primera Columna y Fila con información útil, en este caso A7, hasta la ultima casilla con información que el investigador desee importar; la cual es para este caso J307. CAPÍTULO II - LECCIÓN 5 - IMPORTAR ARCHIVOS (PARTE II) Después de comprobar las características del archivo y verificar que cumplen con los requerimientos del programa, debemos cerrarlo, ya que SPSS no permite importar archivos si estos se encuentran en uso. Después de cerrar Microsoft Excel volvemos a SPSS y seleccionamos el menú Archivo... Abrir.. Datos (Figura 53), con lo cual se columna diferente, además las filas que se encuentran debajo de ella corresponden a los casos o registros. Por último debemos reconocer el rango que se puede importar para ello nos paramos en la Fila 7 Columna A y oprimimos las teclas Ctrl. + Fin, con lo cual nos ubicará en la última fila y la úl
  205. abre la ventana de navegación (Figura 54). Esta ventana requiere

    que le especifiquemos tres parámetros, el primero de ellos es la ubicación del archivo dentro de nuestro ordenador o los discos extraíbles (Buscar en); la segunda corresponde al Nombre de archivo y finalmente el Tipo de archivo o extensión a la que corresponde para lo cual cuenta con una lista de formatos o extinciones a los que podemos acceder por medio de este procedimiento. Utilizando esta ventana ubicaremos el archivo Encuesta con el formato Excel (*.xls) que se encuentra en Mis documentos. Una vez ubicado lo seleccionamos y hacemos clic en abrir. A continuación de seleccionar el archivo en la ventana de navegación se abre el cuadro de dialogo Apertura de fuente de datos de Excel (Figura 55). En este cuadro encontramos las opciones de importación Leer nombre de variables de la primera fila de datos, Hoja de trabajo y Rango.
  206. Cada una de estas opciones permite restringir la información que

    será importada. La primera Leer nombre de variables de la primera fila de datos (Figura 55), es determinada por la estructura del archivo de origen. Si nos fijamos en la figura 52, encontraremos que la fila 7 contiene los nombres de las variables; estos nombres deben cumplir ciertas condiciones (ver capítulo I), como no tener más de 8 caracteres, comenzar con una letra y no contener caracteres especiales, si se cumplen estas condiciones SPSS las importará como nombres de variables, de lo contrario las adecua para su importación; es decir, si rebasa los ocho caracteres tomará los primeros ocho caracteres como nombre, los espacios entre las palabras los remplazará por el signo (_) y la variables que comiencen por un número o tengan palabras claves las remplazará con la letra (V) y le asigna un número de acuerdo a la posición en el archivo, por ejemplo a la cuarta variable le asigna el nombre (V4). La segunda opción (Hoja de trabajo Figura 56), hace referencia a la hoja en la que se encuentra la información de interés, en la parte derecha de esta opción se localiza un icono que despliega una lista en la cual podemos elegir la hoja que deseamos. Por defecto SPSS selecciona la primera hoja del archivo, si la información se halla en otra hoja es necesario definírsela al asistente. CAPÍTULO II - LECCIÓN 6 - IMPORTAR ARCHIVOS (PARTE III) La última opción que encontramos (Rango Figura 57), hace referencia al área donde se encuentra la información de interés, si la hoja cuenta con títulos o filas sin información es necesario especificarle al asistente el rango de importación de lo contrario importara la hoja completa creando errores en el archivo resultante (Figura 58). En este caso el rango que obtuvimos es de A7:J307, no se deben ingresar espacios en el rango ya que SPSS no lo reconoce y aparece un cuadro de dialogo especificando que el rango no es válido.
  207. Después de ingresar las opciones correctamente hacemos clic en aceptar

    con lo cual los datos aparecen en el editor de datos (Figura 59). Es importante resaltar que una vez rminemos de importar la información se debe guardar el archivo resultante o de lo ontrario podemos perder su contenido. les ya están establecidos, además SPSS sugiere el tipo de te c Una vez ha sido guardado el archivo, se deben definir las propiedades de las variables de acuerdo con las características de la información. En la figura 60 se puede apreciar que los nombres de las variab variable al que corresponde. En algunas ocasiones el tipo de variable sugerido no es el apropiado esto se debe a un error de digitación en el cual una letra se introdujo dentro de la información por lo que es importante revisar la información para poder determinar
  208. su medida. Una vez se ingresan las propiedad de datos

    SPSS. es de las variables se completa el archivo ste procedimiento solo permite importar la Para abrir el programa, ubíquese en INICIO > Programas > SPSS for Windows > SPSS atos. pósito de introducir la información que requiere el programa sobre las variables. Si la información requerida se encuentra en diferentes hojas de un mismo archivo, es necesario generar un archivo de datos en SPSS por cada hoja de cálculo del archivo original y posteriormente unirlos, ya que e información contenida en una sola hoja por vez. Bueno y hasta aquí llega el capítulo II, si deseas obtener los tres capítulos finales, es necesario que vayas a la sección Descargas y llenes el formulario. Espero que este curso haya sido de tu agrado y te invito a que conozcas nuestro Libro Digital descargando el capítulo gratuito en la sección Libro CURSO DE SPSS NUEVO 1. INICIO DEL PROGRAMA Capítulo siguiente: 2 - Introducción de variables 11.0 for Windows. El archivo ejecutable de SPSS se llama spsswin.exe. Seleccione CANCEL en la primera ventana que aparezca. La ventana de fondo es la ventana para la entrada de d Ubíquese en la esquina inferior derecha de la ventana y haga click en la pestaña Variable view. Observará una ventana similar a la anterior, es la ventana de variables, y a diferencia que sus columnas están identificadas, con el pro
  209. 2. Introducción de variables aria para identificar la variable es

    la siguiente: (Nombre de la variable): es un nombre de hasta 8 caracteres que identificará la grama. e variable): indica si la variable es numérica (Numeric), con comas Scientific notation), fecha (Date), tom currency), o una cadena de caracteres (String) . efine el máximo número de caracteres que puede contener los valores de la variable. Decimals (Decimales): define el número de variables que pueden contener los valores Values (Valores): Se aplica si la variable esta codificada. En esta casilla se coloca los valores de la variable. Por ejemplo, se tiene la variable pertenencia de automóvil, cuyas respuestas son "si" o "no". Si le utomáticamente. Missing (Valores perdidos): es similar al anterior, solo que los números se asignan para e el valor. nas): Define el ancho de la columna de la variable en la ventana de Align (Alineación): Alineación de los valores de la variable dentro de la columna en la iden en una escala de intervalos o razón. n una orden interno:, por ejemplo, malo - regular -bueno categorías sin alguna relación entre ellos, por ejemplo: ejecutivo, ama de casa, estudiante Capítulo anterior: 1 - Inicio del programa Capítulo siguiente: 3 - Entrada de los datos La información neces Name variable en el pro Type (Tipo d (Comma), con puntos (Dot), notación científica ( Dólar (Dollar), Moneda (Cus Width (Ancho): d de las variables de tipo numérica o similar. Label (Etiqueta): Permite colocar el nombre completo de la variable códigos empleados para identificar los diferentes asignamos el número 1 al "si" y el 2 al "No", en vez de introducir la respuesta tal como se escribe, se registra el número y el sistema lo identifica a identificar aquellos casos en los que no hubo respuesta o se pierd Columns (Colum datos ventana de datos Measure (Medida): Define el nivel de medición de la variable en tres tipos: Escala (Scale): Son valores numéricos que se m Ej. Edad, temperatura, etc. Ordinal: Las valores están representados en categorías co Nominal: Los valores están representados en
  210. Ejemplo Como ejemplo, la primera variable que vamos a definir

    es el número de encuesta, que registrará el número para cada una de las encuestas. La información necesaria se colocará como se indica a continuación: Name: num_enc Type: Numeric El resto de las columnas se deja con los valores predeterminados ara ello nos ubicamos en Menu y seleccionamos File > Save. Aparecerá una ventana como la que se ilustra. En Nombre os Encuesta Hatillo" y hacemos clic en GUARDAR. Fíjese que la barra de título cambia de Untitled por el nombre que le asignamos ó r la variable Primera vez de visita. A ontinuación la información necesaria. erio del usuario) click en ADD. Decimals: 0 Label : Número de encuesta Measure : Scale Ahora procedemos a guardar la información. P del archivo escribimos "Resultad Para Salir del programa, en el menú File > Exit Ahora repetimos el procedimiento de abrir el programa tal como se explic ente y nos ubicamos en la ventana de variables. anteriorm En esta ocasión procederemos a introduci c Name : prima (El nombre puede cambiar a crit Type : Numeric Label : Primera vez de visita En Values, colóquese en la esquina izquierda de la celda y haga click en el cuadrado gris. Aparecerá una ventaba como la que se muestra. En el espacio de Value Coloque el valor 1 y en el espacio Value Label coloque Si, a continuación haga Coloque el número 2 para "No". Al final, pulse OK para volver a la ventana de variables No modifique el resto de las columnas Repita el procedimiento hasta completar todas las variables Al finalizar, guarde los cambios. Puede hacerlo por Menu File > Save o por el icono del diskette ubicado en la barra de herramientas
  211. 3. Entrada de los datos Capítulo anterior: 2 - Introducción

    de variables Capítulo siguiente: 4 - Analisis con elaboración de tablas y gráficos tos ecerá la venta para la introducción de datos. Fíjese que las columnas están identificadas con los nombres de las variables. De esta manera, los casos se registran IÓN DE TABLAS Y GRÁFICOS Funciones especiales a, la media y la mediana, etc), de > Frecuencias. Aparecerá un cuadro de diálogo, en tón (gráfico de torta), pulsamos OK. Para abrir la base de da Menu > File > Data. Seleccione el archivo en la ubicación correspondiente y pulse Abrir. Fíjese que el archivo sea de tipo *.sav. Ubíquese en la parte inferior izquierda de la ventana y haga click en la pestaña Data View. Apar por filas. Ahora procedemos a colocar los datos en la columna correspondiente, teniendo en cuenta la codificación empleada, si aplica el caso. Al final, se guardan los cambios Una vez introducidos los datos, se pueden utilizar las diferentes funciones del programa para el análisis de datos y la elaboración de tablas y gráficas. 4. ANÁLISIS CON ELABORAC Capítulo anterior: 3 - Entrada de los datos Capítulo siguiente: 5 - Análisis descriptivo Uno de los análisis estadísticos más utilizados es el análisis descriptivo de los datos, a través del cual podemos obtener la distribución de frecuencias para datos agrupados; la determinación de medidas de tendencia central (mod dispersión (varianza, desviación estándar, etc.); cruces de variables; entre otros. En esta oportunidad se explicará la obtención de la distribución de frecuencias Nos ubicamos en Menu Analyze cuya sección izquierda se encuentran la lista de todas las variables empleadas y en la sección derecha las variables que serán seleccionadas para el análisis. Seleccionamos la variable Primera vez de visita. A continuación pulsamos el bo CHARTS y marcamos con un tick la opción Pie Chart Dejamos marcada la opción Display frequency tables y pulsamos OK. Enseguida se abre una nueva ventana
  212. Esta ventana se denomina Viewer y es el visor de

    resultados o Outputs del SPSS. En primer lugar aparece la tabla con las frecuenci as, seguida de la gráfica correspondiente. Es posible guardar estos resultados, a través de Menu File > Save. Nótese que es un tipo tinto al de los datos. cruce de variables. Nos ubicamos en Menu Analyze > Crosstabs. Aparece un cuadro similar al observado anteriormente. No obstante, se e abre la ventana del visor con los resultados Gráficos interactivos rras. o, seleccionamos la variable Horario de visita y la arrastramos al recuadro correspondiente, tal como se ilustra. Existe la posibilidad de alternar entre el de resultados. . Funciones especiales apítulo anterior: 4 - Analisis con elaboración de tablas y gráficos unciones especiales . Select cases (Seleccionar casos) mos establecer una condición para seleccionar un conjunto de casos que cumplan no con dicha condición. Para ello pulsamos el icono que se encuentra en la barra de erramientas, o también Menu Data > Select Cases plo, supongamos que se desean seleccionar solamente los casos cuyo horario e visita corresponda a la mañana. En tal sentido marcamos, la opción If condition is tisfied y pulsamos e botón IF... n el cuadro de dialogo seleccionamos la variable Horario de visita, y hacemos doble lic para que se agregue al recuadro anexo. Terminamos de escribir con "= 1", cordando que ese fue el valor que se le asignó al valor "Mañana" en la ventana de ariables, y pulsamos CONTINUE, luego OK. íjese que en la ventana de datos se tachan los casos que no cumplen con la condición, ejando libres en cambio a aquellos que si la cumplen de archivo dis Cruce de variables Ahora procederemos a realizar un diferencia porque los recuadros que identifican las variables que se colocaran como Filas (Rows) y Columnas (Columns). En este caso, realizaremos el cruce de las variables Edad con Estado civil. Dejamos marcada la opción Display clustered bar charts, para mostrar la gráfica de barras, y pulsamos OK. S Adicionalmente, SPSS incluye funciones para la edición de gráficos. Se encuentra en Menu > Graphs > Interactive. Seleccionemos Bar, para elaborar un gráfico de ba En el cuadro de dialog eje vertical y horizontal, cruzar variables, colocar el gráfico en tres dimensiones, entre otras opciones. Pulsamos Aceptar y observamos el resultado en la ventana del visor 4 C F 1 Pode o h Por ejem d sa E c re v F d
  213. Para deshacer la condición, abrimos nuevamente el cuadro de dialogo

    de Select cases, marcamos la opción All cases y pulsamos OK 2. Split f la función Split f os el botón que se encuentra en la barra de herramientas, o tambié it Fle Marcam y escogemos la variable Horario de vista co os marcada la opción Sort the file by grouping de los va ) especificada(s) ps número hecho, se hubiera perdido el orden original en que Mayor revisar scarlo en Menu Help >Tutorial. ile Ahora, si lo que se quiere es ordenar los datos bajo un criterio específico podemos usar ile. Pulsam n Menu Data > Spl os la opción Organize output by groups mo criterio de ordenación.. Dejam variables y pulsamos CONTINUE. Observe como los casos se ordenan según el orden lores de la(s) variable(s Para deshacer este cambio, marcamos la opción Analyze all cases, do not create grou Con esta función se demuestra la importancia de crear una variable específica para los s de encuesta. De no haberlo se introdujeron los datos y no se pudieran realizar seguimientos de la información información Para obtener mayor información sobre el funcionamiento del programa sugerimos el tutorial que trae incorporado. Hay que bu
  214. BIBLIOGRAFIA Anderson D.R. / Sweeney, D.J. / Williams, T.A. (1999):

    Estadística para la Babbie, E. (2000): Fundam son Ferrán Aranaz, Magdalena (2002) Curso de SPSS para Windows: Análisis Estadístico. Ferrán Aranaz, Magdalena (2001) Hamdan González, Nijad (2005) M -Hill. Madrid. onio y Ruiz Díaz, Miguel Ángel (2005). Análisis de datos con SPSS ón a la estadística para las Ciencias entice de Datos: Aplicaciones con itorial Pearson Prentice . Internacional . . México. administración y economía. International Thomson Editores. México. entos de la Investigación Social. International Thom Editores. México. Editorial McGraw-Hill. Madrid. SPSS para Windows: Análisis Estadístico. Editorial McGraw-Hill. Madrid. Filgueira, Ester (2001). Análisis de datos con SPSS Win. Alianza Editorial. Madrid. étodos Estadísticos en Educación. EDICIONES DE LA BIBLIOTECA. Caracas. Hernández Sampieri, R./ Fernández Collado, C./ Baptista Lucio, P. (2003): Metodología de la Investigación. Editorial McGraw-Hill. México. Pardo Merino, Antonio y Ruiz Díaz, Miguel Ángel (2002). SPSS 11. Guía para Análisis de Datos. Editorial McGraw Pardo Merino, Ant 13 Base. Editorial McGraw-Hill. Madrid. Peña, Daniel y Romo, Juan (1999). Introducci Sociales. Editorial McGraw-Hill. Madrid. Pérez López, César. 2002. Estadística aplicada a través de Excel. Editorial Pearson Prentice Hall. Madrid. Pérez López, C. (2005): Técnicas Estadísticas con SPSS 12. Editorial Pearson Pr Hall. Madrid. Pérez López, C. (2004): Técnicas de Análisis Multivariante SPSS . Editorial Pearson Prentice Hall. Madrid. Pérez López, C. (2001). Técnicas estadísticas con SPSS. Ed Hall. Madrid. Pérez López, C. (2005): Métodos Estadísticos Avanzados con SPSS Thomson Editores Spain. Madrid Ritchey, F.J. (2002): Estadística para las Ciencias Sociales. Ed. McGraw – Hill
  215. Salama, David (2002) Estadística. Metodología y Aplicaciones. Editorial Torino. al

    de análisis estadístico de los datos. para Windows Hill INTERAMERICANA – Hill a Economía. Editorial DE BOGOTA, S.A.U. Colombia. nald J. (1999). Introducción a la Estadística. ata Caracas. Sánchez Carrión, Juan Javier (2004). Manu Alianza Editorial. Madrid. Spiegel, M.R. y Stephens Larry j. (2002): Estadística. Mc Graw Hill Interamericana de España. S.A. Madrid. Visauta Vinacua, Bienvenido (2002) Análisis estadístico con SPSS Volumen I: Estadística Básica. Editorial McGraw – DE ESPAÑA, S.A.U. México. Visauta Vinacua, Bienvenido (2005) Análisis estadístico con SPSS para Windows Volumen II: Estadística Multivariante. Editorial McGraw INTERAMERICANA DE ESPAÑA, S.A.U. México. Webster, Allen L (2001) Estadística Aplicada a los Negocios y l McGraw – Hill INTERAMERICANA Wonnacott, Thomas H. y Wonnacott, Ro Editorial Limusa. Méjico. BIBLIOWEB http://www.mipagina.cantv.net/hamletmatam l#tema1 http://www.hrc.es/bioest/Mdocente.htm s.html http://www.spssparatodos.com/capitulodo http://www.mailxmail.com/curso/informatica/spssespanol/capitulo1.htm http://www.aulafacil.com/investigacionspss/Lecc-6.htm http://72.14.207.104/search?q=cache:SVu2t7NCj4J:www.bioestadistica.freeservers.com /tema17.pdf+%22Modelo+No+Param%C3%A9trico+de+Kruskal-Wallis%22&hl=es l/variablealeatoria.htm http://endrino.cnice.mecd.es/~jhem0027/estadistica/norma http://home.ubalt.edu/ntsbarsh/Business-stat/opre504S.htm http://nutriserver.com/Cursos/Bioestadistica/Distribuciones_Continuas.html http://w3.mor.itesm.mx/~cmendoza/ma835/ma83515.html http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html http://w3.mor.itesm.mx/~cmendoza/cd841/cd2107.html http://w3.mor.itesm.mx/~cmendoza/cd841/cd2108.html http://fisica.urbenalia.com/apuntsmat/probabilidad/?selact=apu ttp://personal5.iddeo.es/ztt/Tem/t19_distribucion_binomial.htm h ttp://www.bioestadistica.freeservers.com/farpro.html h http://www.gestiopolis.com/canales/financiera/articulos/36/estapro.htm http://www.hrc.es/bioest/Reglin_8.html http://www.monografias.com/trabajos20/estadistica/estadistica.shtml http://descartes.cnice.mecd.es/Bach_HCS_2/distribuciones_probabilidad/dis_normal.ht m http://nutriserver.com/Cursos/Bioestadistica/Distribuciones_Bidimensionales.html http://server2.southlink.com.ar/vap/VARIABLE%20ALEATORIA.htm
  216. HU http://server2.southlink.com.ar/vap/PROBABILIDAD.htm U HU http://server2.southlink.com.ar/vap/inferencia.htm U HU http://www.terra.es/personal2/jpb00000/tvariablealeatoria.htm U HU

    http://www.uv.mx/iiesca/revista2/bety1.html U HU http://www.virtual.unal.edu.co/cursos/ciencias/2001065/lecciones_html/un2/2_6_1.html U HU http://www.virtual.unal.edu.co/cursos/ciencias/2001065/lecciones_html/un2/2_6_2.html U HU http://www.virtual.unal.edu.co/cursos/ciencias/2001065/lecciones_html/un2/2_7_1.html U HU http://www.eio.uva.es/~mcruz/ingenieria/Probabilidad.pdf U HU http://es.wikipedia.org/wiki/Distribuci%C3%B3n_de_probabilidad U HU http://w3.mor.itesm.mx/~jfrausto/Simulacion/Slides/distribuciones1.ppt U HU http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html U HU http://rrpac.upr.clu.edu:9090/~amenend/conf116390.htm U HU http://rrpac.upr.clu.edu:9090/~amenend/conf146390.htm U HU http://www.terra.es/personal2/jpb00000/tinferencia.htm#muestreoaleatoriosimple U HU http://www.seh-lelha.org/noparame.htm U HU http://www.telefonica.net/web2/biomates/nopa/nopa_signos/nopa_signos.htm UH HU http://personal5.iddeo.es/ztt/Tem/t18_variable_aleatoria_discreta.htm U HU http://personal5.iddeo.es/ztt/Tem/t20_variable_aleatoria_continua.htm U HU http://personal5.iddeo.es/ztt/Tem/t19_distribucion_binomial.htm U HU http://sapiens.ya.com/matagus/unidad6.htm U HU http://zip.rincondelvago.com/?00044092 UH HU http://www.seh-lelha.org/regresion1.htm U HU http://www.eumed.net/cursecon/medir/introd.htm U HU http://ftp.medprev.uma.es/libro/node40.htm U HU http://www.telefonica.net/web2/biomates/tabl/tabl_snedecor/tabl_snedecor.htm U HU http://encyclopedie-es.snyke.com/articles/distribucion_de_probabilidad.html UH HU http://ftp.medprev.uma.es/libro/node61.htm U HU http://www.seh-lelha.org/concor2.htm U HU http://www.seh-lelha.org/noparame.htm U HU http://www.telefonica.net/web2/biomates/tabl/tabl_normal/tabl_normal.htm U HU http://www.telefonica.net/web2/biomates/tabl/tabl_ji2/tabl_ji2.htm U HU http://www.telefonica.net/web2/biomates/regr/regr_simple/regr_simple.htm U HU http://www.telefonica.net/web2/biomates/regr/regr_multilin/regr_multilin.htm U HU http://www.telefonica.net/web2/biomates/nopa/nopa.htm U HU http://www.telefonica.net/web2/biomates/nopa/nopa_wilcoxon/nopa_wilcoxon.htm U HU http://mibuscador.net/enciclopedia/es/wikipedia/d/di/distribucion_de_probabilidad.html U HU http://mibuscador.net/enciclopedia/es/wikipedia/p/pr/probabilidad.html U HU http://100cia.com/enciclopedia/Distribuci%F3n_de_probabilidad U HU http://encyclopedie-es.snyke.com/articles/distribucion_de_probabilidad.html U HU http://endrino.cnice.mecd.es/~jhem0027/estadistica/normal/variablealeatoria.htm U