miércoles, 19 de enero de 2011

Curso Intensivo de Estadistica

CONTENIDO:
1. Conceptos fundamentales de la Estadística: Definiciones básicas: Orígenes, importancia, clasificación. Método estadístico, etapas de la investigación estadística. Parámetros y estadísticos. Variables estadísticas y funciones. Población y muestra: Definición, características. Tipos de muestreo.
2. Distribución de frecuencias y técnicas de organización y representación de datos estadísticos: Construcción de tablas y gráficas estadísticas: Histogramas, polígonos de frecuencia, gráficas de barras y sectores. Interpretación de tablas y gráficos.
3. Medidas de tendencia central o de posición: Definición, Aplicaciones de los estadígrafos de tendencia central: Media aritmética, Mediana, Moda. Comparación de la media, la mediana y la moda. El Percentil: Concepto, características, cálculo e interpretación estadística.
4. Medidas absolutas y relativas de dispersión: Definición, Aplicaciones de los estadígrafos de dispersión: Rango, Desviación media. Desviación estándar y varianza. Interpretación de las medidas.
5. Correlación: Concepto, cálculo. Coeficiente de correlación de Pearson. Correlación y regresión.
6. Estadística Inferencial: Introducción a la teoría de las probabilidades:Definición, características. Propiedades formales. Concepto de aleatoriedad. Teoremas y acciones fundamentales de la teoría de probabilidades. Nociones de inferencia estadística.


PLAN DE EVALUACION:El curso será evaluado con 03 actividades asociadas a cada tema o apunte de clases. Cada actividad tendrá como puntuación el 30%, 30% y 40% de calificación total de 100 ptos. Dichas actividades deberán ser realizadas en el aula de clases con el profesor tutor asignado para el curso.
Unidad N° 1 30% evaluación escrita (prueba)
Unidad N 2 30% trabajo práctico en el aula
Unidad N 3 40% evaluación escrita (prueba)
RESUMEN
Definición de EstadísticaLa Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.Conceptos de EstadísticaPoblaciónUna población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.IndividuoUn individuo o unidad estadística es cada uno de los elementos que componen la población.MuestraUna muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.MuestreoEl muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.ValorUn valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.DatoUn dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.Variables estadísticasVariable cualitativaLas variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos:Variable cualitativa nominalUna variable cualitativa nominal presenta modalidades no numéricas que no admiten un criterio de orden.Variable cualitativa ordinal o variable cuasicuantitativaUna variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden.Variable cuantitativaUna variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:Variable discretaUna variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos.Variable continuaUna variable continua es aquella que puede tomar valores comprendidos entre dos números.Distribución de frecuenciasLa distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.Diagrama de barrasUn diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.Los datos se representan mediante barras de una altura proporcional a la frecuencia.Polígonos de frecuenciasUn polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos.También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos.Diagrama de sectoresUn diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas.Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
HistogramaUn histograma es una representación gráfica de una variable en forma de barras.Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases.En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.Medidas de centralizaciónModaLa moda es el valor que tiene mayor frecuencia absoluta.Se representa por Mo.Se puede hallar la moda para variables cualitativas y cuantitativas.Cálculo de la moda para datos agrupados1º Todos los intervalos tienen la misma amplitud.
2º Los intervalos tienen amplitudes distintas.En primer lugar tenemos que hallar las alturas.
La clase modal es la que tiene mayor altura. MedianaEs el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.La mediana se representa por Me.La mediana se puede hallar sólo para variables cuantitativas.Cálculo de la mediana1 Ordenamos los datos de menor a mayor.2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.Cálculo de la mediana para datos agrupadosLa mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo en el que se encuentre : N/2
Media aritmética para datos agrupadosSi los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

Medidas de PosiciónCuartilesLos cuartiles son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro partes iguales.Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
DecilesLos deciles son los nueve valores que dividen la serie de datos en diez partes iguales.Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
PercentilesLos percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
Publicado por IUNICS ACADEMICO en 21:48
if (window['tickAboveFold']) {window['tickAboveFold'](document.getElementById("latency-2507398964871809974")); }
viernes 13 de agosto de 2010
Apuntes 04: Estadística Inferencial. Correlación y Regresión.
Recursos:
Ver Links: http://pcmap.unizar.es/~chelo/teoria/docum_teor_out/tema10.pdf
http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

Estadística Inferencial. Regresión y CorrelaciónLa regresión como una técnica estadística, una de ellas la regresión lineal simple y la regresión multifactorial, analiza la relación de dos o mas variables continuas, cuando analiza las dos variables a esta se el conoce como variable bivariantes que pueden corresponder a variables cualitativas. La regresión nos permite el cambio en una de las variables llamadas respuesta y que corresponde a otra conocida como variable explicativa, la regresión es una técnica utilizada para inferir datos a partir de otros y hallar una respuesta de lo que puede suceder.
Siendo así la regresión una técnica estadística, por lo tanto para interpretar situaciones reales, pero a veces se manipula de mala manera por lo que es necesario realizar una
selección adecuada de las variables que van a construir las formulas matemática, que representen a la regresión, por eso hay que tomar en cuenta variables que tiene relación, de lo contraria se estaría matematizando un galimatías.
Se pueden encontrar varios tipos de regresión, por ejemplo:Regresión lineal simpleRegresión múltiple ( varias variables)Regresión logísticaSimple b) Múltiple, etc.
La regresión lineal técnica que usa variables aleatorias, continuas se diferencia del otro
método analítica que es la correlación, por que esta última no distingue entre las variables respuesta y la variable explicativa por que las trata en forma simétrica.La matematización nos da ecuaciones para manipular los datos, como por ejemplo medir la circunferencia de los niños y niñas y que parece incrementarse entre las edades de 2 meses y 18 años, aquí podemos inferir o predecir que las circunferencias del cráneo cambiara con la edad, en este ejercicio la circunferencia de la cabeza es la respuesta y la edad la variable explicativa.
En la regresión tenemos ecuaciones que nos representan las diferentes clases de regresión:Regresión Lineal : y = A + BxRegresiòn Logarìmica : y = A + BLn(x)Regresión Exponencial : y = Ac(bx)Regresión Cuadrática : y = A + Bx +Cx2

Para obtener un modelo de regresión es suficiente establecer la regresión para eso se hace uso del coeficiente de correlación: R.R = Coeficiente de correlación, este método mide el grado de relación existente entre dos variables, el valor de R varía de -1 a 1, pero en la práctica se traba con un valor absoluto de R.El valor del coeficiente de relación se interpreta de modo que a media que R se aproxima a 1, es más grande la relación entre los datos, por lo tanto R (coeficiente de correlación) mide la aproximación entre las variables.El coeficiente de correlación se puede clasificar de la siguiente manera:CORRELACIÒN VALOR O RANGO1) Perfecta 1) R = 12) Excelente 2) R = 0.9 < = R < r =" 0.8" r =" 0.5"> Coeficiente de Correlación de PearsonEl coeficiente de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos variables cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones estándar de ambas variables:
Siendo:σXY la covarianza de (X,Y)σX y σY las desviaciones típicas de las distribuciones marginales.El valor del índice de correlación varía en el intervalo [-1, +1]:Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra. Pudiendo haber relaciones no lineales entre las dos variables. Estas pueden calcularse con la razón de correlación.Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica proporción.Si 0 < r =" -1,">
Publicado por IUNICS ACADEMICO en 20:38
if (window['tickAboveFold']) {window['tickAboveFold'](document.getElementById("latency-6229957923972794663")); }

EJERCICIOS PARA PRACTICAR (PARTE III)
1. A un conjunto de 5 números cuya media es 7.31 se le añaden los números 4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números?
.
2. Se tienen el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18. Obtener su mediana y cuartiles.
.
3. Calcular la media, la mediana y la moda de la siguiente serie de números:
5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
.
4. Dadas las series estadísticas:
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
Calcular:La moda, la mediana y la media.
La desviación media, la varianza y la desviación típica.
Los cuartiles 1º y 3º.
Los deciles 2º y 7º.
Los percentiles 32 y 85.
.
5. Sea una distribución estadística que viene dada por lo siguiente:xi: 61, 64, 67, 70, 73fi :5, 18, 42, 27, 8Calcular:1 La moda, mediana y media.2 El rango, desviación media, varianza y desviación típica.
Publicado por IUNICS ACADEMICO en 20:30
if (window['tickAboveFold']) {window['tickAboveFold'](document.getElementById("latency-7576835503450251201")); }

Ejemplos de Medidas de Tendencia Central
Check out this SlideShare Presentation:
Lectura 5.1 Medidas De Tendencia Central
View more presentations or upload your own.
Publicado por IUNICS ACADEMICO en 20:22
if (window['tickAboveFold']) {window['tickAboveFold'](document.getElementById("latency-6045033288729229798")); }
Apuntes 03: Medidas de Tendencia Central, Absolutas y Relativas
Medidas de Tendencia Central

Nos indican en torno a qué valor (centro) se distribuyen los datos.La medidas de centralización son:
Media AritméticaLa media es el valor promedio de la distribución. Si se tiene una muestra estadística de valores (X1,X2,...,Xn) de valores para una variable aleatoria X con distribución de probabilidad F (x,?) [donde ? es un conjunto de parámetros de la distribución] se define la media muestral n-ésima.Es necesario tener agrupados los datos en forma ascendente o descendente, es decir, que se tenga como primer dato el máximo o el mínimo antes de calcular la media muestral.Mediana La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales. Definiremos como mediana al valor de la variable que deja el mismo número de datos antes y después que él. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos, y los que sean mayores que la mediana representarán el otro 50% del total de datos de la muestra.ModaLa moda es el valor que más se repite en una distribución. Es el dato que más se repite en la cuenta. Si existen dos datos que se repite un número igual de veces entonces el conjunto será bimodal. Ejemplo: Número de personas en distintos carros en una carretera: 5-7-4-6-9-5-6-1-5-3-7. En este caso el número que más se repite es 5 entonces la moda en este caso es 5.En estadistica la moda es el valor que cuenta con una mayor frecuencia en una distribución de datos.
Medidas de PosiciónLas medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.La medidas de posición son:CuartilesLos cuartiles dividen la serie de datos en cuatro partes iguales.DecilesLos deciles dividen la serie de datos en diez partes iguales.PercentilesLos percentiles dividen la serie de datos en cien partes iguales. Representan los valores de la variable que están por debajo de un porcentaje, el cual puede ser un valor de 1% a 100% (en otras palabras, el total de los datos es divido en 100 partes iguales).
Medidas de DispersiónLas medidas de dispersión nos informan sobre cuánto se alejan del centro los valores de la distribución. Las medidas de dispersión son:
Rango o RecorridoEl rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.Desviación MediaLa desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.VarianzaLa varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.Desviación Típica La desviación típica es la raíz cuadrada de la varianza.
Recursos:
Ver Links: http://tgrajales.net/tendencentral.pdf
http://ponce.inter.edu/cremc/estadistica.htm
http://www.liccom.edu.uy/bedelia/cursos/metodos/material/estadistica/med_disp.html
http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt152.html
Publicado por IUNICS ACADEMICO en 18:28
if (window['tickAboveFold']) {window['tickAboveFold'](document.getElementById("latency-5388328369218583845")); }
EJERCICIOS PARA PRACTICAR (PARTEII)
1. Busca las definiciones de tablas de frecuencia, como se construyen diagramas de barras y de líneas. Que es un polígono de frecuencia y un diagrama de sectores.
2. Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. Construir la tabla de frecuencias.
3. .Los pesos de los 65 empleados de una fábrica vienen dados por los siguientes datos:Peso: [50, 60), [60, 70), [70, 80), [80,90), [90, 100), [100, 110), [110, 120)fi: 8......... 10....... 16..... 14........ 10....... 5............ 2
Construir la tabla de frecuencias.
Evaluación de la unidad n° 2 : La tabla siguiente muestra la composición por edad, sexo y trabajo de un grupo de personas con deficiencia cardiaca en la provincia de Andaluz en el año de 1989:

Edad Trabajadores No trabajadores Totales
Varón Hembra Total Varón Hembra Total Varón Hembra total
19 - 24 10 4 14 20 36 56 30 40 70
24 – 29 32 10 42 15 50 65 47 60 107
29 – 34 47 12 59 13 34 47 60 46 106
34 – 39 38 8 46 10 25 35 48 33 81
39 - 44 22 4 26 7 18 25 29 22 51
se requiere de su habilidad para resolver las siguientes interrogantes:
1. Obtener la media, mediana y moda de la distribución de las edades de la muestra ( no trabajadores ).
2. Obtener el percentil 70 y cuartil 2, con la distribución de las edades de la muestras totales.
3. ¿Por debajo de que edad esta el 50% de los varones (trabajadores)?
4. Determinar asi mismo la edad mas frecuente (sin distinción de sexos ni ocupación)

No hay comentarios:

Publicar un comentario