lunes, 26 de octubre de 2009

UNIDAD II. PROBABILIDAD

En ocasiones cuando se habla de probabilidad o posibilidad de que un evento ocurra, se pierde la credibilidad acerca del evento en cuestión, pero ¿es posible tener siempre la certeza total en todo proyecto o actividad que se desea realizar?, es muy difícil tenerla, debido a que el llevar a efecto un proyecto cualquiera por más simple que este sea, éste está sujeto a una gran diversidad de factores que afectan su ocurrencia, ¿entonces que es lo más aconsejable para predecir su ocurrencia?, la probabilidad es la que nos ayuda en estos casos, ya que basándose en estadísticas, podemos cuantificar la posibilidad de ocurrencia de los eventos y por consiguiente tomar una buena decisión basados en esta información.

A)CONCEPTO.

La probabilidad se encarga de evaluar todas aquellas actividades en donde se tiene incertidumbre acerca de los resultados que se pueden esperar, esto quiere decir que la probabilidad está presente en casi en todas las actividades que se pretenda realizar, ejemplos:

-Cualquier proyecto de Ingeniería o de otras áreas

-Competencias deportivas

-Juegos de azar, etc., etc.

¿Cómo podemos calcular probabilidades?

1. Haciendo uso de las estadísticas.

En este caso, se hace uso de la información que se ha acumulado acerca del evento que nos interesa, y después de esto se procede a calcular las probabilidades requeridas.

Ejemplo. Determine la probabilidad de que en cierta línea de producción se manufacture un producto defectuoso, si se toma como referencia que la producción de la última semana en esta línea fue de 1,500 productos, entre los que se encontraron 8 productos defectuosos.

p(producto defectuoso) = No de productos defectuoso /Total de productos producidos en la semana

= 18 / 1500 = 0.012

Lo anterior nos indica que es muy probable que 1.2 productos de cada 100 que se manufacturen en esa línea serán defectuosos.

¿Porqué se utilizó para calcular las probabilidades la información de la semana inmediata anterior?. Debido a que esta refleja la situación que guarda actualmente la producción de la línea mencionada.

2. Basándose en la experimentación. Hay casos en los que después de repetir un número muy grande de veces un experimento, es posible determinar las probabilidades de ocurrencia de algunos eventos, tales como: La probabilidad de que aparezca águila al lanzar una moneda equilibrada, la probabilidad de que aparezca el número 3 en un dado, etc., etc.

Ejemplos:

p(águila) =1/2 = 0.5

p(aparezca el número 3)= 1 / 6 = 0.1666

3. Asignando probabilidades. En este caso se hace uso de las probabilidades obtenidas mediante estadísticas y la experimentación y se asignan a los eventos previamente descritos y a partir de ellas se determinan probabilidades de otros eventos.

A continuación se definen algunas cuestiones implícitas en el cálculo de probabilidades.

a) Espacio muestral (d).- Es el conjunto de todos los resultados posibles de un experimento. Es nuestro Universo.

Ejemplos:

1. Se lanza al aire un dado normal (perfectamente equilibrado), enumere los posibles resultados de este experimento.

d= {1, 2, 3, 4, 5, 6 }

2. Se lanza al aire dos veces una moneda normal, defina su espacio muestral.

d = {AA, AS, SA, SS}

b) Evento A.- El evento A es un subconjunto del espacio muestral.

Ejemplos:

1. Sea A el evento de que aparezca un número par en el lanzamiento de un dado, entonces;

A = {2,4,6}

2. Sea B el evento de que aparezcan dos águilas en tres lanzamientos de una moneda normal, entonces;

Como d = {AAA, AAS, SAA, ASA, ASS, SAS, SSA, SSS}

Luego B = {AAS, SAA, ASA}

Ejemplo:

En un salón de clase hay 15 alumnos, 7 de los cuáles son de tercer semestre, 5 son de cuarto semestre y 3 son de quinto semestre de la carrera de Ingeniería Química, de los cuales 4, 2 y 1 respectivamente dominan el Inglés, si se selecciona un alumno al azar de este grupo, a. ¿cuál es la probabilidad de que el alumno seleccionado sea de quinto semestre?, b. ¿cuál es la probabilidad de que sea de tercero o cuarto semestre?, c. ¿cuál es la probabilidad de que el alumno seleccionado sea de tercer semestre y domine el inglés?, d. ¿cuál es la probabilidad de que el alumno seleccionado no domine el inglés?, e. Diga si los eventos T y Q son mutuamente excluyentes, diga si los eventos Q e I son mutuamente excluyentes?

Solución:

Empezaremos por definir algunos eventos;

T = evento de que un alumno sea de tercer semestre

Cu = evento de que un alumno sea de cuarto semestre

Q = evento de que un alumno sea de quinto semestre

I = evento de que un alumno domine el inglés

a. p(alumno seleccionado sea de quinto semestre) = p(Q) = 3/15 = 0.2

b. p(alumno seleccionado sea de tercero o cuarto semestre)= p(T ÈCu) =

= p( T) + p(Cu) = 7/15 + 5/15 = 12/15 = 0.8

c. p(alumno sea de tercer semestre y domine el inglés) = p(T Ç I) = 4/15 = 0.26667

d. p(alumno seleccionado no domine el inglés) = p(Ic ) = 8/15 = 0.53333

e. Los eventos T y Q son mutuamente excluyentes dado que TÇQ = f

Los eventos Q e I no son eventos mutuamente excluyentes, ya que QÇI= {1}

Ya que hay un alumno que cumple con ambos eventos, es de quinto semestre y domina el inglés.

AXIOMAS Y TEOREMAS.

Para el cálculo de probabilidades hay que tomar en cuenta los Axiomas y Teoremas que a continuación se enumeran.

1)La probabilidad de que ocurra un evento A cualquiera se encuentra entre cero y uno.

0 £ p(A) ³ 1

2)La probabilidad de que ocurra el espacio muestral d debe de ser 1.

p(d) = 1

3)Si A y B son eventos mutuamente excluyentes, entonces la p(AÈB) = p(A) + p(B)

Generalizando:

Si se tienen n eventos mutuamente excluyentes o exclusivos A1, A2, A3,.....An, entonces;

p(A1ÈA2È.........ÈAn) = p(A1) + p(A2) + .......+ p(An)

TEOREMAS

d

TEOREMA 1. Si f es un evento nulo o vacío, entonces la probabilidad de que ocurra f debe ser cero.

A

p(f)=0



DEMOSTRACIÓN:

Si sumamos a fun evento A cualquiera, como f y A son dos eventos mutuamente excluyentes, entonces p(AfÈ)=p(A) +p(f)=p(A). LQQD

TEOREMA 2. La probabilidad del complemento de A, Ac debe ser, p(Ac)= 1 – p(A)








DEMOSTRACIÓN:

Si el espacio muestral d, se divide en dos eventos mutuamente exclusivos, A y Ac luego d=AÈAc, por tanto p(d)=p(A) + p(Ac) y como en el axioma dos se afirma que p(d)=1, por tanto, p(Ac)= 1 - p(A) .LQQD

TEOREMA 3. Si un evento A Ì B, entonces la p(A) £ p(B).



DEMOSTRACIÓN:

Si separamos el evento B en dos eventos mutuamente excluyentes, A y B \ A (B menos A), por tanto, B=AÈ(B \ A) y p(B)=p(A) +p(B \ A), luego entonces si p(B \ A)³0 entonces se cumple que p(A)£p(B). LQQD

TEOREMA 4. La p( A \ B )= p(A) – p(AÇB)





DEMOSTRACIÓN: Si A y B son dos eventos cualquiera, entonces el evento A se puede separar en dos eventos mutuamente excluyentes, (A \ B) y AÇB, por tanto, A=(A \ B)È(AÇB), luego p(A)=p(A \ B) + p(AÇB), entonces, p(A \ B) = p(A) – p(AÇB). LQQD

TEOREMA 5. Para dos eventos A y B, p(AÈB)=p(A) + p(B) – p(AÇB).




DEMOSTRACIÓN:

Si AÈB = (A \ B) È B, donde (A \ B) y B son eventos mutuamente excluyentes, por lo que p(A È B) = p(A \ B) + p(B) y del teorema anterior tomamos que p(A \ B) = p(A) – p(AÇB), por tanto, p(AÈB) = p(A) + p(B) – p(AÇB). LQQD

COROLARIO:

AÇBÇC

AÇB

Para tres eventos A, B y C, p(AÈBÈC) = p(A) + p(B) + p(C) – p(AÇB) – p(AÇC) – (BÇC) + p(AÇBÇC).











Distribución de frecuencias

Es como se denomina en estadística a la agrupación de datos en categorías mutuamente excluyentes que indican el número de observaciones en cada categoría. Esto significa una de las cosas más importantes de la matemática, su estadística con la agrupación de datos. La distribución de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el número existente en cada clase.

Elementos fundamentales para elaborar una distribución de frecuencia:

1) RANGO.

Es una medida de dispersión que se obtiene como la diferencia entre el número mayor y el número menor de los datos.

R = N_max - N_min

Ejemplo.

Dados los números: 5, 10, 12, 8, 13, 9, 15

R= 15- 5

2) AMPLITUD TOTAL.

Simplemente se obtiene sumándole 1 al rango.

AT = (R+1)

3) LAS CLASES.

Están formadas por dos extremos. el menor se llama límite inferior el mayor se llama límite superior. hay distintos tipos de clases.

Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)

4)EL NUMERO DE CLASES.

Se determina a través de la formula de stuger, la cual es valida cuando el No de observaciones sea menor o igual a 500. Formula.

Nc= 1 + 3.33log ( N )

Donde:

Nc es el número de clases. N es la cantidad de muestras tomadas.

5) VALOR DEL INTERVALO O AMPLITUD

Se Obtiene por medio de la ecuación de dicta:

Vi = AT / Nc

Donde:

Vi es el valor de intervalo AT es la amplitud total Nc es el número de clase

En estadística se pueden distinguir hasta cuatro tipos de frecuencias, estas son :
  • Frecuencia absoluta (ni) de una variable estadística Xi, es el número de veces que aparece en el estudio este valor . A mayor tamaño de la muestra, aumentará el tamaño de la frecuencia absoluta; es decir, la suma total de todas las frecuencias absolutas debe dar el total de la muestra estudiada (N).
  • Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamaño de la muestra (N). Es decir,

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una distribución de frecuencias

Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por ciento (pi) que presentan esta característica respecto al total de N, es decir el 100% del conjunto.

  • Frecuencia absoluta acumulada (Ni), es el número de veces ni en la muestra N con un valor igual o menor al de la variable. La última frecuencia absoluta acumulada deberá ser igual a N.
  • Frecuencia relativa acumulada (Fi), es el cociente entre la frecuencia absoluta acumulada y el número total de datos, N. Es decir,
Con la frecuencia relativa acumulada por 100 se obtiene el porcentaje acumulado (Pi)), que al igual que Fi deberá de resultar al final el 100% de N.


CONSTRUCCIÓN DE FRECUENCIAS

Para datos agrupados. En la mayoría de los casos se requiere agrupar los datos para una mejor visualización. Para ello se usa una distribución de frecuencias.


Las medidas de tendencia central reflejan la “concentración” de los datos. Las medidas de dispersión reflejan la variabilidad.


Primer paso: Se hace un arreglo de datos, esto es ponemos en orden de magnitud ascendente o descendente.


Segundo paso: Se calcula el rango de los datos. El rango es la la distancia máxima entre el valor grande y el chico.


Tercer paso: Se calcula el número de intervalos de las clase necesarias. Otra forma de determinar el número de intervalos es obteniendo la raíz cuadrada del número de observaciones.

En este caso se eligen 4 clases
K = n = 20 = 4.47 ≈ 4

Otra forma es seleccionar el entero más pequeño K para el cual se cumple
2K ≥ n


Cuarto: paso es determinar el ancho del intervalo.


Quinto: paso es determinar las clases en si. Es decir los límites superior e inferior de cada intervalo.


Sexto paso: Se Calculan las frecuencias de cada clase o intervalo. Esta columna suele ser igual al número de observaciones en cada clase.


La frecuencia absoluta cumulada va sumando las frecuencias de cada clase,
hasta sumar total de observaciones.


EL porcentaje relativo se obtiene dividiendo las frecuencias entre el total.


El porcentaje acumulado se obtiene dividiendo las frecuencias acumuladas entre el total. Alternativamente, se pueden sumar los porcentajes relativos.


Tipos de representaciones gráficas

Cuando se muestran los datos estadísticos a través de representaciones gráficas, se ha de adaptar el contenido a la información visual que se pretende transmitir. Para ello, se barajan múltiples formas de representación:

· Diagramas de barras: muestran los valores de las frecuencias absolutas sobre un sistema de ejes cartesianos, cuando la variable es discreta o cualitativa.

· Histogramas: formas especiales de diagramas de barras para distribuciones cuantitativas continuas.

· Polígonos de frecuencias: formados por líneas poligonales abiertas sobre un sistema de ejes cartesianos.

· Gráficos de sectores: circulares o de tarta, dividen un círculo en porciones proporcionales según el valor de las frecuencias relativas.

· Pictogramas: o representaciones visuales figurativas. En realidad son diagramas de barras en los que las barras se sustituyen con dibujos alusivos a la variable.

· Cartogramas: expresiones gráficas a modo de mapa.

· Pirámides de población: para clasificaciones de grupos de población por sexo y edad.

· Los disperso gramas Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.


Diagramas de barras e histogramas

Los diagramas de barras se usan para representar gráficamente series estadísticas de valores en un sistema de ejes cartesianos, de manera que en las abscisas se indica el valor de la variable estadística y en las ordenadas se señala su frecuencia absoluta.

Estos gráficos se usan en representación de caracteres cualitativos y cuantitativos discretos. En variables cuantitativas continuas, se emplea una variante de los mismos llamada histograma.




graficos de barras horizontales


Gráficos de barras proporcionales


Gráficos de barras comparativas



Graficos de barras aplicadas




Polígonos de frecuencias

Para construir polígonos de frecuencias, se trazan las frecuencias absolutas o relativas de los valores de la variable en un sistema de ejes cartesianos y se unen los puntos resultantes mediante trazos rectos. Con ello se obtiene una forma de línea poligonal abierta.

Los polígonos de frecuencias se utilizan preferentemente en la presentación de caracteres cuantitativos, y tienen especial interés cuando se indican frecuencias acumulativas. Se usan en la expresión de fenómenos que varían con el tiempo, como la densidad de población, el precio o la temperatura.







Graficos de secrores

En los diagramas de sectores, también llamados circulares o de tarta, se muestra el valor de la frecuencia de la variable señalada como un sector circular dentro de un círculo completo. Por ello, resultan útiles particularmente para mostrar comparaciones entre datos, sobre todo en forma de frecuencias relativas de las variables expresadas en forma de porcentaje.



Pictogramas y cartogramas


Para aligerar la presentación de datos estadísticos, con frecuencia se recurre a imágenes pictóricas representativas del valor de las variables. Dos formas comunes de expresión gráfica de los datos son:

· Los pictogramas, que muestran diagramas figurativos con figuras o motivos que aluden a la distribución estadística analizada (por ejemplo, una imagen antropomórfica para indicar tamaños, alturas u otros).

· Los cartogramas, basados en mapas geográficos que utilizan distintas tramas, colores o intensidades para remarcar las diferencias entre los datos.







Pirámide de población

Otra forma corriente de presentación visual de datos estadísticos es la llamada pirámide de población.

Las pirámides de población grase utilizan en la expresión de informaciones demográficas, económicas o sociales, y en ellas se clasifican comúnmente los datos de la población del grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.





Los dispersogramas

Son gráficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.




No hay comentarios:

Publicar un comentario