proyecto estadistica
DESCRIPTION
Proyecto estadisticaTRANSCRIPT
Proyecto de esTADÍSTICA
Primer Parcial
Integrantes:
Gabriel GallardoHellen Alvarez
Paralelo: 6
Contenido
Introducción.................................................................................................................................2
Marco Teórico..............................................................................................................................3
Estadísticas Descriptivas...............................................................................................................6
Resultados de Análisis..................................................................................................................9
Conclusiones..............................................................................................................................11
Recomendaciones......................................................................................................................11
Bibliografía.................................................................................................................................12
Referencias.................................................................................................................................12
1
Introducción.
Acogiéndonos al concepto de muestreo de aceptación, el cual indica que al evaluar un colectivo homogéneo a través de una muestra aleatoria, que nos permite determinar la aceptación o el rechazo del colectivo; es decir, es un contraste en el que se evalúa una característica (parámetro de una población) a través de valores muestrales, el presente proyecto tiene como objetivo simular y aplicar el concepto, sus ventajas, la manera de llevarlo a cabo, sus usos y la función que tiene, el empleo de gráficos en esta técnica, explicara cómo se deben llevar a cabo las observaciones y los registros de datos de la manera más adecuada y efectiva para lograr un resultado de mayor certeza.
Mencionaremos como determinar la frecuencia de las observaciones, con el uso de un software, explicaremos la aplicación de la computación en esta técnica, con la que se facilita el proceso del muestreo del trabajo, agilizando la obtención de datos y sus resultados, disminuyendo notablemente el tiempo de realización del proceso.
Finalmente daremos las aplicaciones reales que han sido determinadas en los parámetros considerados en los requerimientos como son que las ánforas representan lotes o contenedores de cierto artículo que se compra de algún lugar, y que las bolitas marcadas representan artículos defectuosos, de las cuales se deberán extraer al azar 5 bolitas, y anotar cuántas de las 5 son defectuosas dando al proceso tal número de repeticiones proyectadas a 100 veces sin olvidar anotar cuántas de las 5 son defectuosas, de manera en que resulten 100 números.
2
Marco Teórico
Para la elaboración de este proyecto consideraremos las definiciones detalladas a
continuación:
Frecuencia absoluta: el número de veces que aparece un valor, se representa
con fi donde el subíndice representa cada uno de los valores. La suma de las frecuencias
absolutas es igual al número total de datos, representado por N. f1+f2+f3+…+fn=N.
Frecuencia relativa: el resultado de dividir la frecuencia absoluta de un determinado
valor entre el número total de datos, se representa por ni. ni=fiN
La suma de la frecuencias relativas es igual a 1. Lo cual puede verse fácilmente si se
factoriza N.
Frecuencia absoluta acumulada: la suma de frecuencias absolutas de todos los valores
iguales o inferiores al valor considerado, se representa por Fi.
Frecuencia relativa acumulada: el resultado de dividir la frecuencia acumulada entre
el número total de datos, se representa por Ni.
Histograma: es una representación gráfica en la que la frecuencia (puede ser absoluta o
relativa) de la clase está representada por el área de la barra. Si todas las clases tienen
igual amplitud, la frecuencia de la clase está representada por la altura de la barra y el
gráfico se confunde como gráfico de barras. Pero si las clases tienen diferente amplitud
los gráficos de barra y los histogramas difieren. Despliega la variabilidad dentro de un
proceso, también toma datos variables (alturas, pesos, densidades, temperaturas, etc.) y
despliega su distribución. (Salvarrey, 2000)
Diagramas de barras: son una representación de cada una de las categorías de la variable mediante una barra colocada sobre el eje X y cuya altura sea la frecuencia o la frecuencia relativas de dichas categorías. (Sáez, 2012)
Ojiva: es la representación gráfica de un cuadro de frecuencia acumulada. En la gráfica
de ojiva, el último intervalo no se une con el eje horizontal. Para información que
presente frecuencias mayores que el dato que se está comparando tendrá una pendiente
negativa (hacia abajo y a la derecha) y en cambio la que se asigna a valores menores,
tendrá una pendiente positiva. (Salvarrey, 2000)
3
Media muestral: dada una población X y una muestra de tamaño n, es decir, una
sucesión de variables aleatorias, X1,X2,...,Xn , réplicas de X; se entiende por media
muestral a: (Zurita, 2010)
Varianza: cuantificación de las distancias de los datos con respecto al valor de la media. (Zurita, 2010)
Distribución hipergeometrica: es una de las distribuciones de probabilidad discreta, se utiliza para calcular la probabilidad de una selección aleatoria de un objeto sin repetición (Zurita, 2010). La fórmula general es la siguiente:N: cantidad de elementos del conjunto de que se toma la muestraK: cantidad de elementos existentes que se consideran éxitosn: tamaño de la muestraX: variable aleatoria discretax: 0,1,2,….,n (son los valores que puede tomar X)
f ( X )=(Kx )(N−K
n−x )(Nn )
, x=0,1,2,3,…..n
Muestreo de aceptación: se define una muestra como una porción que se toma para
evidenciar la calidad del conjunto. El muestreo de aceptación es la inspección por
muestras en la que se toma la decisión de aceptar o no un producto o servicio; también
la metodología que trata de los procedimientos por los que las decisiones de aceptar o
no se basan sobre los resultados de la inspección de las muestras. (Sáez, 2012)
Curva de operación (OC): representa gráficamente la relación existente entre un
porcentaje de artículos defectuosos de un lote productivo y la probabilidad de
aceptación que se obtiene del mismo luego de aplicar un plan de muestreo como los
detallados en la sección de muestreo simple. Cuando la calidad de un lote es buena tanto
al productor como al consumidor les interesa aceptar el lote con alta probabilidad, caso
contrario, especialmente al consumidor le interesa rechazar el lote la mayoría de las
veces. La probabilidad de aceptar un lote con 0 defectos es naturalmente un 100%.
Alternativamente si el 100% de las unidades son defectuosas la probabilidad de
aceptación del lote es 0%. Por lo tanto una curva característica de operación siempre
pasa por los puntos (0,1) y (100,0). (Moore, 2000)
Error o porcentaje de error: equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis
4
verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse, comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. (Salvarrey, 2000)
Variabilidad: es la probabilidad con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa. (Moore, 2000)
5
Estadísticas Descriptivas
Primero se simulo el experimento estadístico realizando un programa en scilab con el cual creábamos el contenedor con los 40 objetos de los cuales 8 eran defectuosos y se procedía a sacar 5 al azar y anotar cuantas de las 5 estaban dañados un total de 100 veces.
El resultado se escribió en una hoja de cálculo y se la guardo en formato .csv para que se pueda leer luego en el programa R y ordenarlos mediante el siguiente código:
6
Luego se procedió a realizar la tabla de frecuencias tanto absolutas como relativas:
Para luego proceder a Graficar el histograma y la Ojiva correspondiente:
7
Luego calculamos media, varianza, desviación estándar, cuartiles, y el diagrama de cajas:
8
Resultados de Análisis
Ahora se precede a realizar la distribución hipergeometrica (base de este experimento) para relacionar sus resultados con los obtenidos de manera “manual” con las 100 muestras:
Ahora obtenemos la diferencia entre ambos métodos estadísticos:
Como se puede observar las diferencias son muy pequeñas, por lo que se comprueba que la distribución del experimento es una distribución Hipergeometrica.
Ahora se procede a realizar la curva de operación aprobando el lote si como máximo existe un defectuoso entre ellos, a diferentes porcentajes de elementos defectuosos en el contenedor principal. Para ello se procede a realizar una distribución binomial (puede que el objeto este o no dañado) con una probabilidad de éxito que depende del
9
porcentaje de elementos defectuosos totales. Como queremos aceptar el lote si hay como máximo un defectuoso, se deben sumar las probabilidades de que no existan defectuosos, y de que exista solo uno en el lote de prueba. A continuación se muestra el código utilizado:
Conclusiones
Los experimentos estadísticos, luego de muchos intentos nos damos cuenta que tienen resultados parecidos, es decir, tienen una tendencia a mostrar ciertos resultados una cantidad determinada de veces, es por eso que se pueden describir como distribuciones o modelos estadísticos muy precisos.
Como se pudo determinar con las pruebas, debido al bajo número relativo de objetos defectuosos, es normal que obtengamos como resultado que lo más probable es que de la muestra que escojamos tengamos un numero bajo de estos elementos defectuosos.
El experimento realizado es una distribución o modelo hipergeometrico. Resultado no solo previsto por la naturaleza del experimento sino confirmado
10
por los errores casi nulos que obtuvimos al comparar los resultados de este modelo con los de estadística descriptiva.
Saber reconocer los modelos nos ayudan a tener una aproximación bastante certera del comportamiento de un experimento ahorrando en la práctica, el tiempo y recursos que conllevaría realizar las pruebas para los cálculos de estadística descriptiva.
La curva de operación es una técnica usada en calidad muy eficiente, y como se puede observar y es normal imaginarse que mientras menor sea el porcentaje de elementos considerados defectuosos, mayor será la probabilidad de que la producción sea aceptada. La curva depende también de los aspectos que se tomen en cuenta para definir un lote como “de calidad”, en este caso que máximo uno sea defectuoso, si al azar se extraen cinco.
Recomendaciones
Para la correcta utilización del lenguaje de programación R es necesaria la búsqueda de varias guías y referencias sobre el mismo, incluso el uso de la ayuda que los programas de lectura de código de R proporcionan acerca de los argumentos de cada función.
La curva de operación tiene distintas definiciones según la fuente de donde se investiga. Utilizar la que mayormente se adapte al experimento que estamos realizando.
Es preferible utilizar un programa para la realización del centenar de pruebas para dejar totalmente en la aleatoriedad la extracción de las muestras.
Analizar como los cambios en distintos parámetros afecta la forma de la curva de operaciones.
Bibliografía.
Moore, D. (2000). Estadística Aplicada Báasica (Segunda Edición ed.). W. H. Freeman and Company.
Sáez, A. (2012). Estadísticas para Ingrenieros (Primera Edición ed.). Jaen: Univerdad de Jaen.
Salvarrey, L. (2000). Curso de Estadística Básica (Segunda Edición ed.). Salto: Universidad de la República Oriental del Uruguay.
Zurita, G. (2010). Probabilidad y Estadística, Fundamentos y Aplicaciones (Segunda Edición ed.). Guayaquil: ESPOL.
11
Referencias
cran.r-project.org/doc/contrib/Saez-Castillo-RRCmdrv21.pdf
www.youtube.com/watch?v=WD2HKtrl3wI
web.cortland.edu/matresearch/aceptacion.pdf
www.monografias.com/trabajos46/muestreo-de-aceptacion/muestreo-de-aceptacion2.shtml#formac
hyperphysics.phy-astr.gsu.edu/hbasees/math/mean.html
Simulacion_R-garcia-roman.pdf
ocw.uc3m.es/estadistica/aprendizaje-del-software-estadistico-r-un-entorno-para-simulacion-y-computacion-estadistica/introduccion-a-los-graficos-en-r
12