Category Archives: Ingenieria

Análisis de la relación entre dos variables cualitativas

  La relación a analizar  es la existente entre dos variables que no son numéricas, son categorías y se organizan en tablas de contingencia, que son tablas con las frecuencias observadas.

  Por ejemplo: Se estudia la relación existente entre 4 tratamientos diferentes y los pacientes que después de aplicarles los mismos han empeorado, no han experimentado variación o han mejorado.

Peor Igual Mejor
Tratamiento 1 7 28 115
Tratamiento 2 15 20 85
Tratamiento 3 10 30 90
Tratamiento 4 5 40 115
560

  Hipótesis de partida  H0: Las dos variables (tratamiento y resultado) son independientes.

  Hipótesis alternativa Ha: Las dos variables en estudio están relacionadas.

  En estadística siempre se suponen las variables independientes hasta que los datos demuestran lo contrario.

  Se procede al calculo de las frecuencias marginales de fila que se obtiene sumando los valores de cada fila:

f1 = (7 + 28 + 115) = 150  …  f4 = (5 + 40 + 115) = 160

y de las frecuencias marginales de la columna que se obtienen sumando los valores de cada columna:

f.1 = (7 + 15  + 10 + 5) = 37 … f.4 = (115 + 85 + 90 +115)

Peor Igual Mejor
Tratamiento 1 7 28 115  150
Tratamiento 2 15 20 85  120
Tratamiento 3 10 30 90  130
Tratamiento 4 5 40 115  160
 37 118 405 560

Como podemos ver en la tabla tenemos:

  • Las frecuencias observadas que componen la tabla de contingencia
  • Las frecuencias marginales por fila / columna
  • Gran total n que es el tamaño de la muestra con el que se esta trabajando

 

¿Como se contrasta la hipótesis nula H0?

  Se procede a la estimación de las frecuencias que cabria esperar si las dos variables fueran independientes.

feij = ( total fila i-esima ) x ( total columna j-esima )Total global

Por lo tanto tenemos para la celda 1,1

  • frecuencia observada  fo11 = 7
  • frecuencia estimada  fe11 = (150 x 37)560 = 9.91

realizando el calculo para todas las celdas se obtiene la tabla de frecuencias esperadas:

Peor Igual Mejor
Tratamiento 1 9.91 31.61 108.48
Tratamiento 2 7.93 25.28 86.79
Tratamiento 3 8.59 27.39 94.02
Tratamiento 4 10.57 33.72 115.71
560

  Se procede a medir las discrepancias. Se hace calculando la diferencia entre ambas magnitudes (foijfeij) para todas y cada una de las casillas de la tabla.

  El estadístico de contraste viene dado por

χ2 = Σij(foijfeij)2feij

  Si la hipótesis nula H0 es cierta, las variables son independientes, χ2 sigue una distribución Chi-cuadrado con ( i – 1 ) · ( j – 1 ) grados de libertad.

Se rechaza H0 cuando el χ2experimental > χ2critico

χ2exp = ( 7 – 9.91 )29.91 + … + ( 115 – 115.71 )2115,71 = 13.87

  Para encontrar el χ2critico se consulta el valor de la tabla de distribución χ2 con probabilidad 0.05 ( 5% como riesgo asumible, valor que en la practica es usualmente aceptado por los investigadores ) y grados de libertad ( 4 – 1 ) x ( 3 – 1 ) = 6, lo que nos da un valor critico χ20.05, 6 = 12.59.

por tanto, como χ2exp = 13.87 > χ20.05, 6 = 12.59 se rechaza la hipótesis nula H0 y la conclusión es que la respuesta depende del tratamiento.

Búsqueda de las causas de la significación

  Como la respuesta depende del tratamiento se trata de analizar como es esa relación. Para ello, se localizan las contribuciones mas altas, ya que las filas (o columnas) correspondientes serán responsables de la significación.

  La tabla de contribuciones es la tabla donde cada elemento de la celda viene dado por:

(foijfeij)2feij

Peor Igual Mejor
Tratamiento 1 0.85 0.41 0.39  1.65
Tratamiento 2 6.31 1.11 0.04  7.46
Tratamiento 3 0.23 0.25 0.17  0.65
Tratamiento 4 2.94 1.17 0.00  4.11
13.33 2.94 0.60 18.87

  Como se puede apreciar en la tabla, el principal responsable de la significación parece que puede ser el Tratamiento 2, ya que su contribución total (7.46) es superior a la de los otros tres conjuntamente. Se observa, también, que la aportación a la significación de columna correspondiente al resultado Peor es superior al resto.

  Se elimina de la tabla el Tratamiento 2 y se procede a comprobar si los tratamientos 1, 3 y 4 son homogéneos

Peor Igual Mejor
Tratamiento 1 7 28 115  150
Tratamiento 3 10 30 90  130
Tratamiento 4 5 40 115  160
 22 98 320 440

χ2exp = 5.04  <  χ20.05, 4 = 9.48

  Por lo tanto, se acepta la hipótesis nula H0 de independencia, lo que significa que los tratamientos 1, 3 y 4 tienen un comportamiento homogéneo, dicho de otra forma, la respuesta no depende del tratamiento aplicado y los tres tratamientos aplicados son igual de efectivos.

  Una vez comprobado que no existe diferencia entre el resultado obtenido y los tratamientos 1, 3 y 4 el siguiente paso a dar es comprobar si el tratamiento 2 frente al resto de los tratamientos puede provocar un resultado diferente:

 

Peor Igual Mejor
Tratamiento 2 15 20 85  120
Tratamientos (1,3,4) 22 98 320  440
 37 118 405 560

 χ2exp = 9.48  >  χ20.05, 2 = 5.99

  Se rechaza la hipótesis nula H0, lo que significa que usar el Tratamiento 2 o cualquiera de los otros influye significativamente en el resultado.

  Una vez analizada la contribución de las filas a la significación, se procede al análisis de la contribución de las columnas. Para ello dado que la contribución mas fuerte se realiza en la columna con resultado Peor se procede a eliminarla y comprobar si existe relación entre el tratamiento aplicado y los resultados Igual y Mejor:

Igual Mejor
Tratamiento 2 20 85  105
Tratamientos (1,3,4) 98 320  418
118 405 523

 χ2exp = 0.91  <  χ20.05, 1 = 3.84

por lo que se acepta H0, indicativo de que las respuestas Igual o Mejor son independientes del tratamiento aplicado.

  Se termina contrastando los tratamientos con las respuestas  Igual / Mejor frente a Peor

Peor Igual / Mejor
Tratamiento 2 15 105  120
Tratamientos (1,3,4) 22 418  440
37 523 560

 χ2exp = 8.59  >  χ20.05, 1 = 3.84

se rechaza la hipótesis nula H0 de independencia, existe relación entre la respuesta y el tratamiento.

 

  Conclusión: La proporción de sujetos que empeoran con el Tratamiento 2 es significativamente superior a la misma proporción con los tratamientos 1, 3 y 4. Para los tratamientos 1, 3 y 4, la respuesta no depende del tratamiento.

———- o 0 0 ———-

Escribir ecuaciones matemáticas en WordPress

Estadística para investigadores: Todo lo que siempre quiso saber

Simutalla. Simulador de Tallado de Engranajes Rectos

Simutalla es un programa escrito en C++ que realiza la simulación del tallado de un engranaje recto mediante la técnica del corte por cremallera. Es un simulador que puede ayudar a los estudiantes de ingeniería mecánica a jugar con los parámetros de diseño de un engranaje. En su pagina web se puede encontrar mas información, documentación y los instaladores para win* y linux.

Entre sus peculiaridades se encuentra que es posible diseñar una cremallera con un redondeo en la cabeza del diente y aplicarle un undercut, como recomienda la norma ISO 6336, como se puede observar en la figura siguiente.

Podemos también generar engranajes con dientes asimétricos, como los utilizados en la industria de helicópteros, en los que interesa que el momento en un sentido de giro sea mayor que en el contrario.

Además de dientes esáandar, es posible generar simular la creación de un engranaje corregido (la herramienta de corte se desplaza, alejándose del engranaje, para evitar la penetración en el pie del diente) en el que es observable su alargamiento.

Así que estudiantes de ingeniería mecánica, desde hoy tenéis otra herramienta con la que «jugar» ….