En tareas de análisis de datos para mantenimiento o en otras actividades industriales, algunos ingenieros o científicos podrían calcular rápidamente el promedio y la desviación estándar, y usarlos en análisis posteriores, en algunos casos esto podría llevar a error. Lo siguiente es un ejemplo:
Primero, se recomienda graficar el histograma de los datos. Los siguientes datos tienen un promedio igual a 0.74 y una desviación estándar igual a 1.38:
Como se puede observar en la figura 1, los valores están truncados o limitados a un valor menor que 3. El truncado puede ser ocasionado por diversas causas. Los datos pueden estar limitados por la capacidad de alguna máquina o proceso industrial. También los datos pueden estar limitados por la variable del tiempo que no puede ser negativo o extenderse de forma indefinida, pues no se podría medir. Adicionalmente, se puede tener sensores en las plantas con limitado rango de medición. En algunas aplicaciones solo se desea el lado positivo de los datos descartando el lado negativo, o viceversa. Pueden existir otras causas. Para mayores detalles sobre datos truncados, se recomienda ver el video de la referencia [1]. Es importante graficar el histograma de los datos para detectar estos truncados. Actualmente en la mayoría de software de hojas de cálculo, ya es fácil graficar el histograma, antes se necesitaba una librería adicional o ejecutar muchos pasos para lograrlo [2][3]. Existe software más avanzado, como Octave[5], que presenta herramientas muy versátiles para trabajar con histogramas.
Pero las siguientes preguntas surgen: ¿Cómo se resuelve esta curva truncada, es muy difícil por ser discontinua? ¿Por qué no se enseñaba en las universidades en pregrado? Una teoría de respuesta estaría ligada a que las técnicas anteriores eran muy complejas o difíciles, y que en muchas ocasiones no convergían. Pero esto ha cambiado hace pocos años, el libro: “La Guía Práctica de Distribuciones de Probabilidad Truncada” [4] presenta conocimientos fáciles de entender y usar para resolver curvas truncadas, con alta convergencia. Por lo que se recomienda que las universidades e institutos enseñen este conocimiento en pregrado, y los trabajadores se capaciten.
Con el objetivo de resolver u obtener un modelo de los datos, se recomienda completar la curva truncada usando el “Artificio Espejo Óptimo” [4]:
Luego de completar la curva, ya se puede calcular el promedio y la desviación estándar. Estos parámetros de la curva completada participaran en el modelo de la curva truncada. Para este ejemplo, el modelo de datos para la curva truncada es el siguiente:
Es importante notar que el error que se ha evitado es bien grande:
Este ejemplo se muestra en el video de la referencia [6].
Para finalizar, se concluye que estos nuevos conocimientos no solo ayudarán a ingenieros de mantenimiento a realizar análisis más exactos, sino también ayudarán a modelar sistemas y/o procesos de forma más precisa.
Autor: Ing. Claudio San Román Denegri
Referencias
[1] Examples of Truncated Data. Sudamérica Ciencia. 2021. https://www.youtube.com/watch?v=4UAnREmPTZI
[2] Create a histogram. Microsoft. https://support.microsoft.com/en-au/office/create-a-histogram-85680173-064b-4024-b39d-80f17ff2f4e8
[3] Creating a histogram in OpenOffice Calc. Wikieducator. https://wikieducator.org/OpenOffice/Calc_3/Histogram
[4] C. San Román. La Guía Práctica de Distribuciones de Probabilidad Truncada. 2021. https://sudamericaciencia.org/GuiaPracTrunc.html
[5] Software Octave – Scientific Programming Language – https://octave.org/
[6] Consejo para Análisis de Datos. 2024. https://vm.tiktok.com/ZM6TJCnjE/