Resolución numérica de problemas dispersos generalizados con aplicaciones en modelos ecológicos de predicción de la presencia de especies en áreas naturales

Creado por: ModeMat
Estado: FINALIZADO
Colaboración: EPN

Consideramos problemas del tipo LASSO (least absolute shrinkage and selectrion operator) generalizados, que son modelos de regresión muy utilizados en estadística, aprendizaje automático e imágenes, para realizar predicciones de una variable desconocida en función de información existente. En particular, los modelos de máxima entropía (maxent) usados para estimar una distribución de probabilidad de la presencia de especies en territorios naturales son un caso particular de estos problemas, los cuales se formulan con un problema de optimización de la forma: min f(x) + beta * ||C * x1||_1 x Donde F representa el costo de ajuste de los datos y el termino beta * |C * x1|_1 corresponde a una penalización para inducir soluciones poco densas , i.e. con un número grande de entradas nulas en el rango de C . En particular, si C representa al gradiente discreto, se promueve que la solución varíe poco en un sentido local. Esta característica es muy utilizada en la reconstrucción de imágenes y señales. Debido a que estos problemas son no diferenciales por la presencia del termino de penalización y la presencia del operador C , su resolución numérica no es trivial y requiere de herramientas del análisis convexo para su resolución. Proponemos extender el método desarrollado en , que considera C=I (I 0 identidad ) , para el caso general en que C es una matriz rectangular. Esta selección implica retos matemáticos significativos, tanto teóricos como numéricos debido a la correlación de las variables por la matriz . En este caso, no se tiene una interpretación por componentes de las cantidades asociadas a la variable óptima, como en el caso de 1.