Se encontraron 17 investigaciones
Originally this project focused on improving the rat of convergence (RoC) of the FISTA algorithm; in its final form, its objectives also includes improving the RoC of first order stochastic methods.
Participantes:
Instituciones participantes:
Introduced in 2006, the compressed sensing (CS) theory guarantees an exact recovery of specific signals from fewer measurements than the number predicted by the Nyquist limit. This guarantee is obtained for sparse signals (or having a sparse representation in a given basis or frame) and is based on incoherent measurements that generalize the concept of samples in the standard sampling scheme. Since its introduction in 2006, CS has received much attention from the scientific community as shown by the impressive number of journal papers, conferences and workshops on this topic. In particular, it has been shown that several applications can benefit from CS, such as image and video processing, communications, radar, biology or astronomy. Despite solid theoretical background, its application to practical image processing problems (such as those related to hyperspectral and medical imaging addressed in this project) remains an open research problem. This project will be the opportunity to gather researchers from different communities, i.e., medical imaging, hyperspectral imaging and statistical signal processing, with the main objective of bringing CS closer to hyperspectral and medical imaging by developing new methodological approaches meeting the practical constraints specific to each application.
Participantes:
Instituciones participantes:
En un problema inverso (PI) se determinan las causas que producen un efecto sólo en base a la observación del resultado final. Las aplicaciones (procesamiento de imágenes/videos digitales) incluyen deconvolución, eliminación de ruido, representaciones 'sparse', clasificación, modelamiento de fondo en videos, etc. Un PI es típicamente expresado como la minimización de una función costo con al menos dos componentes: F(u,b) + cR(u); los términos fidelidad (F, distancia entre la solución u y la data observada b) y regularización (R, imposición de características particulares a la solución). El contrapeso entre ambas c, denominado parámetro de regularización (PR), afecta críticamente la calidad de la solución. La mayoría de PI utilizan funciones costo que incluyen regularizaciones L1: R(u)=|| u ||_1; para estos casos, es práctica común seleccionar el PR de modo experimental. La regularización de norma mixta l1-infinito (RM1i) ha sido propuesta como regularizaciones conjuntas, donde se espera que las variables a optimizar muestren un 'comportamiento grupal'. Este tipo de regularizaciones apuntan a extender regularizaciones L1, las cuales favorecen soluciones 'sparse' no estructuradas (no existe dependencia entre los elementos de la solución), a soluciones que son 'sparse' a nivel grupo; esta clase de comportamiento grupal es observada en problemas 'group-Lasso', así como en Convolutional Sparse Coding (CSC). En el presente proyecto se plantea el desarrollo de un método genérico, simple y computacionalmente efectivo para estimar de modo adaptativo el PR asociado a los PI Basis Pursuit (BP), CSC y Robust PCA (RPCA); para tal fin, se plantea substituir la regularización L1 por una restricción en la Bola-L1 en conjunción con un novel uso del principio de discrepancia de Morozov. También se plantea extender los resultados previamente señalados para el caso en el que se sustituye RMli, por una restricción en la Bola L1-infinito para el PI asociado con CSC.
Participantes:
Instituciones participantes:
Recientemente se ha propuesto el método Principal Component Pursuit (PCP) [2,3] como una alternativa robusta (ante datos irregulares) a técnicas mas tradicionales (PCA [7] y técnicas derivadas). PCP es exitosamente usado para segmentar automáticamente objetos en movimiento del fondo (objetos estáticos, siendo PCP el estado del arte [41] en esta aplicación) en aplicaciones médicas [25] y en seguridad ciudadana [4,8,26,28], entre otras aplicaciones [5,6,27,32,33,34]. Sin embargo, vía los algoritmos existentes [1,2,3,4,6,28,29,46], el costo computacional de PCP es muy elevado y no permite aplicaciones practicas en tiempo real, p.e. análisis de imágenes aéreas de alta resolución orientado a seguridad ciudadana [26,35,38], pricipalmente porque los algoritmos existentes están basados en el cálculo de la descomposición de valores singulares (SVD) [11] o SVD parcial [45]. Este proyecto propone un desarrollo teórico/computacional el cual será aplicado al análisis de videos full-HD de flujo vehicular registrados desde un UAV. El desarrollo teórico/computacional apunta a la elaboración de un nuevo algoritmo paralelo, computacionalmente eficiente que solucione el problema PCP y que: (i) no incluya el cálculo directo de SVD, (ii) sea fácilmente paralelizable, teniendo especial énfasis en el modelo de programación SIMT ó CUDA [23,24]. Se destaca que en [21], artículo escrito por el investigador principal, se plantean las ideas base del nuevo algoritmo; en dicho artículo se muestra que la implementación secuencial (no paralela) del algoritmo planteado es hasta un orden de magnitud mas rápida que las implementaciones publicadas. El desarrollo de la aplicación planteada está orientado a utilizar el algoritmo planteado para segmentar, alinear y analizar (discriminación y conteo) automáticamente, en tiempo real, los objetos en movimiento (automóviles, peatones y ciclistas) en vídeos digitales (1920x1080 pixel, 30 cuadros por seg.) de flujo vehicular grabados desde un UAV.
Participantes:
Instituciones participantes:
Redes neuronales convolucionales (ó 'convolutional neural networks', CNN) [1], es una metodología en 'neural networks' (NN) en la que los datos crudos son utilizados como entrada, obteniendo resultados ampliamente superiores a aquellos obtenidos con NN clásicas. En NN clásicas, los datos (imágenes o vídeos en el presente contexto) son prepocesados siguiendo alguna metodología ad-hoc; como resultado se obtienen vectores con los que la NN (clasificador) es entrenada. Dado que los datos de entrenamiento presentan variabilidades (traslaciones y distorsiones locales) [2], el pre-procesamiento tiene que estandarizar dichos problemas. Debido a su estructura, inspirada en modelos biológicos para reconocimiento visual, CNN es robusta ante traslaciones y distorsiones locales, evitando la etapa de pre-procesamiento manual asociada a NN. CNN tienen una performance (clasificación) muy superior a NN clásicas; sin embargo, su costo computacional es mucho mayor, por lo cual su utilidad se ha visto restringida, en la mayoría de los casos, a análisis de datos 2D. El presente proyecto plantea el desarrollo de un nuevo algoritmo progresivo computacionalmente eficiente, a ser implementado en tecnología CUDA, para analizar vídeos digitales (datos 3D) vía CNN, enfocándose en aplicaciones orientadas al reconocimiento de actividades humanas (uso de teléfono celular, dejar/guardar un objeto, apuntar, etc.) lo cual tiene alta relevancia en seguridad ciudadana.
Participantes:
Instituciones participantes:
Representaciones 'sparse' es una técnica ampliamente usada para aplicaciones en procesamiento de imágenes digitales. Dada la señal b, la cual puede representar datos multidimensionales, y el diccionario matricial D, el problema inverso que la representación sparse soluciona se enfoca en hallar la representación u con la mayor cantidad de entradas nulas posibles, tal que D u = b. En caso de que el diccionario es auto-aprendido en base a un conjunto de datos relevantes al problema específico, la performance de la representación sparse, medida en el número de entradas nulas en u, se incrementa aunque no llega a ser óptima. Recientemente se han propuesto métodos basados en representaciones 'sparse' convolucionales (convolutional sparse representations o CSR), en cuyo caso se auto-aprenden filtros, que al ser convolucionados con cada imagen ejemplo de modo global, genera un diccionario óptimo. CSR tiene claras ventajas respecto de métodos previos, sin embargo la gran mayoría de algoritmos computacionales son muy costosos por lo que su aplicación se ha visto restringida a casos bi-dimensionales (imágenes). El presente proyecto plantea el desarrollo de un algoritmo progresivo computacionalmente eficiente para analizar vídeos digitales (data tri-dimensional) vía técnicas CSR, enfocándose en aplicaciones orientadas al reconocimiento de actividades humanas. El reconocimiento de actividades humanas se orienta a la identificación de acciones que involucran movimiento (p.e. acciones importantes en un aeropuerto: uso de teléfono celular, dejar/guardar un objeto, apuntar, etc.), razón por la cual, en lugar de analizar el video original, que incluye objetos estáticos, se plantea analizar el correspondiente video sparse, en el cual los objetos estáticos han sido eliminados. Adicionalmente, y de modo preponderante, se plantea un nuevo algoritmo progresivo para solucionar el problema planteado en el dominio de Fourier, el cual reduce substancialmente el costo computacional
Participantes:
Instituciones participantes:
Recientemente se ha propuesto el método Principal Component Pursuit (PCP) [2,3] como una alternativa robusta (ante datos irregulares) a técnicas mas tradicionales (p.e. Principal Component Analysis [7] y técnicas derivadas). PCP es exitosamente usado para segmentar automáticamente objetos en movimiento del fondo (objetos estáticos) en aplicaciones médicas [26] y en seguridad ciudadana [4,8,27,29], entre otras aplicaciones [5,6,28,33,34]. Sin embargo, vía los algoritmos existentes [1,2,3,4,6,29,30], el costo computacional de PCP es muy elevado y no permite aplicaciones practicas en tiempo real, p.e. análisis de imágenes aéreas de alta resolución orientado a seguridad ciudadana [27,36,39]. Este proyecto propone desarrollar un nuevo algoritmo paralelo, computacionalmente eficiente, para el computo de PCP y aplicaciones, teniendo especial énfasis en el modelo de programación SIMT o CUDA [25]. Se destaca que en [21], artículo escrito por el investigador principal, aceptado en ICIP'13 [22], se plantean las ideas base del nuevo algoritmo. Además se proponen dos casos de estudio: Segmentación automática en tiempo real de objetos en movimiento en vídeos digitales (1920x1080 pixel, 30 cuadros por seg.) grabados desde un UAV (Unmanned aerial vehicle), orientado a seguridad ciudadana (conteo de vehiculos, personas y ciclistas), y desde una silla de ruedas instrumentada; el segundo caso está relacionado al proyecto Coalas [13] de la Entidad Asociada (universidad francesa Esigelec).
Participantes:
Instituciones participantes:
Los interferómetros Fabry Perot (FPI, por sus siglas en inglés) tienen multiples aplicaciones en el área de sensado remoto atmosférico. Por ejemplo, junto con láseres, estos interferómetros son usados para la implementación de 'doppler wind lidars', sistemas utilizados para medir (estimar) el desplazamiento en frecuencia de la luz reflejada por moléculas o aerosoles en la atmósfera, con lo cual se puede inferir información acerca de la velocidad y dirección del viento en la atmósfera de la Tierra, y en algunos casos también se puede inferir su temperatura [1-13]; esta información (velocidad, dirección y temperatura del viento) es de crucial importancia en meteorología, predicción del clima, etc. Las mediciones se pueden realizar desde estaciones terrestres y/o plataformas aéreas y además tienen una alta resolución espacio-temporal. La calidad de las estimaciones de la velocidad y temperatura del viento son proporcionales a la calidad del análisis y cuantización del patrón interferométrico de circulos (o 'fringes') observado; además el análisis se ve afectado por diversos factores, siendo el más perjudicial la presencia de ruido multiplicativo ('speckle'), el cual es típico en sistemas de formación de imágenes basados en luz coherente. En el presente proyecto se propone analizar los datos registrados por la red de FPIs (del Radio-observatorio de Jicamarca o ROJ) para luego realizar una comparación con aquellos obtenidos actualmente por ROJ y finalmente realizar una transferencia tecnológica hacia el ROJ. El análisis se realizará en dos etapas: La primera etapa estaría centrada en eliminar el ruido presente en la imágenes registradas utilizando el algoritmo (Variación Total) desarrollado en [16]; es importante señalar que el uso de técnicas de Variación Total para eliminar el ruido presente en imágenes interferométricas es un aporte novedoso. La segunda etapa se centrará en la estimación de los parámetros de interés de la imagen sin ruido.
Participantes:
Instituciones participantes: