Desarrollan una técnica innovadora de segmentación de imágenes digitales

Republicar

The Agency FAPESP licenses news via Creative Commons (CC-BY-NC-ND) so that they can be republished free of charge and in a simple way by other digital or printed vehicles. Agência FAPESP must be credited as the source of the content being republished and the name of the reporter (if any) must be attributed. Using the HMTL button below allows compliance with these rules, detailed in Digital Republishing Policy FAPESP.

Agência FAPESP* –Por Diego Freire 
Agência FAPESP – Científicos del Instituto de Ciencias Matemáticas y Computación (ICMC) de la Universidad de São Paulo (USP), con sede en la ciudad de São Carlos (São Paulo, Brasil), y de la Universidad Brown, en Rhode Island, Estados Unidos, desarrollaron una herramienta computacional que se vale de técnicas innovadoras de segmentación de imagen para facilitar la tarea de modificar imágenes digitales con base en la selección de algún elemento existente que se pretenda separar o excluir.
La segmentación de imágenes es un campo de las ciencias de computación dedicado al procesamiento de imágenes digitales y al reconocimiento de patrones. La innovación reside en este caso en la incorporación de las coordenadas de Laplace, un operador matemático utilizado para estudiar fenómenos en diversas áreas de la ciencia, tales como astronomía, mecánica de fluidos y computación gráfica.
Con base en la combinación de estas coordenadas, los investigadores desarrollaron un prototipo de un programa de computadora capaz de segmentar una imagen de manera fácil y ágil, y sin necesidad de tener conocimientos de diseño gráfico: basta con que el usuario efectúe pequeñas marcas dentro y alrededor de la parte que desea separar o remover.
Este trabajo se desarrolló en el marco de la investigación intitulada Generación de mallas a partir de imágenes vía segmentación topológica, llevada a cabo por Wallace Correa de Oliveira Casaca, con beca de doctorado de la FAPESP y bajo la dirección de Luis Gustavo Nonato, del ICMC. Oliveira Casaca contó también con la colaboración de Gabriel Taubin, de la Universidad Brown, en donde permaneció durante un año con una Beca de Pasantía de Investigación en el Exterior (BEPE, por sus siglas en portugués), también concedida por la FAPESP.
“Para procesar un determinado elemento de una imagen es necesario que el software sepa exactamente dónde empieza y dónde termina ese elemento. Las coordenadas de Laplace propagan la información que el usuario marcó dentro y alrededor de ese elemento hasta que la misma llegue exactamente al límite entre el objeto de interés y otros elementos de la imagen, asegurando así la precisión del recorte”, explicó Nonato.
Esta herramienta tendría múltiples aplicaciones, tales como el recorte de fotografías con fines personales o artísticos y el realce de determinadas áreas de imágenes médicas para la detección de tumores y otros cuerpos extraños.
Un artículo que expone los resultados de este trabajo en el ámbito de segmentación de imágenes fue seleccionado para su presentación en la Conference on Computer Vision and Pattern Recognition (CVPR), realizada por el Institute of Electrical and Electronics Engineers (IEEE) en Ohio, Estados Unidos, en junio pasado. Y otro trabajo, en el cual se combina la estrategia de segmentación con técnicas destinadas a la restauración de fotografías, integró las ponencias de la IEEE International Conference on Image Procesing (ICIP), realizada en Quebec, en el Canadá, en el mes septiembre.
Cómo opera
Al utilizar el software que crearon los científicos es posible informarle al ordenador qué elementos se pretende alterar y preservar los restantes. Con trazos en colores diferentes, sin preocuparse con la precisión del contorno, el usuario selecciona qué sale y qué queda en la composición, suministrándole la información mínima que el sistema necesita para reconocer automáticamente qué debe hacer y cómo recortar la figura.
“Al hacer el trazo rojo, es como si el usuario le dijese al sistema: ‘pon esta información que aparece aquí en mi imagen’. En tanto, con la marca verde se le suministra otra pista: sólo debe aparecer lo que está dentro del área. La idea es representar la imagen digital mediante variables matemáticas y entonces aplicar modelos matemáticos específicos tendientes a segmentar, cortar la imagen en partes de fácil detección por parte de un observador humano”, explicó Oliveira Casaca.
El método mediante el cual la computadora reconoce qué debe hacer con base en las “sugerencias” del usuario se denomina segmentación de imágenes basada en semillas.
“Es como si se arrojasen semillas para que la herramienta pueda dispersarlas hasta alcanzar los bordes del objeto. Una de las ventajas de este nuevo método radica en que, a diferencia de otras técnicas, permite recortar objetos con una gran precisión de ajuste en los contornos. Otros software que automatizan el proceso desembocan en resultados distintos, aunque se delimiten las mismas marcaciones, y así elimina partes que no deberían eliminarse, pues las mismas se fusionan con otros elementos de la imagen”, comparó.
Para evaluar la nueva herramienta, los investigadores la emplearon en 50 imágenes disponibles en un banco de datos comúnmente utilizado en este tipo de investigaciones llamado Grabcut, de Microsoft. De acuerdo con Oliveira Casaca, los resultados obtenidos fueron cuantitativamente y cualitativamente comparables a los métodos que están considerados actualmente como el estado del arte.
“Luego de adaptar la teoría relacionada con las coordenadas de Laplace a la tarea de segmentación de imágenes, desarrollamos una serie de evaluaciones numéricas y experimentales para averiguar su nivel de eficiencia cuando se la compara con técnicas tradicionales consolidadas en el área. La herramienta elaborada se vale de todas las ventajas de esta teoría, tales como la alta adherencia en los contornos de objetos, el bajo costo computacional y la practicidad de su utilización, entre otras, para procesar el resultado final de la segmentación”, dijo Oliveira Casaca.
El investigador trabaja ahora en el proyecto de posdoctorado intitulado Segmentación interactiva de imágenes digitales y reorganización de diseños visuales vía minimización de funciones de energía en grafos, también con el apoyo de la FAPESP, y pretende desarrollar una versión del software para smartphones, ampliando así las aplicaciones de la herramienta.
El prototipo de la primera versión del segmentador se encuentra disponible para su descarga gratis en: icmc.usp.br/e/3dbef. También puede verse un video explicativo en: icmc.usp.br/e/ddf4e.

<p><strong>Por Diego Freire </strong></p>
<p><strong>Agência FAPESP</strong> – Científicos del Instituto de Ciencias Matemáticas y Computación (ICMC) de la Universidad de São Paulo (USP), con sede en la ciudad de São Carlos (São Paulo, Brasil), y de la Universidad Brown, en Rhode Island, Estados Unidos, desarrollaron una herramienta computacional que se vale de técnicas innovadoras de segmentación de imagen para facilitar la tarea de modificar imágenes digitales con base en la selección de algún elemento existente que se pretenda separar o excluir.</p>
<p>La segmentación de imágenes es un campo de las ciencias de computación dedicado al procesamiento de imágenes digitales y al reconocimiento de patrones. La innovación reside en este caso en la incorporación de las coordenadas de Laplace, un operador matemático utilizado para estudiar fenómenos en diversas áreas de la ciencia, tales como astronomía, mecánica de fluidos y computación gráfica.</p>
<p>Con base en la combinación de estas coordenadas, los investigadores desarrollaron un prototipo de un programa de computadora capaz de segmentar una imagen de manera fácil y ágil, y sin necesidad de tener conocimientos de diseño gráfico: basta con que el usuario efectúe pequeñas marcas dentro y alrededor de la parte que desea separar o remover.</p>
<p>Este trabajo se desarrolló en el marco de la investigación intitulada <strong><a href="http://www.bv.fapesp.br/pt/bolsas/112880/geracao-de-malhas-a-partir-de-imagens-via-segmentacao-topologica/" target="_blank">Generación de mallas a partir de imágenes vía segmentación topológica</a></strong>, llevada a cabo por Wallace Correa de Oliveira Casaca, con beca de doctorado de la FAPESP y bajo la dirección de Luis Gustavo Nonato, del ICMC. Oliveira Casaca contó también con la colaboración de Gabriel Taubin, de la Universidad Brown, en donde permaneció durante un año con una <strong><a href="http://www.bv.fapesp.br/pt/bolsas/137832/segmentacao-de-grafos-densos-via-formulacao-de-pagerank-com-aplicacoes-em-malhas-e-imagens/" target="_blank">Beca de Pasantía de Investigación en el Exterior</a></strong> (BEPE, por sus siglas en portugués), también concedida por la FAPESP.</p>
<p>“Para procesar un determinado elemento de una imagen es necesario que el <em>software</em> sepa exactamente dónde empieza y dónde termina ese elemento. Las coordenadas de Laplace propagan la información que el usuario marcó dentro y alrededor de ese elemento hasta que la misma llegue exactamente al límite entre el objeto de interés y otros elementos de la imagen, asegurando así la precisión del recorte”, explicó Nonato.</p>
<p>Esta herramienta tendría múltiples aplicaciones, tales como el recorte de fotografías con fines personales o artísticos y el realce de determinadas áreas de imágenes médicas para la detección de tumores y otros cuerpos extraños.</p>
<p>Un artículo que expone los resultados de este trabajo en el ámbito de segmentación de imágenes fue seleccionado para su presentación en la Conference on Computer Vision and Pattern Recognition (CVPR), realizada por el Institute of Electrical and Electronics Engineers (IEEE) en Ohio, Estados Unidos, en junio pasado. Y otro trabajo, en el cual se combina la estrategia de segmentación con técnicas destinadas a la restauración de fotografías, integró las ponencias de la IEEE International Conference on Image Procesing (ICIP), realizada en Quebec, en el Canadá, en el mes septiembre.</p>
<p><strong>Cómo opera</strong></p>
<p>Al utilizar el <em>software</em> que crearon los científicos es posible informarle al ordenador qué elementos se pretende alterar y preservar los restantes. Con trazos en colores diferentes, sin preocuparse con la precisión del contorno, el usuario selecciona qué sale y qué queda en la composición, suministrándole la información mínima que el sistema necesita para reconocer automáticamente qué debe hacer y cómo recortar la figura.</p>
<p>“Al hacer el trazo rojo, es como si el usuario le dijese al sistema: ‘pon esta información que aparece aquí en mi imagen’. En tanto, con la marca verde se le suministra otra pista: sólo debe aparecer lo que está dentro del área. La idea es representar la imagen digital mediante variables matemáticas y entonces aplicar modelos matemáticos específicos tendientes a segmentar, cortar la imagen en partes de fácil detección por parte de un observador humano”, explicó Oliveira Casaca.</p>
<p>El método mediante el cual la computadora reconoce qué debe hacer con base en las “sugerencias” del usuario se denomina segmentación de imágenes basada en semillas.</p>
<p>“Es como si se arrojasen semillas para que la herramienta pueda dispersarlas hasta alcanzar los bordes del objeto. Una de las ventajas de este nuevo método radica en que, a diferencia de otras técnicas, permite recortar objetos con una gran precisión de ajuste en los contornos. Otros <em>software</em> que automatizan el proceso desembocan en resultados distintos, aunque se delimiten las mismas marcaciones, y así elimina partes que no deberían eliminarse, pues las mismas se fusionan con otros elementos de la imagen”, comparó.</p>
<p>Para evaluar la nueva herramienta, los investigadores la emplearon en 50 imágenes disponibles en un banco de datos comúnmente utilizado en este tipo de investigaciones llamado Grabcut, de Microsoft. De acuerdo con Oliveira Casaca, los resultados obtenidos fueron cuantitativamente y cualitativamente comparables a los métodos que están considerados actualmente como el estado del arte.</p>
<p>“Luego de adaptar la teoría relacionada con las coordenadas de Laplace a la tarea de segmentación de imágenes, desarrollamos una serie de evaluaciones numéricas y experimentales para averiguar su nivel de eficiencia cuando se la compara con técnicas tradicionales consolidadas en el área. La herramienta elaborada se vale de todas las ventajas de esta teoría, tales como la alta adherencia en los contornos de objetos, el bajo costo computacional y la practicidad de su utilización, entre otras, para procesar el resultado final de la segmentación”, dijo Oliveira Casaca.</p>
<p>El investigador trabaja ahora en el proyecto de posdoctorado intitulado <strong><a href="http://www.bv.fapesp.br/pt/bolsas/156220/segmentacao-interativa-de-imagens-digitais-e-rearranjo-de-layouts-visuais-via-minimizacao-de-funcion/" target="_blank">Segmentación interactiva de imágenes digitales y reorganización de diseños visuales vía minimización de funciones de energía en grafos</a></strong>, también con el apoyo de la FAPESP, y pretende desarrollar una versión del <em>software</em> para <em>smartphones</em>, ampliando así las aplicaciones de la herramienta.</p>
<p>El prototipo de la primera versión del segmentador se encuentra disponible para su descarga gratis en: <strong><a href="https://sites.google.com/site/wallacecoc/publications/lapcoordinates.zip?attredirects=0" target="_blank">icmc.usp.br/e/3dbef</a></strong>. También puede verse un video explicativo en: <strong><a href="https://www.youtube.com/watch?v=IbhxpmtFa0Q" target="_blank">icmc.usp.br/e/ddf4e</a></strong>.</p>
<p> </p>