Microsoft, y otros cinco compiten en descripción automática de imágenes.

¿Alguna vez pensaste que la próxima tecnología sería la habilidad de una máquina de ver una imagen y describirla con palabras?

Google habrá empezado el interés en el reconocimiento automático de imágenes, pero otros grupos de investigadores incluyendo a Microsoft y Baidu, también quieren participar. Microsoft comentó el martes que la compañía inició un proyecto de investigación durante el verano, dónde los resultados fueron tan convincentes para engañar a humanos en un 20 por ciento de las veces. Microsoft publicó sus resultados en un documento que será presentado en la Computer Vision and Pattern Recognition conference en Junio de 2015.

El modelo de Microsoft divide una imagen en regiones, luego trata de identificar los objetos en cada región, basándose en los bordes de objetos particulares que puede detectar. Esto crea una selección de palabras, las cuales el sistema trata de ajustar en descripciones entendibles,

microsoft-image-recognition-100531626-large

En la imagen inferior, el sistema describió: “Un gato sentado en una cama”, lo que es bueno, aunque ignoró a la persona a su lado con una laptop abierta.

microsoft-image-recognition-cart-100531625-medium

En general, Microsoft probó esta tecnología con dos métricas de traducción de máquinas, sobrepasando niveles de reconocimiento humano, “La verdadera meta es hacer una prueba en la que le preguntemos a la gente que descripción es mejor; la de un humano, o la de una máquina”

Microsoft utilizó Amazon para pedirle a la gente qué descripción es mejor, de entre dos. Para un 23.3% de las imágenes de prueba, la gente pensó que la descripción del sistema era la misma o mejor que la que hizo un humano”

Esto importa porque: Hasta el momento, Google Image Search, Bing Images, y otras tecnologías se apoyan en cosas como nombres de archivos y el contexto para ayudar a identificar la imagen de una hamburguesa. El proceso automático para identificar una imagen, no solamente mejoraría los motores de búsqueda, sino que también apoyaría a etiquetas las fotos de tus vacaciones en Paris, sin tener que buscar cada una de esas fotos.