CaptionBot, el bot de Microsoft que describe fotos… con más o menos acierto

CaptionBot, el bot de Microsoft que describe fotos… con más o menos acierto

Microsoft ha lanzado otra de sus aplicaciones para demostrar el poder de Bing en inteligencia artificial y más concretamente en reconocimiento de imágenes.

CaptionBot  es un bot que intenta describir las fotos.

El sistema que usa Microsoft es el resultado de años de investigación en hacer que las máquinas sean capaces de reconocer que están viendo, además de decirlo de una forma natural. No es lo mismo que un programa como este te diga que en una foto hay X personas en una calle que te diga que hay X personas sonriendo mientras caminan por la calle.

El funcionamiento es sencillo: subes una imagen o le das la dirección de una foto para que la analice y automáticamente te intentará dar una descripción. Pero los resultados aun tienen que afinarse un poco. Como los bots de Microsoft han tenido este problema de saber qué es socialmente aceptable, lo hemos puesto a prueba con unas simples pruebas.

Primero, ¿reconocerá una simple foto de dos personas? Parece que no.

CaptionBot

De acuerdo, la primera prueba no ha salido del todo bien. ¿Qué pasará si usamos una foto de… las Spice Girls?

CaptionBot Spice Girls

¡En el clavo! CaptionBot no solo ha reconocido quién es quién, también que están posando. Donde todavía falla es en saber el contexto de la foto, como se puede leer identifica a Victoria Beckham, pero cuando esta foto se tomó no había tomado el apellido del futbolista. Es decir, sabe quiénes son, sabe que están haciendo, pero no sabe que en conjunto son una banda de pop.