viernes, 4 de enero de 2008

Representación Gráfica de Conjuntos Inmensos de Datos Para Detectar Peligros


Poco después del 11-S, los estadounidenses se preguntaron alarmados: ¿Cómo nuestros servicios de vigilancia pasaron por alto los indicios? Sospechosos que figuraban en listas de observación movieron dinero en formas llamativas. El "parloteo" sospechoso había aumentado en los meses anteriores. Un sujeto de visita en el país había ofrecido dinero en efectivo para aprender a pilotar, pero no a aterrizar, un avión de pasajeros. En retrospectiva, estas pepitas de información delatora proporcionaron indicios del terrible ataque que se avecinaba.

El problema fue que la mayoría de tales pepitas estaban ocultas en medio de una avalancha de datos que llegaron más rápido de lo que los analistas podían procesar. La recogida de datos de un día podría llenar más de 6 millones de iPods de 160 gigas. Lo que es más, como las personas, las pepitas algunas veces discrepan. Y, como una historia contada y recontada que se va distorsionando, sus mensajes cambiaron, a veces de manera imperceptible.

Finalmente, la mayoría de las pepitas están bajo la forma de datos difusos no estructurados. Por ejemplo, el mismo rostro puede aparecer en tres videos de vigilancia. Tales indicios, como la mayoría, no vienen convenientemente empaquetados en una hoja de cálculo ordenada o en un texto escudriñable letra a letra; deben ser inferidos a partir de fotos, videos y voces.

Para impedir un próximo 11-S, los analistas deben mezclar, por así decirlo, el ojo enciclopédico de Google con el genio deductivo de Sherlock Holmes.

A finales del siglo pasado, Edward Tufte catalogó formas de visualizar datos estructurados (por ejemplo, horarios de trenes) o similares (por ejemplo, tasas de mortalidad). Hoy en día, los investigadores de la Dirección de Ciencia y Tecnología del Departamento de Seguridad Nacional de Estados Unidos están creando formas de apreciar datos difusos como una imagen tridimensional donde los indicios de amenazas pueden resaltar de entre todo lo demás.

El emergente campo del análisis visual lleva ahora el trabajo de Tufte a su siguiente fase. Los investigadores que trabajan en esta labor están automatizando la forma en que los analistas reconocen y valoran las amenazas potenciales. Los matemáticos, lingüistas y expertos en lógica hacen que el universo colectivo de datos asuma una forma significativa. Ellos le asignan brillo, color, textura, y tamaño a miles de millones de datos conocidos o supuestos, y crean reglas para integrar estos valores de forma que resalten las amenazas. Por ejemplo, las grabaciones de video de un día, llamadas de teléfonos móviles, fotos, registros bancarios, salas de chat en internet y mensajes de correo electrónico, pueden tomar la forma de una nube gris azulada. Si un gran peligro acecha a Los Ángeles y a Boston, estas ciudades son resaltadas en un mapa de Estados Unidos.

Las imágenes estáticas de un mes pueden ser animadas como una película que presenta de manera acelerada el paso del tiempo, y en la que una "cordillera" creciendo revela una amenaza en auge.

Pasarán años antes que el análisis visual pueda detectar automáticamente pistas a partir de datos difusos tales como el video, pero se van haciendo progresos hacia esa meta.

No hay comentarios:

Búsqueda personalizada