La primera vez que escuché el término «big data» fue en una cumbre de Gartner sobre BPM. John Mahoney, vicepresidente y distinguido analista, hablaba de un mundo no muy lejano en el futuro en el que todo —coches, parquímetros, panificadoras, pañales... prácticamente todo— estaría equipado con tarjetas inalámbricas y direcciones IP. El resultado neto sería, como mínimo, la generación de «big data» y su carga en la nube. Todo, desde los flujos de tráfico hasta la información sobre ropa interior sucia, se enviaría a granjas de procesamiento para realizar todo tipo de análisis.
Poco después, asistí a una conferencia de LSC en la que Todd Park, director tecnológico de Estados Unidos, definía un tipo diferente de «big data»: las montañas de información recopiladas a lo largo de décadas por diversas agencias gubernamentales, como totales de precipitaciones, cosechas de maíz, tasas de natalidad, etc. Aunque es posible que las distintas agencias gubernamentales no tuvieran un objetivo concreto en mente cuando emprendieron estas tareas de recopilación de datos, siguieron adelante y el resultado fueron conjuntos de datos tan grandes que se necesitan miles de núcleos de procesamiento trabajando al unísono para poder siquiera hacer mella en el análisis de tendencias.
Todo lo que se habla sobre el «big data» plantea una pregunta importante: ¿por qué le importa a alguien tener un montón de datos sin ordenar y que no se entienden? La respuesta, claro, es que si se pueden procesar y analizar bien, estos datos enormes pueden servir para predecir el futuro, desde un brote de gripe hasta un aumento en el consumo de productos lácteos en una región.
Los operadores técnicos de acciones y materias primas llevan mucho tiempo familiarizados con esta idea. Si se traza la actividad diaria de negociación de una acción en un gráfico a lo largo de varias décadas, se observan patrones recurrentes. Si se descubre el significado de esos patrones, se puede predecir con bastante precisión la evolución de una acción, quizá no para mañana o el mes que viene, pero sí para los próximos años.
Recientemente, me hicieron la siguiente pregunta: «¿Qué tiene que ver el big data con la generación de documentos?». Es una pregunta difícil, pero voy a intentar responderla. El análisis predictivo aplicado a conjuntos de datos masivos busca específicamente tendencias, con el fin, tal vez, de predecir y prevenir calamidades, monetizar eventos que es probable que ocurran o pronosticar cualquier otra eventualidad por otros motivos.
Dado que las aplicaciones de generación de documentos son muy estructuradas y requieren que se introduzcan datos específicos en una entrevista de proceso con el formato correcto, las aplicaciones de análisis predictivo tendrían que reducir las tendencias de los datos a puntos de datos precisos que pudieran utilizarse en expresiones booleanas, matemáticas y de otro tipo. Dichas expresiones podrían utilizarse entonces en la lógica condicional de los modelos de documentos para ensamblar bloques de texto personalizados por completo sin intervención humana.
Supongamos, por ejemplo, que vivimos en el mundo de John Mahoney, donde los coches (y todo lo demás, por cierto) están en contacto constante con Internet. Basándose en el número de coches que circulan por un tramo de carretera y en la velocidad media de los mismos, se podrían introducir los datos en una entrevista de HotDocs que generaría un informe de tráfico que se enviaría a los dispositivos móviles para aconsejar a los conductores que tomaran una ruta alternativa cuando fuera necesario (probablemente haya mejores formas de gestionar una situación así, pero se entiende la idea).
Un ejemplo más relevante podría ser el de una agencia gubernamental (por ejemplo, Caltrans, que gestiona un presupuesto de miles de millones de dólares para la construcción de carreteras en California). Basándose en los flujos de tráfico a lo largo del tiempo, el análisis predictivo podría proporcionar datos precisos que sirvieran de guía a los equipos de ingeniería a la hora de realizar estimaciones y que, en última instancia, podrían utilizarse en la lógica de scripting de las aplicaciones del proceso de generación de documentos.
La clave, una vez más, es convertir el conjunto de «big data» en elementos de datos discretos («respuestas») que puedan introducirse en un proceso de generación de documentos.
Nota de la Redacción: Este artículo se publicó originalmente en HotDocs.com. En junio de 2024, Mitratech adquirió la plataforma avanzada de automatización de documentos, HotDocs. El contenido ha sido actualizado desde entonces para incluir información alineada con nuestra oferta de productos, cambios en la regulación y cumplimiento.
