大数据和文档生成流程应用

Decorative image

我第一次听到 "大数据 "这个词,是在 Gartner 举办的 BPM 峰会上。副总裁、著名分析师约翰-马霍尼(John Mahoney)谈到,在不远的将来,汽车、停车计时器、面包机、尿布......几乎所有的东西都将配备无线网卡和 IP 地址。至少可以说,最终的结果将是产生 "大数据 "并上传到云端。从交通流量到弄脏的内衣信息,所有数据都将被传送到处理农场,用于各种分析。

不久之后,我在一次 LSC 会议上聆听了美国首席技术官托德-帕克(Todd Park)的演讲,他定义了另一种类型的 "大数据":各种政府机构几十年来收集的堆积如山的信息--降雨总量、玉米作物、出生率等等。虽然各政府机构在进行此类数据收集工作时可能并没有真正的目的,但他们仍然坚持不懈,结果形成了庞大的数据集,需要成千上万个处理核心协同工作,才能在趋势分析中有所作为。

所有关于 "大数据 "的讨论都引出了一个重要的问题:为什么会有人关心大量非结构化、语焉不详的数据?答案当然是,海量数据集如果能够得到有效处理和分析,就可以用来预测未来--从流感爆发到地区性乳制品消费激增,无所不能。

股票/商品技术交易员早就掌握了这一理念。将一只股票几十年来的每日交易活动绘制在图表上,你就会发现其中的规律。找出这些模式的含义,你就能相当准确地预测一只股票的走势--也许不是明天或下个月,而是未来几年。

最近,有人问我:"大数据与文档生成有什么关系?这个问题很难回答,但我还是要试一试。应用于海量数据集的预测分析专门寻找趋势--其目的可能是预测和预防灾难,从可能发生的事件中获利,或者出于其他原因预测其他任何可能发生的情况。

鉴于文档生成流程应用程序的结构性很强,需要以正确的格式将特定数据输入流程访谈,因此预测分析应用程序需要将数据趋势还原为可用于布尔、数学和其他类型表达式的精确数据点。然后,这些表达式可用于文档模型中的条件逻辑,以组合完全无需人工交互即可定制的文本块。

例如,假设我们生活在约翰-马霍尼的世界里,汽车(以及其他一切事物)都与互联网保持着持续的联系。根据一段道路上的汽车数量以及汽车的平均速度,数据可以被输入到 HotDocs 采访中,从而生成交通报告,并发送到移动设备上,建议驾驶者在必要时选择其他路线(也许还有更好的方法来处理这种情况,但你应该明白其中的含义)。

一个更相关的例子可能涉及政府机构(例如加州交通局,它管理着加州数十亿美元的道路建设预算)。根据一段时间内的交通流量,预测分析可以得出精确的数据点,从而指导工程团队进行估算,并最终用于文档生成流程应用程序的脚本逻辑中。

关键还是要将 "大数据 "集转化为可输入文档生成流程访谈的独立数据项("答案")。


编者按 本文最初发表于 HotDocs.com.2024 年 6 月,Mitratech 收购了高级文档自动化平台 HotDocs。此后,我们对内容进行了更新,以纳入与我们的产品、法规变化和合规性相一致的信息。