大数据和文档生成流程应用

我第一次听到 "大数据 "这个词，是在 Gartner 举办的 BPM 峰会上。副总裁、著名分析师约翰-马霍尼（John Mahoney）谈到，在不远的将来，汽车、停车计时器、面包机、尿布......几乎所有的东西都将配备无线网卡和 IP 地址。至少可以说，最终的结果将是产生 "大数据 "并上传到云端。从交通流量到弄脏的内衣信息，所有数据都将被传送到处理农场，用于各种分析。

不久之后，我在一次 LSC 会议上聆听了美国首席技术官托德-帕克（Todd Park）的演讲，他定义了另一种类型的 "大数据"：各种政府机构几十年来收集的堆积如山的信息--降雨总量、玉米作物、出生率等等。虽然各政府机构在进行此类数据收集工作时可能并没有真正的目的，但他们仍然坚持不懈，结果形成了庞大的数据集，需要成千上万个处理核心协同工作，才能在趋势分析中有所作为。

所有关于 "大数据 "的讨论都引出了一个重要的问题：为什么会有人关心大量非结构化、语焉不详的数据？答案当然是，海量数据集如果能够得到有效处理和分析，就可以用来预测未来--从流感爆发到地区性乳制品消费激增，无所不能。

股票/商品技术交易员早就掌握了这一理念。将一只股票几十年来的每日交易活动绘制在图表上，你就会发现其中的规律。找出这些模式的含义，你就能相当准确地预测一只股票的走势--也许不是明天或下个月，而是未来几年。

最近，有人问我："大数据与文档生成有什么关系？这个问题很难回答，但我还是要试一试。应用于海量数据集的预测分析专门寻找趋势--其目的可能是预测和预防灾难，从可能发生的事件中获利，或者出于其他原因预测其他任何可能发生的情况。

鉴于文档生成流程应用程序的结构性很强，需要以正确的格式将特定数据输入流程访谈，因此预测分析应用程序需要将数据趋势还原为可用于布尔、数学和其他类型表达式的精确数据点。然后，这些表达式可用于文档模型中的条件逻辑，以组合完全无需人工交互即可定制的文本块。

例如，假设我们生活在约翰-马霍尼的世界里，汽车（以及其他一切事物）都与互联网保持着持续的联系。根据一段道路上的汽车数量以及汽车的平均速度，数据可以被输入到 HotDocs 采访中，从而生成交通报告，并发送到移动设备上，建议驾驶者在必要时选择其他路线（也许还有更好的方法来处理这种情况，但你应该明白其中的含义）。

一个更相关的例子可能涉及政府机构（例如加州交通局，它管理着加州数十亿美元的道路建设预算）。根据一段时间内的交通流量，预测分析可以得出精确的数据点，从而指导工程团队进行估算，并最终用于文档生成流程应用程序的脚本逻辑中。

关键还是要将 "大数据 "集转化为可输入文档生成流程访谈的独立数据项（"答案"）。

编者按 本文最初发表于 HotDocs.com.2024 年 6 月，Mitratech 收购了高级文档自动化平台 HotDocs。此后，我们对内容进行了更新，以纳入与我们的产品、法规变化和合规性相一致的信息。

行业解决方案

大数据和文档生成流程应用