美陆军如何了解自己?1976 年 11 月,美国陆军训练和条令司令部负责训练的副参谋长保罗·戈尔曼 (Paul Gorman) 少将提出了这个问题。那个月,他在蒙茅斯堡告诉聚集的听众,陆军很难了解自己,因为它“没有普通部队在模拟良好的作战环境中完成工作时上交的大量数据”。因此,戈尔曼提出了一个他和他有影响力的上司威廉·德普伊 (William DePuy) 将军一直在开发的激进解决方案:在荒野中建造一个巨大的战斗模拟,以训练士兵并收集这些数据。
有了这些数据,陆军可以了解其作战部队状态的基本事实,就像凝视着一面昂贵但空前清晰的镜子一样。通过这样做,它可以了解模拟战争中最有效的方法,从而为下一次真实战争做好准备。
本文由所长007编译,本文英文原文及译文已上传至文末知识星球。请扫码文末二维码加入知识星球下载。如需购买精译报告及情报数据库,请联系微信:lanjunqingbao2081。
关键字:战斗训练、数据、培训中心
这是蓝军开源情报的第 295 期分享
编译 l 所长007
来源 l 蓝军开源情报(ID:Lanjunqingbao)
转载请联系授权(微信号:Lanjunqingbao2081)
尽管陆军已经建立了戈尔曼提议的战斗训练中心,因此获得了清晰的镜子,但它目前并没有关注它们。这是因为由于监管的模糊性,陆军没有系统地从这些训练中心收集数据。为了满足当前的两次世界大战时刻,为了现在的联系转型,陆军必须以结构化、量化和定期的方式捕捉轮换训练部队的表现。这项任务很紧迫,因为定期的训练中心轮换可以揭示作战部队的真实状态,这是任何报告或检查都无法做到的。这样做为必要的改革指明了道路,但前提是必须进行综合研究。仅从陆军经验教训中心(Center for Army Lessons Learned)的报告中找到的那种定性观察是不够的。还需要纵向的结构化数据。
一、培训中心收集了什么?
陆军的战斗训练中心轮换是一个专业和后勤奇迹。轮换成本可能高达数千万美元。由此产生的训练是壮观的。然而,从历史上看,战斗训练中心的数据收集质量落后于训练本身的质量。1986 年政府问责局的一份报告发现,国家训练中心的数据收集并不令人满意。13 年后,另一份报告发现情况并没有太大改善,并指出由于缺乏集中数据,陆军“不知道中心演习在多大程度上提高了其部队和领导者的熟练程度”。
今天,问题仍然存在。管理战斗训练中心运营的陆军法规 350-50,战斗训练中心计划,对于必须收集哪些轮换训练单位数据仍然模棱两可。除了战斗训练中心-仪表系统生成的数 TB 的原始仪器数据外,大多数轮换数据都存在于非结构化的带回家数据包中,其中包括用于受训单位的行动后审查幻灯片。由于缺乏监管标准,收集做法和带回家的数据包因不同的观察员教练培训师 (OC/T) 作者而异,从而产生差距,使纵向分析变得困难。从这个意义上说,陆军每个月都会在训练中心的桌面上留下资金。
在国家训练中心作战小组和陆军部总部的支持下,我们审查了 500 多份轮换文件,以手动构建一个探索性数据集。该数据集将营级部队对部队战斗(国家训练中心部队对部队训练的单一阶段)视为分析单位,它包括其中的 50 多场战斗。它包括 OC/T 在“推出卡”中捕获的大量单位特征数据以及战斗期间的单位表现,从 OC/T 观察到的每日车辆战备率到杀伤率,再到主观 OC/T 评估,例如“决定性行动 Big 12”分数。国家训练中心骑兵中队 OC/T 团队“Cobra”主动收集有关单位性能的相同定量数据,收集了足够长的时间,以构建足够大的数据集以进行多变量回归。因此,下面讨论的战斗是骑兵战斗。
二、用例1:测试就绪情况报告
战斗训练中心的数据可以帮助陆军检查部队战备报告是否真的与理论上的含义相同。例如,在月度报告中报告工作坦克百分比高于其他部队的装甲部队在国家训练中心的战斗中发现的维护问题是否较少?与其他部队相比,在月度报告中报告可部署人员百分比最高的部队是否能够可靠地将其编队的大部分部署到联合战备训练中心?在任务关键任务中以更高级别的训练熟练程度评估其部队的指挥官是否能取得最佳战场效果?
报告的战备情况可能与战斗训练中心测量的战备情况不同,原因有很多。这两种测量可能不是为了捕捉相同的现象。但是,即使有充分的理由说明一个单位的战备状态报告和在莫哈韦沙漠中观察到的战备状态存在系统性差异,陆军至少应该知道这种差异。我们将国家训练中心轮换绩效数据集与同一营在每次战斗前六个月的非机密月度战备报告输入配对。这些输入是每个营报告的人员部署率、最低月步调设备作战准备率、整体装备作战准备率以及评估的任务基本任务熟练度。
我们检查了这些战备报告组件是否与战斗训练中心轮换期间的理论对应物相关:部署到国家训练中心的部队分配人员的百分比、战斗过程中的平均步调设备作战准备率以及由 OC/T 衡量的单位绩效提供“决策行动大 12”分数。除其他潜在的自变量外,我们还研究了国家训练中心“推出卡”上捕获的部队领导经验。我们首先使用简单的成对相关检查数据,然后使用“快速数据建模”,主要是普通最小二乘法 (OLS) 多元回归。
我们发现,简单的成对相关性充其量表明,部队战备报告和部队绩效之间存在不均匀的相关性。轮换前月度报告中报告的部队装备战备情况与该部队在部队对部队战斗期间的整体装备作战准备率呈弱正相关,但与战斗期间的节奏设备性能无关。部队在轮换前报告的训练熟练度及其“决定性行动 Big 12”分数几乎完全不相关(系数为 -.009)。人员部署能力呈中等负相关(系数为 -.488),这意味着部队在轮换前报告的人员准备情况越多,其轮换的人员部署率就越低。这种初步发现——人员准备情况报告代表了它应该代表的相反情况——正是只有结构化数据才能可信地测试的那种洞察力。虽然我们的数据集太小,无法得出结论,但这一发现值得进一步研究。
线性回归结果(双变量和多变量)发现,战备报告组件与其在战斗训练中心的对应指标之间的统计显着相关性有限。他们至少提出了两个值得进一步调查的关键见解:领导者经验和设备健康状况似乎比任何其他单位特征对战场表现更重要。部队状态报告中描述的指挥军士长经验、中队指挥官经验和整体设备作战准备率与国家训练中心的较好表现呈正相关。
图 1:营领导自我报告的战斗经验与部队对部队表现之间的关系。
图 2:轮换前报告的船队健康状况与强制对力绩效之间的关系。
这些发现,如果可以用更多数据来复制,则表明一个单位所说的准备程度与陆军对该单位的期望之间存在重要关系(以及缺乏准备状态)。最好的准备报告可能不是单位状态报告,而是其领导的经验。如上所述,这里报告的调查结果是初步的,其有效性受到 56 场非独立战斗的小样本量的限制。当然,由于缺乏可用数据而没有捕捉到一些混杂因素——最重要的是敌方部队的强度,战斗训练中心的作战小组负责人通常会根据部队的熟练程度来改变这种强度。尽管如此,这些发现表明了可能的关系,更系统地收集的数据可以可靠地测试这些关系。
三、用例2:预测峰值致死率
如果战斗训练中心的数据可以帮助陆军预测哪些部队正在接近战备高峰期,从而为兵棋推演或实际部署提供信息,那会怎样?为了探索这种可能性,我们从诊断分析(“为什么发生了某件事”)转向预测分析(“将会发生什么”)并应用机器学习技术。我们测试了两种常见的机器学习模型类型,随机森林和梯度增强器,它们考虑了非线性关系。机器在没有人工参与的情况下拟合模型,这是人工智能的一种基本形式。
令我们惊讶的是,这两种类型的模型在应用于数据时都具有很强的预测性,随机森林模型的性能略好一些。它显著提高了之前线性回归模型的解释能力。下图说明了模型的预测与实际测试数据的比较。
图 3:为战斗训练中心数据提供的机器学习模型的性能。
虚线是“完美预测”线,模型的预测为黑色菱形。该模型约占变异的 50%,考虑到关于单位因子的测量值很少,这一点值得注意。由于数据集的大小较小,其泛化性受到限制,但对于如此小的数据集,模型的准确性令人惊讶。
这些结果证明了机器学习技术在预测战备方面的潜力。他们提出了一种方法,通过这种方法,兵棋推演设计师可以验证有关战备水平的假设,联合规划师可以确定哪些可用单位最适合实际任务,或者 OC/T 可以预测即将到来的训练受众可能遇到的问题。
四、用例3:减少培训事故
为什么有些部队比其他部队更容易遭受训练事故?一个常见的答案是文化。部队文化、气候和凝聚力的系统测量很难获得,但可以通过士兵调查来获取。第 4 步兵师第 1 斯特赖克旅战斗队已开始进行一项每两个月一次的匿名手机调查,以衡量有效部队文化和气候的七项指标。从广义上讲,这是衡量单位凝聚力的指标。“Ivy Raider 文化调查”收集了 2024 年 9 月至 2024 年 10 月期间 31 个连和炮台的 1,700 多名士兵的回复。它记录了 7 个数字文化可衡量对象和单位士气(1-10 李克特量表)的回复。这些报告有什么意义吗?
来自约翰逊堡联合战备训练中心的数据有助于我们辨别此类调查是否捕捉到任何有意义的内容。在约翰逊堡,作战小组通过其归类为事故的内容来衡量战斗纪律。这些包括负面事件,例如车辆事故、疏忽放电、设备丢失和违反交战规则。我们如何解释公司和电池之间的差异?
使用线性回归分析,我们发现连队和炮台级别更强的单位文化与该旅最近的联合战备训练中心轮换期间较少的负面事件之间存在相关性。轮换前公司和炮台文化的各种衡量标准与轮换期间的负面事件之间存在统计学上的显着关系(在具有完整数据的 21 个连和炮台中)。士兵的“发展”分数是最强的相关性,其次是“有效时间使用”分数。将所有文化可衡量分数相加的“文化指数”也与事故呈负相关。我们控制了单位类型,例如战斗、支援和总部。
图 4:部队的联合战备训练中心事件计数(违反交战演习规则)与 Ivy Raider 文化调查分数之间的关系。
对回归的解释表明,士兵的“发展”每增加一个百分点,负面事件就会减少 3%。同样,随着“有效时间使用”和“文化指数”分数增加 1%,轮换期间的事故下降了近 2%。这些结果表明,在模拟战斗环境中,更强的单位文化与更少的违纪事件相关。关键的见解是,投资于单位文化可能是改善士兵纪律的重点方法,有助于解决陆军的纪律差距。
五、关键注意事项和后续步骤
Narcissus 提醒我们,镜子凝视并非没有风险。绩效测量也不是。测量可能会消耗稀缺的 OC/T 带宽,从而降低训练价值。它可能会将陆军的注意力集中在垃圾措施上,从而导致陆军得出错误的结论。它可能会通过推动指挥官寻求好成绩而不是良好的训练来扭曲部队的行为。然而,这些风险要么比想象的要小,要么可以减轻到可接受的水平。
对 OC/T 带宽的担忧夸大了培训中心系统数据收集的成本,因为 OC/T 已经收集了几乎所有值得收集的数据。任何在轮换后收到 OC/T 带回家的数据包或在运营小组工作过的人都知道,运营小组一直在收集数据。问题不在于是否收集数据,而在于是否通过确保每个团队在每次轮换中至少收集一些度量值来保存系统化收集的内容,而不是分散、无法访问的幻灯片。这样做意味着提升要小得多。
但即使成本低,数据质量高吗?怀疑论者可能会说,战斗训练中心的杀伤力意义不大,因为仪表炮兵与实弹枪械不同。但杀伤力数据中的仪表问题就是数据科学家所说的噪声。事实是,很多有用的数据都有噪声。如果随机,噪声是可以的,而且很多噪声是可以的。为了避免垃圾措施,陆军必须谨慎选择它们,但仅凭噪声并不是避免收集的理由。
即使 OC/T 具有带宽并且选择的性能衡量标准是好的,收集是否如古德哈特定律所建议的那样,通过扭曲部队行为来破坏衡量标准?为了抢占古德哈特定律,陆军必须将测量与激励脱钩——清楚地向轮换单位传达收集的内容与他们的评估无关。使这种保证可信的一种方法是立即匿名化收集的数据。另一种方法是均匀地衡量不同作战职能的绩效,以便抵消压力相互抵消。第三种是选择尽可能接近陆军旨在捕捉的潜在现象的措施,例如 OC/T 观察到的车辆作战准备率。如果部队通过保持卡车运行来响应收集的地面作战准备率,而不是数字报告的准备率,那将是一件好事。
上述风险很重要,需要减轻,但并不是太大,以至于超过了系统地捕获结构化轮换数据的巨大未实现的好处。我们战斗训练中心的决定性行动轮换太有价值,也太昂贵了,不容忽视。正如戈尔曼在近五十年前所知道的那样,数据不仅代表了唯一的输入,而且对于任何试图在两次世界大战之间试图审视自己并辨别前进道路的军队来说都非常重要。
有个好消息。战斗训练中心的运营小组已经开始主动收集更多量化数据。联合武器中心的数据和人工智能办公室正在考虑将数据添加为战斗训练中心管理理念的支柱。陆军研究实验室是美国陆军作战能力和发展司令部的一部分,正在其 SUNet 飞地中为政府赞助的研究人员收集仪器化和带回家的数据包。
下一步是陆军通过修改其陆军条例 350-50 来编纂这一进展,以授权在所有战斗训练中心收集某些可信的匿名绩效指标。在该法规中规定联合武器中心控制和整合这些纵向数据,使其接近条令创新将是下一步。这些都是轻松的胜利,可确保陆军除了获得绝佳的训练机会外,还充分利用其最昂贵、最清晰的镜子。
乔恩·贝特 (Jon Bate) 中校是一名美国陆军步兵军官,目前在科罗拉多州卡森堡担任 2-23 IN、1/4 SBCT 的指挥官。他曾在第 101 空降师、第 1 装甲师服役,并在美国军事学院社会科学系担任经济学助理教授。他是高级战略规划和政策计划 (ASP3) 的 Goodpaster 学者,拥有哈佛肯尼迪学院的 MPP 和斯坦福大学的政治学博士学位。
【目录】
一、培训中心收集了什么?
二、用例1:测试就绪情况报告
三、用例2:预测峰值致死率
四、用例3:减少培训事故
五、关键注意事项和后续步骤
👇👇
1700+经典报告
均已上传至星球
请扫码登录下载
👇👇
及时收看更多精品译文
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...