监控数据处理
HPE OBR 提供工作流框架,可支持提取原始数据,对这些数据运行协调和汇总例程,然后将其加载到数据存储。内容包包含预定义的工作流,这些作业流会在安装内容包时加载到框架中。作业流由多个作业步骤组成,这些作业步骤由工作流框架处理。
工作流框架根据内容包中定义的元数据集中组织和管理每个作业流各个步骤的流程和执行。
下图说明了示例 HPE OBR 作业流的执行流程。
在此示例中,作业流开始于数据收集,结束于度量聚合。所有步骤都依赖于前面的步骤;因此,如果有一个步骤失败,工作流框架将阻止作业流成功完成。只有当前作业流成功完成之后,工作流框架才会加载下一个要执行的作业流。
使用工作流框架可执行以下操作:
- 监控工作流的执行状况。
- 控制将数据转移到数据存储库的进程。
了解工作流作业流的执行状况成为监控 HPE OBR 数据库操作状态时最重要的任务。
了解作业流状态
为了帮助您了解“数据处理状态”页面上显示的信息以及作业流状况和状态之间的关系,提供了三个可能的作业流方案。
单击以下幻灯片阅读方案。
方案 1
请查看下面的示例作业流。
此作业流包含九个作业步骤。所有作业步骤都已成功完成(以绿色表示)。在“步骤状态(已完成/总数)”列中,此流的值将是 9/9,因为有九个步骤并且所有步骤都已完成执行。“步骤状态”列显示
指标,因为所有作业步骤都已成功完成。因此,作业流的状态为“正常”。
要了解特定作业步骤(如 DataLoad_FileSystem)的状况和状态,必须单击该作业步骤图标。此时将弹出一个窗口,显示作业步骤详细信息,其中包括步骤的状况和状态。对于 DataLoad_FileSystem 作业步骤,其状况将是“已完成”,而状态则是“成功”。此作业流将不再是活动的,并且会移动到此页面的“历史流”部分。下面介绍其他方案。
方案 2
请查看下面的示例作业流。
此作业流包含 13 个作业步骤。在“步骤状态(已完成/总数)”列中,此流的值将是 9/13,因为只完成了九个步骤。第 10 个步骤 Aggregate_Daily_Kernel 当前正在运行,以蓝色表示。但是,“步骤状态”列显示
指标。这是因为 Aggregate_Daily_Kernel 步骤之前的所有作业步骤都已成功完成。
作业流状态是根据当前正在运行的步骤(在此例中为 Aggregate_Daily_Kernel 步骤)之前的所有作业步骤的状态来计算的。因此,作业流的总体状态为“正常”,因为 Aggregate_Daily_Kernel 之前的所有作业步骤都已成功完成。
Aggregate_Daily_Kernel 步骤的状况为“正在运行”,而其状态是“等待”。以灰色表示的剩余三个作业步骤的状况和状态将是“等待”,因为这三个作业步骤只有在 Aggregate_Daily_Kernel 完成后才会开始。
方案 3
请查看下面的示例作业流。
此作业流包含 7 个作业步骤。在“步骤状态(已完成/总数)”列中,此流的值将是 4/7。但是,“步骤状态”列显示
指标,因为 DataLoad_Software 作业步骤未能完成。解决失败的作业步骤之前,仍会继续阻止剩余步骤的执行。因此,此流中只有 4 个作业步骤完成。
工作流框架将基于为此作业流定义的重试次数重新尝试运行失败的作业步骤。用完所有重试次数之后,作业流将被阻塞。该作业流将处于“错误”状态。DataLoad_Software 作业步骤的状况将是“已完成”,而其状态将是“错误”或“超过最长执行时间”。
如果 Reconcile_Data 图标变成黄色,则表示 Reconcile_Data 作业步骤已完成,但存在警告。但是,这不会阻塞作业流,而且您会发现 Stage_Data 作业步骤已成功完成。Reconcile_Data 作业步骤的状况将是“已完成”,而其状态将是“警告”。
监控作业流详细信息
HPE OBR 提供了监控每个已安装内容包的作业流执行情况的相应方式。管理控制台的“数据处理状态”页面在以下三个选项卡下显示关于流的信息:
- 流详细信息 - 此选项卡显示关于当前运行的活动流的状态信息。还可以查看作业流步骤的执行流程。
- 历史流概要 - 此选项卡显示已完成但却出现错误或警告的作业流数和状态。因为处于警告或错误状况而被用户中断的作业流也出现在此选项卡上。
- 历史流详细信息 - 此选项卡以图形方式显示作业流在某时间段的执行期间出现错误和警告状态的数量趋势。
通过“数据处理状态”页面,可监控活动作业流的执行情况;如果执行失败,还可排解任何问题。此外,可对某时段内的流执行趋势分析,以确定失败的原因。在此页面中,可执行以下数据流监控任务: