数据准备是数据管理中最耗时的领域。
它也是昂贵的。
 
据《信息周刊》报道,“调查显示,绝大多数时间都花在了这项重复性的工作上,一些人估计,这项工作占用了数据专家80%的时间。”
Trifacta的一份研究报告指出,过度依赖IT资源进行数据准备会让企业付出数十亿美元的代价。
 
收集数据的能力可以有多种形式,但在世界各地的IT商店中,最常见的是电子表格,或者更确切地说,电子表格的集合通常有成百上千个。
 
大多数组织,特别是那些在数字经济中竞争的组织,没有足够的时间和金钱来使用手工流程进行数据管理。
外包也很昂贵,不可避免地会出现延迟,因为这些供应商也依赖于手工流程。
数据准备是数据管理中最耗时的领域。
它也是昂贵的。
 
据《信息周刊》报道,“调查显示,绝大多数时间都花在了这项重复性的工作上,一些人估计,这项工作占用了数据专家80%的时间。”
Trifacta的一份研究报告指出,过度依赖IT资源进行数据准备会让企业付出数十亿美元的代价。
 
收集数据的能力可以有多种形式,但在世界各地的IT商店中,最常见的是电子表格,或者更确切地说,电子表格的集合通常有成百上千个。
 
大多数组织,特别是那些在数字经济中竞争的组织,没有足够的时间和金钱来使用手工流程进行数据管理。
外包也很昂贵,不可避免地会出现延迟,因为这些供应商也依赖于手工流程。

花费时间和精力准备数据:自动化数据准备/数据映射的10个理由

1. 治理和基础设施

数据治理和强大的IT基础架构在数据的评估,创建,存储,使用,归档和删除中至关重要。 除了知道数据来自何处以及是否可信任的简单能力之外,还有一个法定报告和合规性要素,通常需要了解相同数据(已知或未知,受治理与否)的变化情况 随着时间的推移。
 
一个允许数据沿袭,影响分析,完整历史记录捕获和其他数据管理功能等洞察的设计平台可以提供一个中心枢纽,从中可以学习和发现有关数据的所有内容 - 无论是数据湖,数据库,还是 传统的仓库。

2. 消除人为错误

在传统的数据管理组织中,excel电子表格用于管理传入的数据设计,或称为“pre-ETL”映射文档 - 这不会带来任何可见性或可审计性。事实上,这些“映射文档”中表示的每个工作单元在整个系统开发生命周期中成为一个独立的变量,因此几乎不可能从更少的标准化中学习。
 
在任何练习中创造准确性和完整性的关键是消除人为错误的机会 - 这并不意味着从过程中消除人类,而是结合正确的工具来减少错误的可能性,因为人类将他们的思维过程应用于工作。

3. 完整性

能够从各种来源和格式进行扫描和导入,以及自动更改跟踪,这意味着您始终可以从任何位置导入数据,并跟踪该数据随时间的所有更改。

4. 适应性

集中设计,直接沿袭和影响分析以及更改活动记录意味着您可以随时获得答案,或者只需单击几下即可。可以通过预定义模板识别和生成数据子集,从标准映射文档生成通用设计,并通过ETL过程推送,以通过自动化模板更快地处理。

5. 准确性

开箱即用的功能可将您的数据从源映射到报表,快速进行协调和验证,内置可审计性和可追溯性。构建一整套验证规则,可以使用集中式存储库中的设计映射进行交叉检查。

6. 合时

敏捷性和反应性的能力是很重要的——擅长反应性听起来不像是一种值得表扬的品质,但对于监管要求来说,这是至关重要的。

7. 全面性

访问所有底层元数据、源到报表设计映射、源和目标存储库,您就能够在报表层中创建具有可跟踪来源的报表,并且可以轻松地向IT、业务和监管涉众解释这些报表。

8. 明晰

这些需求通知了设计,设计平台将这些需求付诸行动,报告结构通过几乎任何报告平台(无论是主流商业平台还是本土平台)在正确的时间提供正确的数据,以创建正确的信息。

9. 频率

适应是满足任何频率间隔的关键。集中式设计,自动ETL模式为数据库模式和报告结构提供支持,可以在使用传统方法的一半时间内进行周期性变更。超出电子表格,启用基于模式的ETL和模式填充是确保您做好准备的方法,以便在需要时显示变更过程的审计跟踪并清楚地阐明谁在系统开发生命周期中做了什么以及何时做了什么。

10. 商务型

旨在实现业务友好的用户界面意味着无需成为数据集成专家来审查整个工具中概述的“被动执行”的常见实践。一旦定义了流程,实施了规则并建立了模板,就几乎没有机会出错或偏离整个流程。各种基于角色的安全选项意味着每个人都可以协作,学习和审计,同时保持底层流程组件的完整性。
 
用更少的人进行更快速、更准确的分析
如果您能够以更快的速度获得更准确的数据准备并且使用更少的人将分析翻倍,该怎么办?
 
erwin Mapping Manager(MM)是一种专利解决方案,可在整个企业数据集成生命周期中实现数据映射自动化,提供数据可见性,沿袭和治理 - 释放数据专业人员80%的时间来使数据发挥作用。
 
通过erwin MM,数据集成工程师可以设计和反向设计作为ETL / ELT操作和存储过程实现的数据移动,构建源数据资产和目标数据资产之间的映射,并设计它们之间的转换逻辑。然后,这些设计可以导出到大多数ETL和数据资产技术中以供实施。
 
erwin MM是100%元数据驱动的,用于定义和推动企业集成项目的标准,支持数据和流程审计,提高数据质量,简化下游工作流程,提高生产力(特别是在地理位置分散的团队中),并为项目团队提供IT领导和管理层对集成和ETL迁移项目的“真实”状态的可视性。