企鹅极客丨元数据管理

发表时间:2021-07-29 17:30作者:未名企鹅


“数据之于本世纪,就像石油之于上世纪:它是发展和改变的动力。数据已经产生了新的基础设施、商业领域、垄断机构、政治理论, 最关键的是,还产生了一种新经济。数据信息不像过去的其他资源, 它采用不同的方式提取、加工、估值和交易。它改变了市场规则,要求使用新的管理方式。”


在处理数据时,各个租户的数据存在差异性,每家租户相同类型的数据,但字段各不相同,比如产品信息,a租户中有品牌信息,b租户中没有品牌信息,但有产品线的概念,如果使用同一个数据结构存储各租户信息,那么随着租户越来越多,这个表的字段信息也会越来越多,数据也不好维护,如果使用租户分表存储,每个租户都要维护自己的表结构,时间久了维护起来也很麻烦,我们可以把各租户的不同的字段信息存储起来,查询及处理数据时使用这份配置信息,这份配置信息就是元数据。

元数据(Metadata)就是描述数据的数据


举几个简单例子:

如果一本书是一个“数据",那么它的书名、封面、出版社、作者、总页码就是它的“元数据”。

如果一个电影是一个“数据”,那么它的总时长、制作人、总导演、演员列表就是它的“元数据”。

如果数据库中某个表是一个”数据”,那么它的列名、列类型、列长度、表注释就是它的"元数据"。

只要有一类"事物",就可以定义它的“元数据”。

元数据管理的作用


理解了元数据的概念后,我们发现元数据有很多、很杂乱,也不知道怎么用,此时我们需要做元数据的管理。元数据管理是指通过计划、实施和控制活动,以实现轻松访问高质量的整合的元数据。


通过元数据管理,将帮助企业人员清晰的看到企业有哪些数据,分别存放在什么位置,同时帮助理清企业的数据字典,快速查询和定位数据;通过对数据的上下文关联信息,提升战略信息的价值,从而帮助分析人员做出更有效的决策;通过对数据的上下文背景、历史和起源进行完整的记录并文档化,帮助了解数据的流转流程,从而减少培训成本,降低员工流失的影响;在变更管理过程中的不同层面上进行更好的影响分析,降低项目失败风险;识别并减少冗余数据和流程,减少重复工作和对冗余、过期、不正确数据的试用;为企业的数据治理、数据应用、数据服务打好基础。


元数据管理的内容可以从以下六个角度进行概括:

  • “向前看”: “我”是谁加工出来的;


  • “向后看”:“我”又支持了谁的加工;


  • “看历史”: 过去的“我”长什么样子;


  • “看本体”:“我”的定义和格式是什么;


  • “向上 看”:“我”的父节点是谁;


  • “向下看”:“我”的子节点是谁。



元数据管理是数据资产管理的重要基础,是为获得高质量的、整合的元数据而进行的规划、实施与控制行为。

欢迎有需求的药企朋友们交流

如果您对未名企鹅的相关产品感兴趣,欢迎关注未名企鹅公众号,或者点击文末左下角“阅读原文”给我们留言提出您的需求建议。


关于未名企鹅
     
未名企鹅以“连接健康”为使命,致力于提供生命健康领域的大数据产品和解决方案,帮助客户实现数据驱动的业务增长。

未名企鹅中的“未名”代表北大,寓意人文精神,生命健康领域正是体现人文关怀的产业;“企鹅”象征科技,未名企鹅的创始团队毕业于北大,技术力量来自腾讯,公司以未名企鹅命名是希望以人文情怀加上科技力量来推动生命科学行业数字化发展。

未名企鹅 丨 增长,由此而来!

分享到: