什么是元数据?

元数据是在结构化中描述其他数据的数据, 一致的方式, 这样就可以收集大量的数据, 存储, 随着时间的推移进行分析.

存储需要元数据 大数据 in 数据仓库 便于检索和管理. 数据仓库使用 结构化数据 这是标准化的, 清洗 并且跨数据源保持一致. 元数据确保了数据收集和存储的一致性, 所以企业主和 数据分析师 是否能够轻松地访问数据并从中获得见解.

有效的元数据管理是稳固和灵活的大数据“生态系统”的重要组成部分,因为它可以帮助企业更有效地管理他们的数据资产,并让数据科学家和其他分析师可以使用它们.

元数据的例子

例如,您可能在数据库中有一个类似于联系人的对象. 您将使用元数据来描述为该联系人收集的数据, 如乔·史密斯(姓名), ABC有限公司. (公司),123456-7890(电话号码). 这使得在数据库中搜索符合搜索条件的联系人变得更加容易.g.在ABC公司工作的所有联系人.).

当你用手机拍照时,你的移动设备会将元数据附加到照片上.g.、日期及时间、档案大小、图像尺寸). 社交媒体允许你在照片中标记人物和地点,这就增加了更多的元数据. 回到你的照片存档,按日期搜索照片是很有用的, 位置, 或人.