什么是大数据?

大数据的定义

根据维基百科, 大数据 “这是一个包罗一切的术语,指的是任何庞大或复杂的数据集集合,以至于使用传统的数据处理应用程序难以处理它们吗?.“在Teradata,大数据经常被描述为几个”Vs”——体积, 各种, 速度, 可变性, 准确性——这总体上反映了收集信息的复杂性和难度, 存储, 管理, 分析和运用大数据来创造最重要的“V”, 价值. 在当今高风险的商业环境中, 领先企业——差异化的企业, 跑赢大盘, 并比竞争对手更快地适应客户需求——依赖 大数据分析. 他们看到的是多么有目的性, 系统开发大数据, 再加上分析, 揭示获得更好业务成果的机会.

对于成熟的组织,大数据分析与 人工智能(AI) 和/或 机器学习 正在帮助解决更复杂的业务挑战:

客户体验: 以客户为中心,优化客户之旅,找到竞争优势

金融转型: 提供新的企业价值和战略输入 金融 和会计流程

产品创新: 创造和迭代更安全、更有需求、更有利可图的产品

降低风险: 将财务欺诈的风险降到最低 网络安全 风险

资产优化: 优化资产价值杠杆 物联网 和传感器数据

卓越运营: 利用人员、设备和其他资源达到最佳绩效价值

如何让大数据发挥作用

大数据通常被定义为太大、太复杂、无法用标准工具操作或查询的数据集. 即使是那些完全致力于大数据的公司, 已经定义了商业案例并准备好在“科学项目”阶段之外成熟的公司, 必须弄清楚如何让大数据发挥作用.

大规模的宣传, 大数据技术选择和供应商的范围也令人费解, 这让找到正确答案变得更加困难. 十大电子游艺平台首选的目标必须是设计和构建一个低成本、低复杂度的底层大数据环境. 这是稳定的, 高度集成的, 并且具有足够的可伸缩性,可以将整个组织推向真正的数据和分析中心. 数据与分析中心是一种状态,在这种状态下,大数据和大数据分析的力量可以提供给需要它们的组织的所有部分. 底层的基础设施, 发现有价值的见解所需的数据流和用户工具集, 做出更好的决策,解决实际的业务问题.

大数据作为引擎

开始使用大数据需要把大数据当作引擎. 来提高性能, 这是一个将正确的组件组装成无缝组件的问题, 稳定可持续的方式. 这些组件包括:

数据来源: 操作和功能系统、机器日志和传感器、Web和社会等许多资源.

数据平台、仓库和发现平台: 可以捕获和管理数据, 然后——关键的是——转化为对客户的洞察和, 最终, 行动.

大数据分析工具和应用程序: 高管们使用的“前端”, 分析师, 经理和其他人访问客户的见解, 模型的场景, 或者做他们的工作,管理公司.

在这个级别, 它是关于充分利用和利用大数据资产来创造业务价值. 要让所有的数据协同工作,需要一个战略性的大数据设计和深思熟虑的大数据架构,不仅要检查当前的数据流和存储库, 但也考虑到具体的商业目标和长期市场趋势. 换句话说,让大数据发挥作用并没有一个单一的模板.

鉴于未来大数据只会变得更加重要, 这些基础设施应被视为未来行动的基础. 所以,是的,资本支出可能会很大. 然而, 许多有远见的组织和大数据的早期采用者都得出了一个令人惊讶的结论——有些违反直觉——设计正确的大数据环境可以节约成本. 说到惊喜:这些节省下来的成本可能是令人愉快的,而且相对很快就能收获.

需要注意的是,使用灵活的框架, 大数据技术和程序可以支持企业的多个部分,并改善整个业务的运营. 否则, 即使是先进和雄心勃勃的大数据项目,最终也可能成为搁浅的投资项目,这是一个切实存在的风险. 高德纳公司估计,90%的大数据项目都在企业内部得到利用或复制. 未来的大数据赢家就在今天这10%的市场中,而且很久以前就不再往小处想了.

高效大数据环境的属性

无缝使用数据集: 大部分收益来自于混合, 对数据集进行组合和对比——因此,没有整合就没有分析创新.

灵活、低成本: 这里的目标是低复杂度和低成本, 有足够的灵活性来适应未来的需求, 哪个更大规模,更针对特定的用户群体.

稳定: 稳定性至关重要,因为 数据量 是海量的,用户需要轻松访问和与数据交互. 在这个意义上, 基础设施性能是通过大数据提高业务性能的关键.

大数据整合:最重要的变量

有限的可重用性在很大程度上是糟糕集成的一种功能. 事实上,整合可能是大数据成功方程式中最重要的变量.

Forrester Research曾写道,大数据80%的价值来自整合. 大数据的整体理念是,价值最高的大数据能够被合适的用户轻易获取, 以及健壮且清晰定义的业务规则和治理结构. 更深层次的数据集——遗留的事务数据和长尾客户历史记录——可能只需要可靠的存储和健壮的数据管理, 因此,数据科学家和数据探索者可以在有意义的时候对其进行审查和建模.

大数据整合也需要大思维. 在这种情况下,“大”意味着整体的、包容的和多维的. 点必须连接起来, 数据孤岛架起了桥梁, 功能筒仓相互连接(如果没有完全分解的话).

高度整合. 设计良好的生态系统. 统一 体系结构. 以数据和分析为中心. 这份简短的清单并不一定需要让大数据程序发挥作用的所有组件或技术细节. 但这些都是确保大数据程序有效运行的关键因素.