分析操作是成功的数据科学的关键吗?

克里斯托弗·希尔曼
克里斯托弗·希尔曼
2017年8月31日 3分钟阅读

尽管数据科学技能持续短缺, 数据驱动的团队确实存在于许多行业的业务中. 人们对预测分析、规范分析的期望很高 人工智能 (人工智能)已经吸引了许多人的想象力. 既然这个角色, 数据科学的技能和职责正变得更加明确, 十大电子游艺平台首选如何采取下一步,并显示数据科学项目的真实投资回报(ROI)? 十大电子游艺平台首选怎样才能变得积极呢, 可衡量的收入改善, 利用数据科学实现利润和客户满意度?

答案可能在于生产过程的自动化. 为此,分析运维是数据科学中的一个新兴领域. 从软件工程中获取最佳实践,并使其适应以自动化的方式将预测模型推向生产的过程, 分析运维可以释放宝贵的数据科学资源,用于他们最擅长的工作:发现数据中的新模式, 改进现有的数据模型并构建新的数据模型, 更准确的.

为了建立和维护数百甚至数千个预测分析模型, 分析模型的操作需要一个工业规模上可重复的过程. 除了, 在生产系统中部署预测分析模型需要一个可靠的体系结构和健壮的管道.

在你的组织中,你需要的关键成分是:

  • 实验——鼓励快速创建原型
  • 灵活性——仔细选择您使用的工具包
  • 迭代——理想情况下,你在一个敏捷框架内工作
  • 专注于生产——团队中的每个人都致力于生产
  • 工艺工程-整合或创建新的生产程序
使用数据科学工作的分析运维方法,企业可以实现显著的生产率提高.

分析操作——从哪里开始?

创建正确的过程并选择最佳的软件工具来实现自动化是分析运维过程的关键. 下面的许多已经是软件工程环境中的标准实践, 但是这些标准和协议需要应用到业务日益依赖的数据模型的生产和开发中.

  • 与数据平台和操作环境紧密集成的协作开发环境允许代码重用和提高效率
  • 严格的版本控制, 用于标记当前生产中的型号,并允许在出现问题时快速回滚到以前的版本
  • 测试自动化,包括程序代码的单元测试和预测模型的准确性测试. 每个模型都应该以自动化的方式通过一组标准测试来运行
  • 将模型从开发(测试)推广到生产的标准化过程, 并将新车型与已经投产的车型进行比较
  • 训练有素的模型应该发布到一个中央存储库,在那里它们可以很容易地检索和比较
  • 中央日志记录和监控系统,以确保始终满足性能和准确性的kpi, 将表现不佳的模型标记为调查对象

分析运维是未来的趋势吗?

使用数据科学工作的分析运维方法,企业可以实现显著的生产率提高. 使用分析运维方法, 您可以告别在笔记本电脑上创建脚本的开发人员的低效日子了, 使用基于持续集成的方法手工维护生产代码, 不断向前发展.

集成和自动化可以为您的业务带来难以置信的好处. Think Big Analytics已经帮助许多客户提升了他们的分析之旅, 并且可以帮助过程工程和工具选择,使分析操作成为现实. 请十大电子游艺平台首选,看看十大电子游艺平台首选能为您做些什么. 了解更多.

关于克里斯托弗·希尔曼

Chris Hillman是Teradata国际高级分析团队的首席数据科学家. 总部位于伦敦的, 他在包括零售在内的许多行业拥有超过20年的分析工作经验, 金融, 电信和制造业. Chris参与了Analytics项目的售前和启动活动,帮助客户从高级分析和机器学习中获得价值和理解. 他曾在Teradata大会(如Universe and 合作伙伴)以及Strata等行业大会上就数据科学和分析发表演讲, Hadoop的世界, Flink Forward和IEEE大数据会议. 他的成就之一是作为分析艺术的创始人之一, 一个引人注目的可视化产品的程序,吸引人们, 同时保持稳固的商业主导基础.

通过以下方式查看所有帖子 克里斯托弗·希尔曼

保持了解

订阅十大电子游艺网站博客,以获得每周的见解



我同意Teradata公司, 作为本网站的供应商, 可能会偶尔向我发送关于产品的Teradata营销通信邮件, 数据分析, 还有活动和网络会议邀请. 我明白,我可以在任何时候通过跟踪我收到的任何电子邮件底部的取消订阅链接来取消订阅.

你的隐私很重要. 您的个人信息将根据本条例收集、存储和处理 Teradata全球隐私政策.

详见Teradata