COVID-19数据科学行动可以教会企业什么

通过合作进行创新的关键经验

虽然数据科学家不像重要工作人员那样站在疫情的前线, 他们仍然有一个关键的角色要扮演——甚至是一个公民的义务——去对抗它. 数据科学家可以将他们的专业知识应用于清洁, 集成, 建模, 并就数据进行交流,以阐明复杂的问题.

COVID数据科学能教给十大电子游艺平台首选什么

大流行期间的数据科学

数据科学正在兴起. 这不是第一次了, 当然:2008年和2016年是该学科的另一个辉煌的年份, 当公众对使用数据来预测十大电子游艺平台首选的集体命运产生兴趣时. (数据在一年后被证明在预测方面更有效——”民主党是如何赢得2008年的数据战争的“——但不是在另一个——”数据是如何在选举中失败的.” In 2020, 因为各国政府正在努力减缓COVID-19的传播, 公众已经更加敏锐地意识到数据科学对十大电子游艺平台首选所有人生活的影响.

随着对数据重要性的高度认识, 公众也看到了它的许多复杂性. 来自不同背景和学科的人们在社交媒体上张贴流行病学图表和“r - 0”曲线, 他们也陷入了关于这些数据的意义以及应该关注哪些模型的分歧中.

大数据科学家对这些讨论并不陌生, 哪些是长期以来在企业中经常发生的. 他们知道分歧是不可避免的,甚至对于开发更准确的模型是必要的, 只要这些讨论是合议的.

通过合作创新

Sarah Callaghan写道 在《 模式, “我想敦促所有希望帮助建模工作的数据科学家,不要只是简单地获取数据并将它们插入他们喜欢的分析软件. 结果可能是可怕的数字, 特别是在没有流行病学家必须将其置于背景的领域特定知识的情况下.”

卡拉汉鼓励数据科学家加入 挑战COVID-19开放研究数据集(CORD-19),白宫科技办公室 政策呼吁采取行动,解决COVID-19的高度优先问题. 她补充说,Kaggle挑战是一个机会,“十大电子游艺平台首选可以作为一个团队一起工作,发挥各自的优势。.”

对于那些在企业, 这样的合作倡议是了解什么因素导致一组人达成共识和可操作的答案的机会. 如果这种努力能够大规模地进行,以解决十大电子游艺平台首选这个世界在一个世纪里遇到的最棘手的问题之一, 在企业中创建有效的协作数据策略和计划是可行的.

以下是组织可以从COVID-19数据科学行动中学到的一些具体经验:

1. 收集所有数据

在组织的中心不断收集实时数据并不是一项简单的任务. 由于在爆发期间缺乏可用的测试,且依赖于手工收集和编码的数据, 用于吸收大量数据和数据类型多样性的基础设施和流程很重要. 不准确地收集数据会使你的模型产生偏差,并延迟收集足够多的样本进行分析的时间.

在企业中,分析所有的数据是至关重要的,而不仅仅是部分数据. 这一原则是十大电子游艺平台首选设计混合云数据分析软件十大电子游艺网站的动力,使其100%利用公司的数据. 十大电子游艺平台首选知道,这种级别的可见性将是企业领导人看到其他方式无法识别的联系的最佳方式.

2. 使数据开放和可访问

同一个企业中的组织和团队总是会保护他们的数据, 但当全球危机威胁到每个人的生命和生计时, 这种领土本能很快就会消失. 在关键业务项目上,如何鼓励类似级别的访问和协作, 即使没有全球性的流行病?

使数据可访问从治理开始, 除了确保完整性和安全性之外,哪一个应该做更多的事情. 治理必须作为更广泛的数据分析管理策略的一部分进行开发. 考虑创建一个分层的数据体系结构,允许您保持对元数据的控制, 比如业务规则和定义标准, 同时还可以让您的人员以敏捷的方式访问数据. 你可以敞开心扉, 向技术数据科学家提供非结构化数据集, 例如, 但是要为业务分析人员创建更结构化和自动化的接口. 这两个角色仍将拥有他们需要的自主权,以处理相同的数据和发现见解, 而您的数据安全和完整性将保持完整.

3. 鼓励社区反馈和分享

尽管Kaggle的CORD-19挑战赛的参与者正在为奖金而竞争, 他们仍然公开 讨论 其他人在开发数据科学项目时可能会发现有用的工具和方法. Kaggle的参与者还定期向组织者提交反馈意见,让挑战更顺利地进行.

企业可以通过创造一种持续学习的文化来创建同样水平的社区和支持, 分享想法和跨职能工作在哪里得到奖励. 在Teradata, 十大电子游艺平台首选有一个叫做Transcend的平台,它对十大电子游艺平台首选的协作学习文化做出了重大贡献. 十大电子游艺平台首选的员工使用Transcend安全地试验十大电子游艺平台首选自己的企业数据,并查看其他团队在为客户的需求优化十大电子游艺平台首选的产品和服务的共同努力中做了哪些尝试.

4. 集成和共享数据,邀请发现

在帮助社区找到答案的道路上,将数据置于背景中是至关重要的一步. 约翰霍普金斯大学的工程师们在疫情爆发初期就明白这一点,当时他们建造了广泛传播的病毒 COVID-19全球地图 显示世界各地的实时病例数据.

将数据按其规模或与其他熟悉的锚值进行比较,可以揭示数据孤立时永远无法揭示的答案. 这就是为什么集成数据集和类型,并为数据科学家提供可视化和交流数据上下文的工具是如此重要. 这是通过提供这个背景,通常是通过 数据可视化 一看就明白了, 这些数据科学家帮助公众了解病毒的威胁,并采取行动减缓其传播.

数据科学家的责任

虽然数据科学家不像重要工作人员那样站在疫情的前线, 他们仍然有一个关键的角色要扮演——甚至是一个公民的义务——去对抗它. 数据科学家可以将他们的专业知识应用于清洁, 集成, 建模, 并就数据进行交流,以阐明复杂的问题. 当数据是主要的症结所在时(而且经常是), 数据科学家可以消除理解的障碍.

企业领导人, 反过来, 有责任清除组织中任何能够从数据中找到答案的人的障碍吗. 对于一个学习文化蓬勃发展的公司来说, 当路径被清除以产生有意义的差异时, 很多人经常这样做.

好奇十大电子游艺网站如何鼓励创新?