GlaxosMithKline R&D使用Hadoop创建数据平台,以获得科学数据的内部共享
WorldPay说,区块链技术缺乏足够的用例违反造型案件
雀巢尼斯不需要的移动应用程序在芽中蔓延
基于电子邮件的网络攻击收集动量
需要准备网络攻击警告突出显示
最近的恶意软件攻击波兰银行与更广泛的黑客攻击竞选活动
市长Khan竞标将伦敦成为世界上最聪明的城市
思科的火花板看起来像iPad - 像一个一样
医疗公司将VTAX和SAN睡眠睡眠以节省30万英镑的规模
银河系注释7火灾后面的原因也不令人惊讶
网络罪犯使用假域名到诈骗业务
英国科技公司增加出口超过20%
微软的自定义语音识别服务点击公共测试版
2018年蓝宝石“智能企业”的SAP银行
作为总理推出Brexit计划,Techuk呼吁交易服务
最近的WordPress漏洞用于挫败150万页
Pipenv项目承诺包装Panacea for Python
CNET培训呼吁数据中心缺少技能短缺研究
欧盟网络安全机构承诺合作
在世界上最大的BUG赏金计划之一内
iOS的Outlook加速了第三方加入INS的工作
印度尼西亚在AI采用中引领东盟地区
Max Schrems的Noyb启动了GDPR行动
Windows 10 Beta Build 15002带来了真正的改进
汇丰银行将人形放在纽约分公司
科技群体为FISA监视争夺战
Micron首先以QLC闪存驱动器5210 QLC SSD推出市场
云销售充气了微软的强劲增长
欧洲网络攻击2018年第一季度近三分之一
研究人员说,安全供应商需要与社区进行互动
Mozilla在四周内钉火萤火虫的NPAPI棺材
近30%的LGBT +年轻人选择避免茎职业
ICO补助计划推出第二轮资金
GreenPeace宣布其关于云环境影响的最新报告
安全专家在GDPR检查表上重量
澳大利亚能源部门陷入了安全捕获-22
Apple加入无线电力联盟,充电iPhone 8谣言
5G频谱蹲便器以1000万美元的价格结束
世界上最大的太阳能农场包含250万太阳能模块
英国金融电气行业担心Brexit诱导人才挤压
惠普召回101,000款用于火灾危险的笔记本电池
Win10更新KB 3213986,KB 3210721具有多用户问题
在系统中断后,美国约有150个三角洲航班
Apple,Microsoft和Amazon提供更公平的云存储交易
欧洲立法者辩论自动车辆的机器人权利
三星碎片覆盆子PI 3竞争对手,收缩ARIK线
旧网络可以蹒跚地努力
Dell EMC将HyperConvergecence,云结合在最新的VxRail产品中
APAC组织可能从网络攻击中减掉1.75TN
Tech Luminaries队以2700万美元的价格组成。伦理基金
您的位置:首页 >科技 > 消费电子 >

GlaxosMithKline R&D使用Hadoop创建数据平台,以获得科学数据的内部共享

2021-08-06 15:44:17 [来源]:

Pharmaceuticals公司Glaxosmithkline(GSK)通过计划改善了其研发(研发)能力,以通过在研发部门开发药物的发展来实现DALAGENENTATED。

2015年,GSK探讨了一个数据策略,解决了分享数据所面临的挑战。GSK的研发运营中有约10,000名科学家,但它们之间的药物发展和试验的数据很少。

在现在三年的数据策略之前,来自药物试验和实验的所有数据都有不同的格式并储存在不同的地方,称为2015年GSK的研发业务的首席数据官员。

他说,过去的传统数据仓库已经完成了一些工作,并尝试使用Oracle和Teradata等技术进行结构和组织数据。“但我们真正寻找的东西是在更广泛的规模上解决问题的事情,”Ramsey说。

“制药公司生产大量数据,但它是在垂直筒仓中产生的,”他说。“例如,在发现中,存在有生产的实验数据,用于进展新药,但实际上并没有真正在研发组织中分享该信息的能力,并利用该信息的聚合的权力更好决定。”

GSK认识到这是一个约束,因此招聘Ramsey作为首席数据官员,以定义数据战略ross的研发操作,所以信息可以用作战略资产,而不是仅供运营。

他通过确定该部门在数据使用方面的境地开始。“我最初在整个研发人口中进行了一项调查,其中包括竞争来自麻省理工学院的数据,衡量数据成熟度,并获得了非常高的回应率,”他说。

“一般来说,反馈确认了人们可以访问他们自己创造的数据但不能真正分享的假设。”

在创建综合信息平台方面,他评估了这一点,并发现了一个综合信息平台,发现R&D的重点努力分享数据,并且该技术所需的技术未到位。

当组织正在发展药物时,科学家们做实验。所以你有数千名科学家们在尝试确定它是否成功时进行实验。但在GSK,他们都在完成这些实验,基于inpidual计划。“将所有这些实验都在一起,”Ramsey说。

“在开始实验之前,他们可以分析已经完成的所有类似实验并从中获得了洞察力。最糟糕的情况是有人做了一个已经完成的实验,“他说。

组织套锁大量临床试验。这些是用某些重点的结果完成,这是强名主义者试图实现的 - 他们将实现与否。“但如果你没有把所有的临床试验放在一起,你会失去该汇总知识的价值。”

该组织决定将Hadoop作为基础,使其能够以正确的格式将信息从不同的操作源从不同的格式中提升,因此可以开始策划和合理化。Hadoop是用于存储结构化和非结构化数据的开源软件。

公司必须从头开始。“我们建立了一个新的平台,因为这项技术之前没有在GSK上使用过,”Ramsey说。

它综合了许多其他技术,将数据带入平台并合理化。

Hesaid这个项目永远不会真正结束,因为数据团队不断炼制的东西并找到新的用例。大多数作品在GSK的全球中心完成了内部,没有传统的系统集成器关系,但它确实在AcaileSuch中作为数据科学和分析的一些较小专家工作。

为此,GSK建立了大约十几个小型软件供应商的生态系统来支持平台。这包括加利福尼亚的启动水线数据,例如,提供元数据存储库技术。这确保了一旦数据在平台中,GSK可以搜索并查看信息存在的位置,谁在过去使用它。

GSK还在考虑使用超级计算技术开发新药的人工智能(AI)。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。