Airbnb开放来源数据 - 科学共享平台
大多数组织都有很好的审查和共享计算机代码程序。但数据分析怎么样?
重要调查结果通常在“一个混合的演示文稿,电子邮件和谷歌文档”中持有Airbnb的工程和数据科学团队的两名成员在2月份博客。当组织中的某人想要找到和使用现有的工作时,他们通常必须追踪更新的代码和浪费时间检查并再现早期结果。然后他们通过演示,电子邮件或Google Doc,延伸周期“LL通常分发自己的调查结果”。“
在考虑如何解决这个问题的各种想法之后,Airbnb创建了一个内部知识回购,结合了Git版本控制和Markdown模板来报告结果。Airbnb最近开辟了知识存储库测试版,寻求贡献者帮助前进的项目。
Git允许同样的对等审查和版本控制,该版本控制器通常用于在代码上协作,而Markdown在单个,易于可重复的文件中提供文本和代码的混合。您可以看到RStudio的教程在R Markdown中获取更多信息,以获取一般可以做的Markdown的更多信息。Markdown适用于Python等其他语言。
Airbnb Framework设置需要Python并以多种格式支持“知识帖子”。
“帖子是用Jupyter笔记本,Rarkndown文件或纯粹的标记编写的,但所有文件(包括查询文件和其他脚本)都已提交。每个文件都以少量的结构化元数据开始,包括作者,标签和TLDR,“根据中柱,Airbnb的缩放知识。“Python脚本验证内容并将帖子转换为具有Markdown语法的纯文本。我们使用GitHub的Pull请求系统进行审阅过程。最后,有一个烧瓶网站应用程序,使repo的内容作为内部博客,按时间,主题或内容组织。
“它为”知识帖子“提供了各种数据商店(和实用程序),用于”知识帖子“,特别关注笔记本电脑(R Markdown和Jupyter / IPython Notebook)以更好地促进可重复的研究,”根据GitHub存储库。“知识存储库是一项正在进行的工作。有许多代码清理和特征扩展TBD。您的帮助和参与不仅仅是鼓励。“
- · Airbnb开放来源数据 - 科学共享平台
- · 遗产锁定和缺乏技能妨碍公共部门云采用
- · Gartner:A.I.成为最高商业投资优先事项
- · 新的Windows代码注入方法可以让恶意软件绕过检测
- · 惠普的电源包装Z2迷你桌面占用Apple的老化Mac Mini
- · 与IBM的Watson,GlaxosMithkline解决Sniffle和咳嗽问题
- · 易于开发的生根缺陷将Linux计算机置于风险
- · Deloitte赞助有助于Bletchley Cyber School的进步
- · 在欺诈击中20,000个账户后,英国银行暂停在线支付
- · 公共部门IT供应商的需求清晰度超过G-Cloud 10发布日期