IBM,Cloudera加入Rstudio以创建R接口到Apache Spark
2021-07-23 13:46:02 [来源]:
R用户现在可以使用流行的Dloptr包来点击Apache Spark Big数据。
根据Rstudio,新的Sparklyr包是火花的本机Dplyr接口。根据RStudio博客文章,用户可以“使用DOLER和SQL(通过DBI)以及”过滤器和聚合火花数据集以“交互式操作火花数据”,然后将它们带入R以进行分析和可视化。“还可以访问Spark分布式机器学习算法。
根据Sparkly部署文档,连接到本地火花群将在下面的代码中查找类似:
库(Sparklyr)SC < - Spark_Connect(Master =“Spark://本地:7077”)而且,使用Sparklyr运行SQL可能如下所示:
库(DBI)IRIS_PREVIEW < - dbgetQuery(SC,“选择*从IRIS限制10”)
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。