谷歌的新云服务简化了机器学习的数据准备
数据科学家在运行机器学习工作负载时面临的挑战之一是在它准备好使用之前处理信息。谷歌公布了一个新的云服务,旨在缓解痛苦。
Google Cloud DataPrep将自动检测数据模式,加入和异常,例如缺失或重复值,而无需编码。之后,它将帮助用户构建一组用于处理信息的规则。然后将这些规则构建在Apache Streams格式中,并且可以导入Google“S Cloud DataFlow等产品,以便处理信息,因为它将其导入为BueQuery数据仓库服务等服务。
虽然Cloud DataPrep是为准备机器学习的数据而构建的,但系统也使用机器学习本身来确定对客户最有用的规则。截至周四,它在私人测试版中提供。
BigQuery也接收了许多增强功能,包括新的商业数据集计划,即现在在公共测试版中提供。它将让用户从AccuWeather,Dow Jones,Xignite,Housecanary和Remine中获取信息,并将其直接送入BigQuery以进行进一步处理。
BigQuery也可以查询存储在云Bigtable中的数据,Google的管理NoSQL数据库提供用于低延迟数据。这意味着用户可以编写一个SQL查询,可以从BigTable和BigQuery中挖掘信息。在过去,他们必须编写一个节目来搜索Bigtable。
广告客户将能够从Google Adwords,Doubleclick Campaign Manager,DoubleClick for Publishers的Doubleclick以及YouTube进入BigQuery的数据,以便在分析和其他大数据应用中使用。该功能可能有助于鼓励公司广告客户的舰队尝试谷歌的云,因为它面临亚马逊和微软。
谈到数据库新闻,该公司宣布其云SQL托管数据库提供现在为MySQL提供了对PostgreSQL的Beta支持。
所有新闻都被宣布为谷歌云的一部分,该公司的商业和企业在旧金山的企业会议。该公告与该公司云平台的其他新闻一起出现,包括对AppEngine的定制和支持定制和支持的更改。