大数据的开源解决方案

导读 成本、灵活性和训练有素的人员是开源热潮的主要原因。Hadoop、R和NoS QL现在是许多企业大数据战略的支撑支柱,无论是管理非结构化数据还是...

成本、灵活性和训练有素的人员是开源热潮的主要原因。Hadoop、R和NoS QL现在是许多企业大数据战略的支撑支柱,无论是管理非结构化数据还是对其进行复杂的统计分析。

Revolution Analytics市场及社区副总裁大卫·史密斯(David Smith)表示,该公司是一家位于大数据巨头之间的小公司,专门为不同的业务流程修改R。“特别是,”他说,“我们让它运行在真正的大数据集中。

“如果它是开源的,你可以挖掘出来,看看为什么我得到这些结果,为什么这些结果是最佳的,”Ahamad说。

他补充道,专有的数据分析软件大部分时间都能正常工作。但是,当一个“不寻常的场景”出现时,你将无法信任你的结果。他说:“他们会远离你正在寻找的东西。“这是一个非常可怕的情况”。

毫不奇怪,具有统计建模背景的最聪明的头脑也处于最高需求,特别是因为其他部门的组织,如金融机构,正在挖掘它们。

肯斯说,在某种程度上,SAS确实将开源社区视为它需要跟上的竞争对手。新技术可以很快在开源环境中开发,而他的公司可能需要更多的时间来研究它们,然后才能将它们转化为可销售的产品特性。