Oxdata研发H2O,打造大数据新蓝图
当你打开该网页时,相信你的第一反应肯定是怀疑的,一个小小的程序员怎么可能成为数据库专家,但是内心也有一点期盼的成分存在,就像买彩票一样,明知道中500万的概率几乎为零,可是还是会去买。前DataStax工程师,Platfora的联合创始人,SriSatish Ambati描
当你打开该网页时,相信你的第一反应肯定是怀疑的,一个小小的程序员怎么可能成为数据库专家,但是内心也有一点期盼的成分存在,就像买彩票一样,明知道中500万的概率几乎为零,可是还是会去买。前DataStax工程师,Platfora的联合创始人,SriSatish Ambati描绘了一幅宏伟的蓝图,让大数据从晦涩难懂的“黑魔法”变成像小孩子的“过家家”游戏那样简单,无论成功与否, Ambati勇气可嘉,态度值得所有的程序员学习。乔布斯不正是把一个个不可能变成了现实吗?
不过令人遗憾的是,0xdata的数据库产品还在襁褓之中,但是0xdata对做大规模先进的统计分析问题的能力有强大的自信:建立在HDFS上的规模化处理,使用广为人知的R编程语言,把一切都隐藏在一个简单的界面之下。
大数据的趋势正在悄然发生改变,把大数据从晦涩难懂的“黑魔法”变成”小儿科“,似乎已经不再是一个难以企及的梦想!0xdata正是推动这项技术发展的最新公司之一。自启动以来,“hexadata”就凝聚了前DataStax工程师,Platfora的联合创始人,SriSatish Ambati的心血结晶,现在它试图融入Hadoop、R语言和谷歌的BigQuery,准备打造“终极版”的统计分析工具。
Oxdata的旗舰产品,被称之为“H2O”,不错,就是“水”的意思,它的核心是一个统计分析引擎,它使用Hadoop的分布式文件系统(HDFS)作为其存储平台,但是它们的最终目标是像谷歌的BigQuery一样简单。H2O的用户交互是通过一个简单的网络搜索和标准R统计分析语法。另外,用户还可以在Microsoft Excel或RStudio的集成开发环境中使用REST API调用H2O。
Ambati表示,规模化的基础数据和运行高级分析的复杂性都是需要被隐藏的细节。这和Platfora有相同的理论基础,但是该公司的联合创始人Ambati和前任DataStax的同事Ben Werther却与Platfora的做法截然不同。Platfora试图通过建立基于Hadoop的下一代用户体验来破坏现有的数据仓库市场,然而0xdata只是试图改变传统的统计软件的用户交互方式而已。
数据分析产品的负责人Ambati很经典的一句话:“谁都没有吹牛的权利。但是如果不这样做,未来将寸步难行。”让人不禁想到这两天京东与苏宁的家电大战,只能硬着头皮前进,不能后退,因为后退即是灭亡!
Oxdata把数据处理的速度当做一个重点处理——如何快速处理数据,如何让用户迅速得到响应。谷歌搜索让我们有了可以陆续追问的思想,Ambati认为,数据分析也应该有同样的经历。这就是为什么H2O在分析过程中的每一步都提供了近似的结果,而不是等待整个工作运行以后得出计算精确的结果,用户可以得到一个总体的解决思路,即使完全超出预期范围,无论是清理工作还是重新开始新工作都会变得更快。
想要在公众面前得到一个机会,实现H2O“壮志雄心”的诺言,还有很长的一段路要走。但是Ambati表示,虽然产品仅仅是经历了短短4个月的开发,还没有一套的完整的算法,但是相信几个月以后就能初见分晓。他团队的八位工程师,已经建立了很多很酷的东西,只是现在还需要一个完善的过程,最终才能把代码变成实际的产品。尽管困难是如此之大,他们毅然决定继续数据的系统化处理,就是从那一刻起,Ambati和他的团队也发现了很多的乐趣,“我们与基础架构生死相随,不离不弃”Ambati调侃道,“而且我们一大帮人花了很多的时间来学习数学,日子就像回到计算机科学专业学生的那个时代”。(编译/王鹏,审校/包研)
How 0xdata wants to help everyone become data scientists
后记:Oxdata的H2O目前虽然还是“镜花水月,空中楼阁”,但是Ambati和他的团队的精神确实让人肃然起敬,中国有句老话“有志者,事竟成”,相信只要努力肯定会有收获。当1985年Microsoft的Windows视窗操作系统发布,就立即取代了以往的命令、代码系统(Microsoft Disk Operating Systerm,简称MS-DOS),立即成就了Microsoft这个庞然大物,让比尔·盖茨荣登世界首富的宝座,就是因为Windows简单简洁,操作方便,给用户带来了更好的操作体验,现在电脑已经走进千家万户,从几岁的孩子到五六十的老人,都能很快上手进行网上冲浪,这不正是Windows的魅力所在吗?乔布斯的Ipad风靡全球也正是因为这些原因,因为它让3岁的孩子都能很快成为“水果忍者”。Ambati的团队也做着同样的事情,他们也想让“触不可及”的大数据处理变得的简单如操作Windows一样,让每个人都能迅速成为数据库领域的“专家”,这不正是酝酿着一场新的数据革命吗?我们也期待H2O的发布,能给大数据带来一场新的变革!