放眼全球,盘点国外非常有潜力的云计算和大数据公司
某一天,当你踏进美国的某一家百货商店,室内安装的摄像头会监视着你的一举一动,几分钟以后,你走过的过道、你挑选或放下的产品、你最后选择购买的东西甚至你拿起又放下物品时刹那间的表情,都会被摄像头抓取并发送至某家软件公司。当然这些并不是怀疑你是扒手才这么做,只是我们身处一个大数据的时代,这些视频只是供他们进行数据分析。
云计算和大数据近年来蓬勃发展,它们改变了人类生活的技术创新。在云计算和大数据的协助下,警察可以通过犯罪数据和社会信息来预测犯罪率,部分科学家通过遗传数据预测疾病的早期迹象。现在,无论是创业家还是风险投资家,整个行业都非常看好云计算和大数据。Arbor 小C为你梳理下涉及医疗、*,科研等领域的十大出色的云计算和大数据公司。
1.Splunk-机器数据引擎
美国商业智能软件提供商Splunk,创立于2004年,2012年在纳斯达克上市,成为首家上市的大数据公司。目前在12个国家拥有700多名员工,最早通过分析日志数据排除机器故障,现在其软件可用于监控、分析实时的机器数据以及TB级的历史数据。今天所有的网站、通信和复杂IT基础设施每时每刻都在生成大量数据流,Splunk的技术特别适合于实时数据分析,帮助用户需要及时地了解业务发展趋势。
Splunk中国36大数据专区>>>
Splunk 是机器数据的引擎。使用 Splunk 可收集、索引和利用所有应用程序、服务器和设备(物理、虚拟和云中)生成的快速移动型计算机数据。从一个位置搜索并分析所有实时和历史数据。 使用 Splunking 处理计算机数据,可让您在几分钟内(而不是几个小时或几天)解决问题和调查安全事件。监视您的端对端基础结构,避免服务性能降低或中断。以较低成本满足合规性要求。关联并分析跨越多个系统的复杂事件。获取新层次的运营可见性以及 IT 和业务智能。
2.Metamarkets-可视化分析专家
MetaMarkets总部位于美国旧金山的一家创业公司,主要业务是帮助在线媒体公司分析高流量的流媒体数据,如在线广告、在线游戏和社交媒体的数据。MetaMarkets公司对tweet、支付、签到和一些与互联网相关的问题进行了分析,为客户提供了很好的数据分析支持。在此同时MetaMarkets为每秒进行数十亿条数据记录的可视化分析带来了革命性的解决方案。
MetaMarkets目前在迈克尔·斯科尔(MichaelDriscoll)领导下,他曾领导Dataspora公司,后者向电信公司、保险公司和零售银行提供数据分析服务。MetaMarkets投资者包括包括风投公司IA Ventures、Village Ventures 和True Ventures。
3.Tableau — 数据可视化
美国计算机软件公司Tableau创立于2003年,总部位于西雅图,Tableau软件的研发最早源于美国国防部的一个项目,当时为了提高人们分析信息的能力,国防部召集了斯担福大学计算机科学专业的人才,以及专门探索和分析数据库和多维数据集可视化技术研究的著名教授Pat Hanrahan和他的博士学生Chris Stolte,他们很快认识到计算机图形可以帮助人们提高理解信息的能力。Tableau开发的桌面系统中最简单的商业智能工具软件,适合企业和部门进行日常数据报表和数据可视化分析工作,它将数据运算与美观的图表完美地嫁接在一起。
该公司改变着我们阅读数字媒体的方式:Tableau大受媒体从业人员欢迎,因为Tableau能够在他们写稿子的时候,提供更加新颖的数据表达方式。任何人都可以免费使用Tableau来创作美轮美奂的图表和地图,不需要任何编程知识。
Tableau中国36大数据专区>>>
数据就在咫尺之间:在很多方面,“大数据”对任何人都是有其所用的——而不仅仅是给企业赚钱用的。非营利机构,诸如美国*监管机构California Common Sense(目前是Tableau客户),通过使用Tableau的软件对党派的大量数据进行分析,揭露了诈骗和政客言行不一等现象,在投票前为选民提供了基于数据的信息参考。Tableau的使命是帮助客户查看数据,并理解数据背后的意义。
4. Cloudera -Hadoop分析三巨头之一
Cloudera创立于2008年,其创始团队大多来自Oracle、雅虎、Facebook和谷歌等公司。其中,Cloudera公司首席架构师Doug Cutting是Hadoop创造者兼Apache Hadoop项目创始人。Hadoop是一种分布式系统基础架构,是大数据的核心技术之一。短短的几年时间里,Cloudera已从一家默默无闻的创业公司,发展成为企业在应对数据挑战时不得不依赖的公司。
面对这庞大数据的存储和处理,NoSQL可以做得很好,而Hadoop可以利用一些价格低廉的硬件完成大量的数据分析。创业公司Cloudera就采用这两种技术,Cloudera 利用 Hadoop 这一开源技术帮助公司搭建他们的大数据系统,Hadoop 可以利用一些价格低廉的硬件就完成大量的数据分析,所以非常受大小企业欢迎。
5.HortonWorks-Hadoop分析三巨头之一
Hortonworks是一家Hadoop初创公司,2011年7月由雅虎与硅谷风投Benchmark Capital合资组建。创立之初仅有不到30名员工,大多来自雅虎专门研究Hadoop的元老级工程师,这个团队几年前开发了雅虎内部一个开源项目Hadoop。Hortonworks公司正努力让更多的人使用Hadoop,并大胆预测这项技术将在未来五年内处理世界上一半的数据。作为又一家基于Hadoop框架提供大数据服务的创业公司,Hortonworks在短短两年多的时间里就成长起来,引起业界关注。
HortonWorks 中国专区>>>
6.MapR- Hadoop分析三巨头之一
MapR公司是美国加州的圣何塞市的一个企业管理软件公司,主要专注于可用性和数据安全优化和开发、销售Apache Hadoop的衍生软件。MapR号称下一代Hadoop,使Hadoop变为一个速度更快、可靠性更高、更易于管理、使用更加方便的分布式计算服务和存储平台,同时性能也不断提高。MapR通过为Hadoop用户提供专业咨询服务来获取收入。MapR目前大约一半的客户是传统的Web和基于云计算的公司,而另一半则是金融、电信和制造公司。
7.ParAccel – 大数据分析
ParAccelParAccel是一家提供快速、选择性查询和列存储数据库,并基于大规模并行处理优势特点的公司。该公司表示,其平台支持一系列针对各种复杂、先进应用的工作负载报告和分析。内置的分析算法可以为分析师提供高级数学运算、数据统计、和数据挖掘等各种功能,同时,它还提供一个开放的API,可以扩展数据库的各种数据处理能力和第三方分析应用。ParAccel颠覆了Hadoop的神话。太多创业公司陷入了“大数据=非结构化数据的大数据=Hadoop”的逻辑。除了非结构化数据和半结构化数据以外,结构化数据也在快速增长。
2013年,数据库公司Actian收购了ParAccel,前者是一家有点深藏不露的数据库公司。目前其年收入大约为1.5亿美元。
8. QlikTech -商业智能领域
QlikTech是全球增长最快的商业智能(BI)公司,其旗舰产品 QlikView提供即时商业答案,使用户能够轻松自如、无限制地挖掘自己的数据。与传统商业智能不同的是,QlikView能够为用户迅速创造价值,其投资回报期仅为数天或数周,而不是数月、数年或永远收不回投资。它是唯一一款能够在经营场所、云计算平台、笔记本电脑或者移动装置上部署的产品,适用于任何企业,从单个用户到大型国际企业。
目前这家公司正在和Google合作,以便于开发者更好的利用大数据。最近Google发布了GoogleBigQuery,方便开发者获取大量数据。为了帮助开发者对这些数据进行分析,QlikTech提供了对原始数据进行可视化处理等功能的工具。
公司的使命就是让普通用户也可以有效利用大数据,并将之融入到生活里面。
9. Pivotal- 新一代PaaS
Pivotal于2013年在美国旧金山成立,是EMC和VMware的合资公司,成立当日披露了Pivotal One新一代PaaS计划,Pivotal One是第一个集成新的分片式数据、现代编程框架、云便携性和遗留系统支持的平台,把消费级的功能带给企业。Pivotal的员工数量目前为1250人,在出资额方面,EMC将出资69%,VMWare将出资31%,公司定位是一家下一代云计算和大数据应用相结合的公司。
Pivotal中国专区>>>
10. Sumo Logic – 下一代的Splunk
Sumo Logic公司成立于2010年4月,是一个基于云计算的日志管理和分析系统,总部设在美国加州的山景城。Sumo Logic被认为是下一代的Splunk,该公司从创立之初就注重打造云计算能力,目前,Splunk使用在线计算机服务器,基于弹性云的PB级规模的云平台,提供收集、管理和分析企业日志数据,使数百万行日志数据实时转化为宝贵的业务运营决策。
Sumo Logic的服务是完全基于云计算并且是免费维修。SumoLogic使用先进的机器学习算法来削减堆积如山的日志文件数据,让管理员更容易合成的信息。有分析师认为,根据Sumo Logic现有的业务,它有一天可以出售从客户那里获得的有价值的行业信息。
11. Kaggle – 大数据分析的众包平台
Kaggle是一家大数据分析的众包平台的公司,希望通过“数据科学运动”来挑战世界上最好的科研人员和统计学家。他们希望以聚集天才的方式,在大数据的辅助下进行协同工作甚至直接竞争,以研究出最复杂的算法和解决方案,从而进一步理解人类。
Kaggle可以将需求公司他们的数据、问题的描述、以及期望的指标整理后发布到Kaggle上,通过举办竞赛的方式让网上的数据科学家参与解决。数据分析师们或独立、或组队参加比赛,利用自己的专业知识和数据分析工具得到优化模型。最后,这些结果经过原定指标的检验,被公布到排行版上;最好的结果将获得竞赛的奖金(几百美元到几百万美元不等)。而公司也能最终拥有数据分析的结果、模型等知识产权。
比如说Kaggle会为全球顶尖的科学家举办竞赛活动,让他们通过网络的方式提交数据和问题,从而获得其他科学家所提供的解决方案。最近Merck公司向他们提供了一种分子结构,而Kaggle顺利地预测出这种化学物质的毒性。
12. GoodData -商业挖掘
GoodData是一家创业公司,主要面向商业用户和IT企业高管,提供数据存储、性能报告、数据分析等工具,希望帮助客户从数据中挖掘财富。和 IBM、SAP、Oracle 等巨头提供的套件式解决方案不同,GoodData 将其所有的数据分析服务实现了 100% 云化,以 SaaS 的模式提供给企业。在 GoodData 的云平台上,企业可以将公司已有数据导入,再对数据做跟踪、切分、可视化、分析等处理。这家公司目前拥有6000个企业用户,其中包括了Groupon、Zendesk和Mint.com等。在今年第二季度的时候,他们的预订量同期增长了280%。
GoodData 中国专区>>>
13. TellApart-电子商务数据
TellApart是由Google前员工Josh McFarland和Mark Ayzenshtat所建立的,他们正在和电商公司进行合作。他们会根据用户的浏览行为等数据进行分析,通过锁定潜在买家方式提高电商企业的收入。目前这家公司已经获得了1775万美元的融资。
TellApart正在建立核心系统去解决大数据多带来的挑战,从而为客户带来更大的收入。CEO Josh McFarland表示:“公司要打造一个可以自我学习的算法系统,藉此更充分利用数据,并挖掘他们的价值。”
14. DataSift -社交媒体数据
随着像Twittter、Fcacebook等社交网络媒体的爆发,越来越多的品牌也会受到他们的影响。DataSift主要收集并分析社交网络媒体上的数据,并帮助品牌公司掌握突发新闻的舆论点,并制定有针对性的营销方案。目前这家公司已经获得1500万美元的融资。
这家公司还和Twitter有合作协议,使得自己变成了行业中为数不多可以分析早期tweet的创业公司。举个简单的例子,DataSift可以根据Twitter的数据对两届奥运会进行横向对比,从中了解并分析公众对当时新闻和事件的反应。DataSift的前景逐渐明朗,现在客户数已经超过了10000个。
15. Datahero
Datahero已经获得了100万美元的融资,其任务是将复杂的数据变得更加简单明了,方便普通人去理解和想象。创始人Chris Neumann曾经是Aster Data的员工。
在一次寻求融资的电话中,Foundry Group的BradFeld递给了Neumann一份数据文件,目的是要测试他们公司对数据的处理速度。除此之外,他们还要求并要求Neumann创建与之相关的可视化的数据图表。最后Neumann出色地完成了任务,并给Feld的工作带来很大帮助。这家公司的另一个目标是微软的Excel。很多初级分析师在使用Excel处理数据的时候需要花费一天甚至更多的时间,而他们希望能够打造一个比Excel更加便利快速的数据处理工具。
16.Inrix
Inrix是由微软的前员工于2004年创立的,在美国特拉华州注册成立,该团队试图为全球解决这个世纪性难题。他们推出的软件致力于为全球交通问题带来智能数据和先进的分析方法的交通智能化平台,截至2012年12月已经为全球32个国家的企业提供了服务。
Inrix实际上是以规模取胜的。Inrix有近一亿台车辆和设备来收集实时数据资源,而这一亿的用户实际上也充当了Inrix传感器的角色。
这些数据综合起来,能为当前甚至未来的交通状况提供一个完整的模式图。这些数据可以出售给GPS生产商和交通规划部门等。Inrix去年进行了最新一轮的融资,共筹集3700万美元的资金,由风投公司Kleiner Perkins Caufield &Byers 和August Capital领投。