2016年1月9日发布于 分析和商业智能

8分钟阅读

2015年分析软件市场

Sameer Al-Sakran Portrait
Sameer Al-Sakran
‧ 2016年1月9日发布于 分析和商业智能

‧ 8分钟阅读

2015年分析软件市场

2015年已告一段落,是时候回顾一下分析软件市场的变化了。有几个趋势(开源、云托管、Hadoop上的SQL)持续发展,同时AWS Redshift也作为数据仓库领域的一股主要力量崛起。

此外,在原本停滞的市场中,Redshift的出现创造了生态位,许多初创公司也围绕这些生态位汇聚。

SQL持续主导Hadoop生态系统

除了Spark,Hadoop生态系统中的大部分喧嚣都围绕着Presto、Impala和Drill。取代MapReduce的竞争正在进行;这些短名单竞争者的主要共同点是它们都基于SQL接口。自2010年Hive开始取代Pig以来,这一趋势就已经显而易见了。

Hadoop生态系统提供的大部分价值都围绕着分析和商业智能(BI)。整个领域已经运行在SQL上几十年了,围绕它建立的机构能力太强大,难以被取代。在与Hadoop相关的NoSQL喧嚣之后,事情又回到了原点。

Druid似乎正在积蓄势头

在主要的Lage-scale内存OLAP数据库中,LinkedIn的Pinot和Metamarkets的Druid是两大主要参与者。Druid似乎在雅虎获得了相当大的吸引力,以及许多前沿科技公司越来越多地使用它来支持实时BI。

10月,一些主要贡献者宣布成立了Imply.io,一家提供商业支持并围绕Druid构建生态系统的公司。总的来说,许多聪明人正在将Druid作为内存数据库,以实现对海量数据的交互式分析。

开源机器学习库琳琅满目

11月,谷歌开源了Tensor Flow,这是一个使用数据流图进行计算的通用库。它主要用于机器学习,特别是深度神经网络。它加入了TheanoTorch和11月微软发布的DMLT的行列。

虽然这些库并非简单的插件,无法为任何产品添加AI功能,但它们是使最先进算法可供拥有足够数据来训练其系统的任何人使用的基础。随着其他人在这一基础上进行构建,产品的整体复杂性,无论是分析型还是其他类型,都将逐步提升。

IBM大力支持Spark

IBM于6月宣布投入3500名研究人员和开发人员参与Spark相关项目。Spark在许多方面是Hadoop生态系统中MapReduce的继任者。它允许开发人员混合搭配低级数据处理语言、机器学习库、图算法和Hadoop上的SQL数据库。

虽然它仍处于采用曲线的最前沿,但它拥有大量的开发者支持。10月,IBM宣布在Bluemix上推出Spark即服务,并将其Data Works产品移植到Spark。这将对一直主导Apache Spark项目的公司Databricks产生何种影响,将非常值得关注。

开源商业智能迎来重要一年

从历史上看,开源软件带来的大部分颠覆都发生在软件堆栈的较低层。随着时间的推移,以及开源软件公司可行商业模式的演变,越来越多面向最终用户的软件以开源形式开发。

去年,两大老牌开源BI公司之一的Jaspersoft被Tibco以1.85亿美元收购。今年2月,另一家公司Pentaho被日立数据系统公司以超过5亿美元的价格收购。

与此同时,2015年涌现出许多轻量级开源项目。AirPalre:Dash专注于让在Redshift集群上运行SQL查询变得快速简便(详情见下文),而Metabase则提供了一个易于安装的工具,允许非技术用户使用来自各种数据库的数据运行查询并共享仪表盘和报告。

专用事件分析公司持续发展

虽然Google Analytics仍然是所有人的默认选择,但在围绕收集和分析网站或移动应用程序用户行为的一体化分析系统方面,仍然存在大量活动。

与此同时,Google Analytics的主要竞争对手Mixpanel(去年年底筹集了6500万美元)在年中之前一直保持沉默。7月,它追随Heap的脚步,宣布推出“无代码分析”功能。

这项功能允许您通过将SDK添加到移动应用程序来自动检测您的移动应用程序,并且无需手动检测按钮点击等特定事件即可获得事件分析。11月,它宣布推出Predict,让您可以应用轻量级机器学习来预测用户是否会执行某个操作(例如转化)。

与此同时,Heap因其在移动和网络事件分析方面的易用性而备受关注;Amplitude在8月筹集了900万美元;新入局者Interana在1月筹集了2000万美元的A轮融资,其核心卖点是分析速度。

与此同时,一种廉价且易于运行数据仓库的方式(AWS的Redshift)的出现,对完全托管的专业事件分析产品这一普遍观念构成了挑战。

新兴的参考云分析架构

2015年,在成长中的初创公司(以及那些敢于走在前沿的公司)如何处理BI方面,一种新标准正在出现。这是对1990年代“统一数据仓库”概念的回归。促成这一点的关键因素是AWS Redshift作为分析数据仓库的广泛采用。

与处理旧式数据库(如Aster、Vertica、Teradata等)相比,它相对容易维护,因此很快成为大多数成长中的科技公司数据仓库的默认起点。

有两类初创公司正乘着这股浪潮:一类帮助您将数据导入Redshift,另一类则允许您在数据进入Redshift后对其进行分析。

第一类包括一些完全围绕将数据加载到Redshift的公司(AloomaEtleapTextur)。此外,Segment今年也正式宣布支持将数据发送到Redshift。与此同时,电子商务分析提供商RJMetrics现在也仅提供其系统的数据摄取部分,允许您将数据发送到Redshift。

总而言之,许多公司都在依附亚马逊,其中大部分是在去年秋天QuickSight发布之前。随着AWS的数据管道和其他数据摄取服务持续改进,这些公司还有多少业务空间仍有待观察。考虑到AWS已有的移动分析SDK和数据摄取管道,2016年这个系统中还有多少生存空间,将取决于亚马逊的意愿。

鉴于QuickSight预览版目前显示的功能仍很基础,许多BI软件供应商在2015年的增长很大程度上来源于大量投资于Redshift的客户。Looker、Mode Analytics、Periscope和Metabase都在分析Redshift数据方面表现突出。同样,AWS在来年会有何举动,以及这些公司的格局将如何变化,仍有待观察。

总而言之,2016年注定是充满变数的一年,因为融资放缓的影响将变得更加明显。虽然这应该有利于大型参与者,但也有一些趋势对规模更大、行动较慢的现有企业构成极大威胁。

大调整

虽然身处其中时总是难以分辨,但回过头看,很明显,当富达公开下调其大量后期投资的估值时,公开市场上的收入乘数压缩最终传导开来。

在与分析相关的公司中,Cloudera基本未受影响,而Dataminr的估值则被削减了35%。总的来说,分析初创公司,无论是早期还是后期,其资本成本都大大提高。尽管许多风险投资公司募集了新基金并拥有充足的资金可供投资,但总体感觉是,对于给定的运行率或其他衡量吸引力的指标,估值已经悄然下降。

今年在融资以及更重要的——许多分析公司客户群的下游预算方面,将出现一些动荡。考虑到大多数公司的客户生命周期价值对“流失”(churn)这个词有多敏感,2016年看来是时候系好安全带,并确保您知道呕吐袋在哪里了。

_本文最初发布于 Techcrunch _

您可能也喜欢

所有文章
什么是嵌入式分析?图片 2025年5月15日发布于 分析和商业智能

什么是嵌入式分析?

嵌入式分析是指让用户可以直接在您的产品内访问图表、指标和报告,从而无需离开您的应用程序或依赖他人提供答案即可探索和处理他们的数据。

Alex Yarosh Portrait
Alex Yarosh

11分钟阅读

5大仪表盘常见错误(以及如何修复)图片 2025年4月25日发布于 分析和商业智能

5大仪表盘常见错误(以及如何修复)

仪表盘旨在指导决策,而非制造困惑。在本指南中,我们将介绍五个常见陷阱以及如何修复它们。

Abed Habli Portrait
Abed Habli

7分钟阅读

所有文章
© . All rights reserved.