‧
8 分钟阅读
2015年分析软件市场
Sameer Al-Sakran
‧ 8 分钟阅读
分享本文
2015年分析软件市场
现在 2015 年的账务已经全部结清,是时候回顾一下分析软件市场的一些变化了。一些趋势(开源、云托管、Hadoop 上的 SQL)仍在继续演变,同时 AWS Redshift 也作为数据仓库的强大力量出现。
此外,在 Redshift 出现后,许多初创公司也纷纷涌入了一个原本停滞的市场。
SQL 继续占领 Hadoop 生态系统
除了 Spark 之外,Hadoop 生态系统中大部分的关注点都集中在 Presto、Impala 和 Drill 上。取代 MapReduce 的战斗正在进行;少数几个竞争者共同的一个主要特点是它们都基于 SQL 接口。自从 2010 年 Hive 开始取代 Pig 以来,这已经是不争的事实。
Hadoop 生态系统提供的价值中,有太多与分析和商业智能 (BI) 相关。整个 BI 世界几十年来一直围绕 SQL 构建,积累的组织能力太强大,无法被取代。在所有关于 Hadoop 的 NoSQL 喧嚣之后,事情又回到了原点。
Druid 似乎正在获得动力
在主要的、大规模的内存 OLAP 数据库中,LinkedIn 的 Pinot 和 Metamarkets 的 Druid 是两个主要参与者。Druid 似乎正在获得 Yahoo 的相当大的关注,以及许多 走在技术前沿的公司 越来越多地使用它来支持实时 BI。
10 月份,一些主要贡献者 宣布 了 Imply.io,一家提供商业支持并围绕 Druid 构建生态系统的公司。总的来说,许多聪明人正在将其作为内存数据库,以实现对海量数据集的交互式分析。
开源机器学习库琳琅满目
11 月份,Google 开源了 Tensor Flow,这是一个用于通过数据流图进行计算的通用库。它被广泛用于机器学习和深度神经网络。它加入了来自微软在 11 月份推出的 Theano、Torch 和 DMLT。
虽然这些库并不是一个简单的插件来为任何产品添加 AI,但它们是使最先进的算法可供拥有足够数据来训练其系统的任何人使用的基础。随着其他人在此基础上构建,产品(包括分析和其他产品)的整体复杂性将不断提高。
IBM 大力支持 Spark
6 月份,IBM 宣布将投入 3,500 名研究人员和开发人员 到 Spark 相关项目中。在很多方面,Spark 是 Hadoop 生态系统中 MapReduce 的继承者。它允许开发人员混合搭配低级数据处理语言、机器学习库、图算法和 SQL-on-Hadoop 数据库。
虽然它仍然处于采用曲线的最前沿,但它拥有大量的开发者支持。10 月份,IBM 在 Bluemix 上宣布了 Spark 即服务,并将其 Data Works 产品移植到了 Spark。这对 Databricks(迄今为止拥有 Apache Spark 项目的称号的公司)来说,将非常有意思。
开源商业智能取得了重大进展
历史上,开源软件的颠覆主要发生在软件堆栈的较低层。随着时间的推移,以及开源软件公司可行商业模式的演变,越来越多的面向最终用户的软件正在以开放的方式开发。
去年,两家老牌开源 BI 公司之一的 Jaspersoft 被 Tibco 以 1.85 亿美元收购。今年 2 月份,另一家 Pentaho 被 Hitachi Data Systems 以超过 5 亿美元收购。
与此同时,2015 年出现了许多更轻量级的开源项目。AirPal 和 re:Dash 专注于使在 Redshift 集群上快速轻松地运行 SQL 查询(请参阅下文),而 Metabase 则提供了一个易于安装的工具,允许非技术用户使用各种数据库的数据运行查询并共享仪表板和报告。
专注于事件分析的公司仍在稳步发展
虽然 Google Analytics 仍然是所有人的默认选择,但围绕收集和分析网站或移动应用程序上的用户行为的、一体化的分析系统一直有很多活动。
与此同时,Google Analytics 的主要竞争对手 Mixpanel(去年筹集了 6500 万美元)在年中之前大部分时间都比较安静。7 月份,它效仿 Heap 的做法,宣布了“无代码分析”。
这意味着通过将 SDK 添加到移动应用程序来自动检测您的移动应用程序,并且在手动检测特定事件(如按钮点击)之前就能获得事件分析。11 月份,它宣布了 Predict,该功能允许您应用轻量级机器学习来预测用户是否会执行某个操作(例如转化)。
与此同时,Heap 因其在移动和 Web 事件分析中的易用性而备受关注;Amplitude 在 8 月份 筹集了 900 万美元;新进入者 Interana 在 1 月份获得了 2000 万美元的 A 轮融资,其故事围绕分析速度。
与此同时,一种廉价易用的数据仓库(AWS Redshift)的出现,给完全托管的、专门的事件分析产品这一普遍观念带来了挑战。
新的新兴参考云分析架构
2015 年,在初创公司(以及愿意冒险的更大公司)如何处理 BI 方面,一种新标准正在出现。回到了 20 世纪 90 年代的统一数据仓库概念。实现这一点的关键组件是 AWS Redshift 作为分析数据仓库的广泛采用。
与老式数据库(Aster、Vertica、Teradata 等)相比,它相对容易维护,因此很快成为大多数快速发展的科技公司构建数据仓库的默认起点。
有两类初创公司正在乘着这股浪潮:一类是帮助您将数据加载到 Redshift 的公司,另一类是让您在数据已加载到 Redshift 后进行分析的公司。
第一类包括一些完全专注于将数据加载到 Redshift 的公司(Alooma、Etleap、Textur)。此外,Segment 今年正式宣布了向 Redshift 发送数据的能力。与此同时,电子商务分析提供商 RJMetrics 现在也提供其系统的数据提取部分,允许您将数据发送到 Redshift。
总而言之,许多公司正在依附于亚马逊,大多数是在去年秋天 QuickSight 发布之前。随着 AWS 的数据管道和其他提取服务的不断改进,他们将有多少业务尚待观察。考虑到 AWS 的移动分析 SDK 和提取管道的存在,Amazon 在 2016 年将为这个系统留下多少生存空间,完全取决于亚马逊的意愿。
考虑到 QuickSight 预览版目前显示出的初步功能,许多 BI 软件供应商在 2015 年从大量投资于 Redshift 的客户那里获得了大部分增长。Looker、Mode Analytics、Periscope 和 Metabase 在分析 Redshift 数据方面都表现突出。同样,AWS 今年将推出什么产品,以及这些公司的格局将如何转变,仍有待观察。
总而言之,随着融资放缓的影响日益显现,2016 年有望成为非常不平凡的一年。虽然这应该有利于大公司,但也有一些趋势对更大、更慢的现有公司构成严重威胁。
大整顿
虽然身处其中很难判断,但回顾过去,似乎很清楚的是,公开市场的收入倍数压缩最终通过 Fidelity 公开下调 了其大量后期投资,从而开始了“蛇形”调整。
在与分析相关的公司中,Cloudera 基本未受影响,而 Dataminr 的估值则被削减了 35%。总的来说,无论是早期还是后期,分析初创公司的资本成本都大大提高。尽管许多风险投资公司关闭了新基金并且拥有大量可投资的资金,但总体感觉是,对于给定的运行率或其他交易指标,估值已经有所下降。
今年在融资方面,以及更重要的,在许多分析公司的客户基础的下游预算方面,都将出现一些动荡。考虑到大多数公司客户生命周期价值对“C”词(客户流失)的敏感度,2016 年看起来将是需要系好安全带,并确保你知道呕吐袋在哪里的时候。
_本文最初发布于 Techcrunch _