‧
8 分钟阅读
2015 年分析软件市场

Sameer Al-Sakran
‧ 8 分钟阅读
分享这篇文章
2015 年分析软件市场
既然 2015 年已经结束,现在是时候回顾一下分析软件市场的一些变化了。已经出现了一些趋势(开源、云托管、Hadoop 上的 SQL),并且 AWS Redshift 作为数据仓库的主要力量也崭露头角。
此外,许多初创公司都聚集在 Redshift 的出现所创造的生态位上,否则这个市场将会停滞不前。
SQL 继续接管 Hadoop 生态系统
除了 Spark 之外,Hadoop 生态系统中的大多数关注点都集中在 Presto、Impala 和 Drill 上。争夺 MapReduce 继任者的战斗正在进行中;入围候选名单的主要共同因素是它们都基于 SQL 接口。自从 Hive 在 2010 年开始超越 Pig 以来,这种趋势就已显而易见。
Hadoop 生态系统提供的太多价值都围绕着分析和商业智能 (BI)。整个世界已经在 SQL 上运行了几十年,围绕它建立的制度能力太强大,无法取代。在所有关于 Hadoop 的 NoSQL 喧嚣之后,事情又回到了原点。
Druid 似乎正在兴起
在主要的、大规模的内存 OLAP 数据库中,来自 LinkedIn 的 Pinot 和来自 Metamarkets 的 Druid 是两个主要参与者。Druid 似乎在 雅虎 获得了相当大的吸引力,以及许多 走在前沿的科技公司 越来越多地使用它来支持实时 BI。
10 月,一些主要贡献者宣布成立 Imply.io 公司,该公司提供商业支持,并将围绕 Druid 构建生态系统。总的来说,许多聪明人都在致力于将其作为一种内存数据库,以实现对海量数据集的交互式分析。
大量的开源机器学习库
11 月,谷歌开源了 Tensor Flow,这是一个使用数据流图进行计算的通用库。它主要用于机器学习和深度神经网络。它加入了来自微软的 Theano、Torch 和 DMLT。
虽然这些库不是将 AI 添加到任何产品的简单插件,但它们是基础组件,使最先进的算法可供任何拥有足够数据来训练其系统的人使用。随着其他人在此基础上构建,分析和其他产品的整体复杂性将逐步提高。
IBM 全力支持 Spark
IBM 在 6 月宣布,它将投入 3,500 名研究人员和开发人员到与 Spark 相关的项目中。在许多方面,Spark 都是 Hadoop 生态系统中 MapReduce 的继任者。它允许开发人员混合搭配低级数据处理语言、机器学习库、图算法和 Hadoop 上的 SQL 数据库。
虽然它仍处于采用曲线的前沿,但它背后有大量的开发人员支持。10 月,IBM 宣布 Spark 作为 Bluemix 上的服务,并将其 Data Works 产品移植到 Spark。这对于 Databricks(这家公司迄今为止一直拥有 Apache Spark 项目的领导地位)意味着什么,将非常值得关注。
开源商业智能迎来重要一年
从历史上看,开源软件的大多数颠覆都发生在软件堆栈的较低层。随着时间的推移,以及开源软件公司可行的商业模式的演变,越来越多的面向最终用户的软件正在开源开发。
去年,两家老牌开源 BI 公司之一 Jaspersoft 被 Tibco 以 1.85 亿美元收购。此前的 2 月,另一家 Pentaho 被 Hitachi Data Systems 以超过 5 亿美元的价格收购。
与此同时,2015 年涌现出许多更轻量级的开源项目。AirPal 和 re:Dash 专注于让在 Redshift 集群上快速轻松地运行 SQL 查询(详见下文),而 Metabase 是一种易于安装的工具,允许非技术用户使用来自各种数据库的数据运行查询并共享仪表板和报告。
专业的事件分析公司继续稳步发展
虽然 Google Analytics 仍然是每个人的默认选择,但在围绕收集和分析网站或移动应用程序上的用户行为的全功能分析系统中,仍然有很多活动。
与此同时,Google Analytics 的主要竞争对手 Mixpanel(去年年底筹集了 6500 万美元)在年中之前一直保持沉默。7 月,它追随 Heap 的脚步,宣布了“无代码分析”。
这是指通过将 SDK 添加到移动应用程序来自动检测移动应用程序的能力,并且还可以在不手动检测特定事件(如按钮点击)的情况下获得事件分析。11 月,它宣布了 Predict,它允许您应用轻量级机器学习来预测您的用户是否会执行操作(例如转化)。
与此同时,Heap 因其在移动和 Web 事件分析中的易用性而声名鹊起;Amplitude 在 8 月份筹集了 900 万美元;而新加入者 Interana 在 1 月份筹集了 2000 万美元的 A 轮融资,其故事围绕着分析速度。
与此同时,运行数据仓库(AWS 的 Redshift)的廉价且简便方法的出现,给完全托管的专业事件分析产品的总体概念带来了冲击。
新兴的参考云分析架构
在 2015 年,一种新的标准正在兴起,即成长中的初创公司(以及愿意冒险的公司)如何处理 BI。人们重新回归了 1990 年代的统一数据仓库概念。实现这一点的关键组件是 AWS Redshift 作为分析数据仓库的广泛采用。
由于与处理旧式数据库(Aster、Vertica、Teradata 等)相比,它相对容易维护,因此它迅速成为大多数成长中的科技公司数据仓库的默认起点。
有两类初创公司乘着这股浪潮:一类是帮助您将数据导入 Redshift 的公司,另一类是让您在数据进入 Redshift 后分析数据的公司。
第一类包括一些完全专注于将数据加载到 Redshift 的公司(Alooma、Etleap、Textur)。此外,Segment 今年正式宣布了将数据发送到 Redshift 的能力。与此同时,电子商务分析提供商 RJMetrics 现在也只提供其系统的数据摄取部分,让您也可以将数据发送到 Redshift。
总而言之,许多公司都在与亚马逊合作,其中大多数在去年秋天 QuickSight 发布公告之前就已如此。随着 AWS 的数据管道和其他摄取服务不断改进,它们还能有多少业务 остается,还有待观察。鉴于 AWS 移动分析 SDK 和摄取管道的存在,亚马逊在多大程度上愿意维持该系统的活力,将决定 2016 年该系统还剩多少空间。
鉴于 QuickSight 预览版目前展示的初级功能,许多 BI 软件供应商在 2015 年的增长很大一部分来自大量投资于 Redshift 的客户。Looker、Mode Analytics、Periscope 和 Metabase 都在分析 Redshift 中的数据方面表现突出。同样,AWS 明年会有什么举动,以及这些公司的前景将如何转变,还有待观察。
总而言之,随着融资放缓的影响变得更加明显,2016 年看起来将是非常重要的一年。虽然这应该有利于规模较大的公司,但对于规模较大、行动较慢的 incumbents 来说,存在许多非常危险的趋势。
大降温
虽然在事情进展顺利时总是很难判断,但回顾过去,似乎很明显,当 富达公开标记 大量后期投资贬值时,公共市场方面的收入倍数压缩最终还是传导开来。
在与分析相关的公司中,Cloudera 基本上没有受到影响,而 Dataminr 的估值则缩水了 35%。总的来说,分析初创公司(无论是早期还是后期)的资本成本都大幅提高。虽然许多风险投资公司关闭了新基金,并且有充足的资金可供投资,但总体感觉是,对于给定的运行率或其他业绩指标,估值已经向下调整。
今年,融资和更重要的许多分析公司客户群的下游预算都将出现一些动荡。鉴于大多数公司的客户生命周期价值对 C 词(客户流失)的敏感程度,2016 年似乎是一个系好安全带,确保您知道呕吐袋在哪里的时期。
_这篇文章最初发表在 Techcrunch _