2024年9月25日,发布于 分析与商业智能

5 分钟阅读

我们如何丰富客户联络和组织数据

Max Zheng Portrait
Max Zheng
‧ 2024年9月25日,发布于 分析与商业智能

‧ 5 分钟阅读

How we enriched customer contact and organization data Image
分享这篇文章

我们希望获得更多关于我们收集的数据的背景信息,因此我们考察了数据丰富服务。这些公司可以使用更多细节来情境化您的数据。例如,给定一个域名,第三方丰富服务可以为您提供域名相关的公司名称、规模、行业等等。

数据丰富是成长型公司,尤其是大型公司的典型做法。但在您开始购买丰富服务之前,您应该明确一组需要解决的问题(或要实现的目标),这些问题可以通过丰富来解决。对于 Metabase,我们希望出于以下两个原因丰富我们的客户联系人:

  1. 与客户保持联系。 丰富可以提醒我们联系人的工作变动,这可能会影响我们的关系。例如,如果联系人转换到公司内部或外部的另一份工作,我们可能希望联系他们表示祝贺,并确保我们与接管关系的人保持联系,以便重要的产品沟通不会丢失。
  2. 更好地了解组织规模和行业, 这可以帮助我们调整营销和产品工作,以确保我们构建 Metabase 来解决这些细分市场面临的各种问题。

服务提供商评估

令人惊讶的是,数据丰富服务提供商非常多,每个提供商都有其自身的优点和缺点。虽然我们考虑过各种 LinkedIn 数据转储提供商,但我们决定不使用它们,因为我们不应该在我们的数据仓库中存储此类数据。我们也没有评估 Clearbit,因为它不再作为独立服务提供。

总结:Apollo.io 为我们的用例提供了最佳的覆盖范围、定价和功能。

标准/供应商 LinkedIn Sales Navigator Crunchbase Lusha Apollo CommonRoom
工作经历/LinkedIn 个人资料 最佳选择,但仅限 UI 访问; API 访问受限 不可用 不可用 良好/看起来是最近的 基本良好,但缺少一些最近的工作变动
公司概况,例如行业规模、行业等 良好。搜索仅限 UI; API 访问受限 良好,但对于 100 个最近的联系人,覆盖率约为 70%(高/中)到 80%(低置信度) 尚可。对于 100 个最近的联系人,覆盖率约为 26% 出色,使用域名匹配的覆盖率达到 80%,针对 100 个最近的联系人 似乎主要适用于公司规模,但行业信息零星,对于最近的 100 个联系人,覆盖率约为 ~60%
人口统计信息,例如职位等 出色/LinkedIn 个人资料上的所有内容。搜索仅限 UI; API 访问受限 仅限于精选的关键人物,例如高管 尚可。对于最近的 100 个联系人,覆盖率约为 26% 良好,对于 100 个最近的联系人,姓名覆盖率达到 60%,职位/历史记录覆盖率达到 50% 是,但是:1. 基于 100 个最近的联系人,组织覆盖率限制为 ~60%,职位覆盖率限制为 ~30%
导出到数据仓库 仅与 CRM 集成,例如 Salesforce 或 HubSpot,功能有限(因 CRM 而异) 企业计划支持数据集下载。API 可以进行精确域名/名称和模糊搜索。每分钟 200 次调用,1000 次限制 通过 UI 或 API 上传/下载 CSV API 或 CSV (UI) 联系人丰富速度较慢,每次调用 0.5 秒 — 每 1 万条记录需要 1.4 小时。API 提供批量下载,一次 10 个 仅限企业计划的定期/自定义导出,否则通过 UI 手动导出。可以通过 UI 导出过滤器/浏览屏幕上可见的任何字段
成本 核心版:每人每年 960 美元;高级版(集成 CRM):每人每年 1600 美元 API:每年 1 万美元,享受 30% 的立即购买折扣。导出所有 300 万+ 公司的 CSV:5 万美元,享受 50% 的立即购买折扣 约 2 万至 2.5 万美元/年,针对 10 万个联系人 每月 400 美元,通过 API 丰富 1 万条记录。每条记录 4 美分。每月 3000 美元,丰富 10 万条记录。每条记录 3 美分。更多计划选项 许多 计划,从免费到企业版,基于联系人和功能数量:1. 免费版,最多 500 个联系人/50 个组织; 2. 启动版,每月 625 美元,最多 3.5 万个联系人; 3. 团队版,每月 1250 美元,最多 10 万个联系人; 4. 企业版,自定义定价,具有导出到数据仓库功能。每年 5 万美元以上

持续丰富

在选择了服务提供商后,我们使用 dltApollo.io 的 API 每小时按优先级丰富新联系人 — 优先丰富新联系人,然后再更新现有联系人,依此类推。

以下是 Python 中的代码片段,它

  1. 从我们的数据仓库中获取优先级联系人列表中的电子邮件列表
  2. 调用 Apollo 的 API 来丰富这些联系人。
  3. 然后将丰富后的信息保存回我们数据仓库中的另一个表。
def enrich_contact(self, postgres_connect_string, to_schema):
    pipeline = dlt.pipeline(pipeline_name='enrich_contact', destination='postgres', dataset_name=to_schema,
                            credentials=postgres_connect_string)

    @dlt.resource(write_disposition='merge', primary_key='email')
    def enriched_contact():
        with pipeline.sql_client() as psql:
            with psql.execute_query("select email from prioritized_contact") as cursor:
                emails = cursor.fetchall()

        for (email,) in emails:
            enriched = self.people_match(email)  # Call Apollo's "people/match" API
            yield enriched['person']

    print(pipeline.run(enriched_contact))

用于自助分析的建模

我们将丰富后的数据(例如组织规模和行业)添加到我们的客户和联系人模型中。对于组织规模,我们将数据分组为几个类别,以简化我们团队的分析。

, case
    when estimated_employees <= 50 then 'Micro'
    when estimated_employees <= 200 then 'Small'
    when estimated_employees <= 1000 then 'Medium'
    when estimated_employees <= 10000 then 'Enterprise'
    when estimated_employees > 10000 then 'Mega Enterprise'
  end as organization_size

在我们的联系人模型中,我们还添加了 left_company_at 以指示联系人何时离开客户组织。此字段使您可以轻松找出我们应该联系哪些组织,以便他们可以及时了解重要的产品沟通信息。

关于数据丰富的最终想法

丰富我们的数据已经被证明是有价值的。从丰富后的数据中获得的一个有趣的见解是,我们的客户来自从小微型到巨型的各种组织。我们的团队已经使用这些数据来更好地了解我们的客户并监控工作变动。

我们现在正在讨论如何将丰富用于其他目的,例如创建理想的客户画像,以最大限度地发挥我们的营销效果。

但丰富不是免费的,因此我们将继续评估我们相对于成本所获得的价值,并相应地进行迭代。我们希望这篇文章可以帮助您购买适合您需求的丰富服务。

您可能还喜欢

所有帖子
Maps data visualizations: best practices Image 2024年12月19日,发布于 分析与商业智能

地图数据可视化:最佳实践

了解如何创建有影响力的地图数据可视化,其中包含关于使用点地图、网格地图和区域地图来突出显示模式并做出数据驱动决策的技巧。

Alex Yarosh Portrait
Alex Yarosh

6 分钟阅读

How to visualize time-series data: best practices Image 2024年11月20日,发布于 分析与商业智能

如何可视化时间序列数据:最佳实践

了解时间序列数据以及如何将其可视化。包含最佳实践和方便的速查表。

Alex Yarosh Portrait
Alex Yarosh

3 分钟阅读

所有帖子
Close Form Button

订阅我们的新闻资讯

随时了解 Metabase 的更新和新闻。绝无垃圾邮件。