2024年9月25日,在 分析和商业智能

5 分钟阅读

我们如何丰富客户联系方式和组织数据

Max Zheng Portrait
Max Zheng
‧ 2024年9月25日,在 分析和商业智能

‧ 5 分钟阅读

How we enriched customer contact and organization data Image

我们希望为收集到的数据获取更多背景信息,因此我们寻找了数据丰富化服务。这些公司可以为您的数据提供更多详细的上下文。例如,给定一个域名,第三方丰富化服务可以提供该域名关联的公司名称、规模、行业等信息。

数据丰富化是成长型公司以及大型公司的常见做法。但在寻找丰富化服务之前,您应该明确要解决的问题(或要实现的目标),而丰富化可以提供帮助。对于 Metabase 而言,我们希望丰富客户联系人信息,主要有两个原因:

  1. 为了与客户保持联系。丰富化可以提醒我们联系人的职位变动,这可能会影响我们的关系。例如,如果联系人在公司内部或外部转换了工作,我们可能需要联系他们表示祝贺,并确保与接替该关系的人员保持联系,以免重要的产品沟通信息丢失。
  2. 为了更好地了解组织规模和行业,这有助于我们调整营销和产品策略,确保我们构建的 Metabase 能够解决这些细分市场面临的问题。

服务提供商评估

数据丰富化服务提供商的数量出人意料地多,每个都有其优缺点。虽然我们考虑了各种 LinkedIn 数据导出提供商,但我们决定不使用它们,因为我们不应在数据仓库中存储此类数据。我们也没有评估 Clearbit,因为它不再作为独立服务提供。

TL;DR: Apollo.io 为我们的用例提供了最佳覆盖范围、定价和功能。

标准 / 提供商 LinkedIn 销售导航 Crunchbase Lusha Apollo CommonRoom
工作经历 / LinkedIn 个人资料 最佳可用,但仅限 UI 访问;API 访问受限 不可用 不可用 良好 / 看起来是最新数据 大部分良好,但缺少一些近期职位变动
公司画像,例如行业规模、行业等 良好。仅限 UI 搜索;API 访问受限 良好,但对 100 个近期联系人的覆盖率约为 70%(高/中)到 80%(低置信度) 尚可。对 100 个近期联系人的覆盖率约为 26% 通过域名匹配对 100 个近期联系人的覆盖率高达 80%,非常出色 似乎主要提供公司规模信息,但行业信息不完整,对 100 个近期联系人的覆盖率约为 60%
人口统计信息,例如职位等 出色 / LinkedIn 个人资料上的所有信息。仅限 UI 搜索;API 访问受限 仅限于少数关键人物,如高管 尚可。对 100 个近期联系人的覆盖率约为 26% 良好,对 100 个近期联系人的姓名覆盖率为 60%,职位/历史覆盖率为 50% 有,但:1. 基于 100 个近期联系人,组织覆盖率约为 60%,职位覆盖率约为 30%
导出到数据仓库 仅与 CRM(如 Salesforce 或 HubSpot)集成,功能有限(因 CRM 而异) 企业版支持数据集下载。API 可进行精确域名/名称和模糊搜索。每分钟 200 次调用,上限 1000 次 通过 UI 或 API 进行 CSV 上传/下载 API 或 CSV (UI) 联系人丰富化速度较慢,每次调用 0.5 秒——即每 1 万条记录需要 1.4 小时。API 提供批量下载,每次 10 条 仅企业版支持定期/自定义导出,否则需通过 UI 手动导出。筛选/浏览界面上可见的任何字段都可以通过 UI 导出
成本 核心版:每人每年 960 美元 集成 CRM 的高级版:每人每年 1600 美元 API:每年 1 万美元,即时购买可享 30% 折扣。CSV 导出所有 300 万+ 公司:5 万美元,即时购买可享 50% 折扣 10 万联系人每年约 2 万至 2.5 万美元 通过 API 丰富 1 万条记录每月 400 美元。每条记录 4 美分。丰富 10 万条记录每月 3000 美元。每条记录 3 美分。更多套餐选项 从免费版到企业版有多种套餐,根据联系人数量和功能划分:1. 免费版最多 500 个联系人 / 50 个组织 2. 基础版每月 625 美元,最多 3.5 万个联系人。3. 团队版每月 1250 美元,最多 10 万个联系人 4. 企业版定制定价,包含导出到数据仓库功能。每年 5 万美元以上

持续丰富化

选定服务提供商后,我们使用 dltApollo.io 的 API 每小时更新新的联系人,并根据优先级进行处理——优先处理新联系人,然后更新现有联系人,以此类推。

这是一个 Python 代码片段,它将:

  1. 从我们的数据仓库中获取优先级联系人列表的电子邮件
  2. 调用 Apollo 的 API 来丰富这些联系人信息。
  3. 然后将丰富后的信息保存回我们的数据仓库中的另一个表中。
def enrich_contact(self, postgres_connect_string, to_schema):
    pipeline = dlt.pipeline(pipeline_name='enrich_contact', destination='postgres', dataset_name=to_schema,
                            credentials=postgres_connect_string)

    @dlt.resource(write_disposition='merge', primary_key='email')
    def enriched_contact():
        with pipeline.sql_client() as psql:
            with psql.execute_query("select email from prioritized_contact") as cursor:
                emails = cursor.fetchall()

        for (email,) in emails:
            enriched = self.people_match(email)  # Call Apollo's "people/match" API
            yield enriched['person']

    print(pipeline.run(enriched_contact))

自助式分析建模

我们将丰富后的数据(例如组织规模和行业)添加到我们的客户和联系人模型中。对于组织规模,我们将其分组为几个类别,以简化团队的分析。

, case
    when estimated_employees <= 50 then 'Micro'
    when estimated_employees <= 200 then 'Small'
    when estimated_employees <= 1000 then 'Medium'
    when estimated_employees <= 10000 then 'Enterprise'
    when estimated_employees > 10000 then 'Mega Enterprise'
  end as organization_size

在我们的联系人模型中,我们还添加了 left_company_at 字段,以指示联系人何时离开了客户组织。此字段可以轻松地帮助我们找出应联系哪些组织,以便他们能够及时了解重要的产品通讯。

数据丰富化的最终思考

丰富我们的数据已被证明具有价值。从丰富后的数据中,一个有趣的发现是我们的客户来自从微型到超大型的各种组织。我们的团队已经使用这些数据更好地了解客户并监控职位变动。

我们现在正在讨论如何将数据丰富化用于其他目的,例如创建理想客户画像,以充分发挥我们的营销努力。

但数据丰富化并非免费,因此我们将继续评估其价值与成本的关系,并相应地进行迭代。我们希望这篇博文能帮助您找到符合您需求的丰富化服务。

您可能还会喜欢

所有文章
什么是嵌入式分析?图片 2025年5月15日,在 分析和商业智能

什么是嵌入式分析?

嵌入式分析意味着让您的用户可以直接在您的产品内部访问图表、指标和报告,这样他们无需离开您的应用程序或依赖他人提供答案,即可探索和处理自己的数据。

Alex Yarosh Portrait
Alex Yarosh

11 分钟阅读

仪表盘的 5 大常见失败(以及如何修复)图片 2025年4月25日,在 分析和商业智能

仪表盘的 5 大常见失败(以及如何修复)

仪表盘旨在指导决策,而非制造困惑。在本指南中,我们将介绍五个常见陷阱以及如何修复它们。

Abed Habli Portrait
Abed Habli

7 分钟阅读

所有文章
© . All rights reserved.