所有文章

2024 年 9 月 25 日，发表于 分析与商业智能

‧

阅读时间：5 分钟

我们如何丰富客户联系方式和组织数据

郑明

‧ 2024 年 9 月 25 日，发表于 分析与商业智能

‧ 5 分钟阅读

How we enriched customer contact and organization data Image

分享本文

已复制到剪贴板

我们希望获得更多关于我们收集的数据的上下文信息，因此我们考察了各种数据丰富服务。这些公司可以通过更多细节来为您的数据提供上下文。例如，给定一个域名，第三方丰富服务可以为您提供该域名关联的公司名称、其规模、行业等信息。

数据丰富是成长型公司乃至大型公司的典型做法。但在您寻找丰富服务之前，您应该明确需要解决（或实现）哪些问题或目标，而这些问题或目标可以通过数据丰富来解决。对于 Metabase 而言，我们希望丰富客户联系方式的原因有两个：

与客户保持联系。数据丰富可以提醒我们联系人的工作变动，这可能会影响我们的关系。例如，如果某个联系人在公司内部或外部调动了工作，我们可能希望向他们表示祝贺，并确保我们与接替关系的人员保持联系，以免重要的产品沟通信息丢失。
更好地了解组织规模和行业，这有助于我们根据这些细分市场面临的问题量身定制营销和产品工作，确保我们正在构建的 Metabase 能够解决这些问题。

服务提供商评估

令人惊讶的是，数据丰富服务提供商有很多，每个都有其优缺点。虽然我们考虑了各种 LinkedIn 数据导出提供商，但我们决定不使用它们，因为我们不应将这类数据存储在我们的数据仓库中。我们也没有评估 Clearbit，因为它不再作为独立服务提供。

总结：Apollo.io 为我们的用例提供了最佳的覆盖范围、定价和功能。

标准 / 提供商	领英销售导航	Crunchbase	Lusha	Apollo	CommonRoom
工作经历 / 领英个人资料	最佳可用，但仅限 UI 访问；API 访问受限	不可用	不可用	良好 / 看起来是最新数据	大部分良好，但缺少一些最近的工作变动
公司基本信息，例如行业规模、行业等	良好。搜索仅限 UI；API 访问受限	良好，但在 100 个最近的联系人中，覆盖率约为 70%（高/中）到 80%（低置信度）	尚可。在 100 个最近的联系人中，覆盖率约为 26%	通过域名匹配 100 个最近的联系人，覆盖率高达 80%，非常棒	似乎主要适用于公司规模，但行业信息不完整，在最近的 100 个联系人中，覆盖率约为 60%
人口统计信息，例如职位等	非常好 / 领英个人资料上的所有信息。搜索仅限 UI；API 访问受限	仅限于部分关键人物，如高管	尚可。在 100 个最近的联系人中，覆盖率约为 26%	对于 100 个最近的联系人，姓名覆盖率良好，为 60%；职位/历史记录覆盖率为 50%	是，但：1. 覆盖率有限，根据 100 个最近的联系人，组织覆盖率约为 60%，职位覆盖率约为 30%
导出到数据仓库	仅与 CRM（例如 Salesforce 或 HubSpot）集成，功能有限（因 CRM 而异）	企业版支持数据集下载。API 可以进行精确域名/名称和模糊搜索。每分钟 200 次调用，限制 1000 次	通过 UI 或 API 上传/下载 CSV	API 或 CSV (UI) 联系人丰富速度较慢，每次调用 0.5 秒——这意味着每 1 万条记录需要 1.4 小时。API 提供批量下载，每次 10 条	仅限企业版提供定期/自定义导出，否则通过 UI 手动导出。筛选/浏览屏幕上可见的任何字段都可以通过 UI 导出
成本	核心版：每人每年 960 美元；高级版（含 CRM 集成）：每人每年 1600 美元	API：每年 1 万美元，即时购买可享 7 折优惠。所有 300 万家以上公司的 CSV 导出：5 万美元，即时购买可享 5 折优惠	每年约 2 万至 2.5 万美元，用于 10 万个联系人	每月 400 美元，通过 API 丰富 1 万条记录。每条记录 4 美分。每月 3000 美元，丰富 10 万条记录。每条记录 3 美分。更多方案选择	有多种方案，从免费到企业版，根据联系人数量和功能而定：1. 免费版最多 500 个联系人 / 50 个组织 2. 初创版每月 625 美元，最多 3.5 万个联系人。3. 团队版每月 1250 美元，最多 10 万个联系人 4. 企业版采用自定义定价，包含导出到数据仓库功能。每年 5 万美元以上

持续数据丰富

选择了服务提供商后，我们使用 dlt 和 Apollo.io 的 API，按优先级每小时丰富新联系人——优先处理新联系人，然后再更新现有联系人，以此类推。

以下是 Python 代码片段，它实现了

从我们的数据仓库中获取优先联系人列表中的电子邮件地址。
调用 Apollo 的 API 来丰富这些联系人。
然后将丰富后的信息保存回我们数据仓库中的另一个表格。

def enrich_contact(self, postgres_connect_string, to_schema):
    pipeline = dlt.pipeline(pipeline_name='enrich_contact', destination='postgres', dataset_name=to_schema,
                            credentials=postgres_connect_string)

    @dlt.resource(write_disposition='merge', primary_key='email')
    def enriched_contact():
        with pipeline.sql_client() as psql:
            with psql.execute_query("select email from prioritized_contact") as cursor:
                emails = cursor.fetchall()

        for (email,) in emails:
            enriched = self.people_match(email)  # Call Apollo's "people/match" API
            yield enriched['person']

    print(pipeline.run(enriched_contact))

自助分析建模

我们将丰富后的数据（例如组织规模和行业）添加到我们的客户和联系人模型中。对于组织规模，我们将其分组为几个类别，以简化团队的分析。

, case
    when estimated_employees <= 50 then 'Micro'
    when estimated_employees <= 200 then 'Small'
    when estimated_employees <= 1000 then 'Medium'
    when estimated_employees <= 10000 then 'Enterprise'
    when estimated_employees > 10000 then 'Mega Enterprise'
  end as organization_size

在我们的联系人模型中，我们还添加了 left_company_at 字段，用于指示联系人何时离开客户组织。此字段使我们能够轻松找出应该联系哪些组织，以便他们及时了解重要的产品通讯。

关于数据丰富的最终思考

丰富我们的数据已被证明是有价值的。从丰富的数据中得出的一个有趣见解是，我们的客户来自微型到巨型组织的混合体。我们的团队已经利用这些数据更好地了解我们的客户并监控工作变动。

我们现在正在讨论如何将数据丰富用于其他目的，例如创建理想客户画像，以充分利用我们的营销工作。

但数据丰富并非免费，因此我们将继续评估我们所获得的价值与成本之间的关系，并进行相应的迭代。我们希望这篇帖子能帮助您找到适合您需求的丰富服务。

商业智能

嵌入式分析

文档

学习

我们如何丰富客户联系方式和组织数据

郑明

分享本文

服务提供商评估

持续数据丰富

自助分析建模

关于数据丰富的最终思考

您可能还喜欢

如何构建销售团队真正会用的销售仪表盘

Margaret Rimek

什么是嵌入式分析？

Alex Yarosh

商业智能

嵌入式分析

文档

学习

我们如何丰富客户联系方式和组织数据

郑明

分享本文

服务提供商评估

持续数据丰富

自助分析建模

关于数据丰富的最终思考

您可能还喜欢

如何构建销售团队真正会用的销售仪表盘

Margaret Rimek

什么是嵌入式分析？

Alex Yarosh

分析师每周技巧

获取可行的见解关于 AI 和数据的资讯，直接发送到您的收件箱

获取可行的见解
关于 AI 和数据的资讯，直接发送到您的收件箱