人工智能 (AI) 和机器学习 (ML) 已从新概念迅速发展成为品牌营销人员工具包中的必备组件。Salesforce报告称,68% 的营销人员表示他们拥有完整定义的 AI 策略,高于 2021 年的 60% 和 2020 年的 57%。它是预测模型、活动个性化、 CX 优化以及几乎所有其他营销方面的关键部分。
但人工智能也有其缺点,正如许多
品牌多年来发现的那样。2019 年,一位软件开发人 泰国数据 员发现Apple Card背后的算法本质上是性别歧视的。同年,金融科技行业因 抵押贷款 和 房屋再融资中歧视 有色人种而受到强烈反对。 虽然这两起事件表面上没有什么共同之处,但它们的根源却是一样的——数据偏见。
那么,什么是数据偏见?如何避免成为连两大科技巨头都难以解决的问题的牺牲品?答案是:认识导致数据偏见的原因,并在其发生之前加以预防。
数据偏见无处不在
数据偏差的一种表现形式是,当你使用不能正确代表其预期用途的数据集来训练机器学习算法时。例如,如果你在营销奢侈烈酒,但只使用反映啤酒饮用者行为的数据来训练你的人工智能,那么你最终会得到严重偏差和不准确的结果。
为了避免这些问题,您需要了解数据偏差的类型及其产生 系统只能提供部分信息因此 的原因。虽然偏差会以各种细微的方式潜入您的数据,但以下是最常见的七种形式:
1. 选择偏差:与我们之前的例子一
样,当用于训练算法的数据集不够大或不能正确代表总体时,就会出现选择偏差。
2. 人口偏见:当用于训练算法的数据严重偏向于人口的某个子集时,就会发 以及如何避免 生人口偏见。种族偏见就是一个常见的例子,视觉识别算法使用白种人的视频或图像进行训练,然后无法正确检测肤色较深的人。
3. 测量偏差:使用未经准确测量或评
估的数据来训练算法,最终会导致测量偏差。如果您的品牌销售可在 Windows 和 macOS 上运行的软件,但您只使用 Windows 用户的数据来训练 ML 算法,那么您就引入了测量偏差。
4. 回忆偏差:回忆偏差是一种特定形式的测量偏差,其中不一致和主观的数 台湾数据库 值会导致数据差异。例如,如果你问一组客户过去一个月他们看到你品牌广告的频率,他们会很难给出一个确切的数字。相反,他们会估计频率——通常是错误的——导致数据偏差。
5. 关联偏差:关联偏差是指算
法拾取偶然发生的关联并将其视为事实。想象一下,使用一个训练数据集,其中只有男性购买黑色汽车,只有女性购买白色汽车。算法会错误地认为女性永远不会购买黑色汽车,因为数据反映了这种偏差。
6. 观察者偏见:观察者偏见又称为确认偏见,是指你有意或无意地将自己的观点或愿望强加于数据。例如,如果你希望自己的品牌能够吸引尽可能多的受众,你可能会下意识地歪曲数据以反映这一结果。
7. 排除偏差:清理数据和移除异常值是准备训练算法的重要步骤。但是,如果你删除一些你认为无关紧要的重要信息,则可能会引入排除偏差。如果你的绝大多数客户都是美国人,你可能会倾向于排除其他国家的数据。但如果英国客户的消费额是美国客户的两倍呢?这种排除偏差可能会让你的品牌蒙受损失。
数据偏差的问题
数据偏差本身就很糟糕,但其后
续影响则更糟糕。俗话说,“垃圾进,垃圾 以及如何避免 出”。数据偏差会影响从广告活动设置和广告购买到成本分析等所有方面,从而决定是保留还是取消某个项目。事实上,Forrester Consulting 的一项调查的受访者估计,由于数据质量不佳,他们浪费了超过 20%的营销预算。
对于品牌营销人员来说,数据偏见可能会通过以下几种具体方式造成严重破坏:
错失良机:数字世界瞬息万变,您不能基于有偏见的数据做出决策。这可能会导致您错失转化、追加销售和留存的机会,因为您和您的团队基于有缺陷的见解开展业务。
扭曲的客户旅程洞察:了解客户的旅程对于改善他们对您的品牌的体验至关重要。深入研究构成客户旅程的无数接触点已经足够复杂,但用错误的数据扭曲这一过程将使您无法准确满足用户的需求。
营销活动效果不佳:提高投资
回报率是营销人员面临的持续挑战。当您根据有缺陷的见解和不正确的假设进行优化和调整时,有偏见的数据只会使情况变得更糟。
合规违规:遵守GDPR和其他隐私法规已经是一项挑战,而 AI 可能会使情况更加复杂。GDPR 的关键组成部分之一赋予消费者特定权利,让他们决定如何使用其数据进行自动分析或决策。如果您的自动化系统由于数据偏差而错误地分析消费者,您将面临巨额罚款。
加剧组织瓶颈:营销部门往往只能依靠 IT 或数据科学家提供信息。当数据偏差悄然出现时,数据科学家需要做更多工作来清理,您获取所需数据的时间也会因此延长。
如何预防和减轻数据偏差
数据偏见是品牌面临的一大问题。尤其是当营销人员越来越依赖预测 以及如何避免 算法和复杂的人工智能分析工具时。那么,如何避免数据偏见的危害,并在数据偏见出现时解决它呢?
您可以实施多种流程和实践:
利用您知道可靠的第一方数据和其他来源。在隐私至上的世界中,您不能依赖第三方 cookie 和数据。
定期审核您的 AI 和 ML 算法。它们是否按预期运行?您是否以最佳方式利用它们?
注重遵守隐私法规。隐私法每年都在变得更加严格。确保您的系统保护客户的数据,保护您免受巨额罚款,并确保您将干净、可用的信息输入算法和分析工具。
将信号与噪音区分开来。您的客户
将生成海量数据,包括数十亿个接触点,但并非所有数据都有价值。确定哪些数据有用,然后忽略噪音。
让整个组织保持一致。让营销人员能够处理数据对于提高组织速度大有裨益,但不要忽视数据科学家可以提供的洞察力。定期安排部门间会议,确保每个人都拥有所需的资源,并确保尽可能高效地生成和处理数据。
投资实时分析。等待月度报告发现数据偏差扭曲了您的大规模营销活动可能是一个严重的错误。实时跟踪正在发生的事情,这样您就可以在问题发展时发现问题,修复它们,并努力确定根本原因。
为什么消除数据偏差很重要
消除数据偏见可能是一个艰巨且不完美的过程。您甚至可能想知道为什么要费心去做。这是一项艰巨的任务,但忽视它的代价可能更大。无论是高额的隐私违规罚款还是不断减少的投资回报率,数据偏见都可能损害您的品牌。
消除偏见需要成为品牌数据战略的一部分,而 Scuba 的客户智能平台可以提供帮助:
统一您品牌的所有数据,以便您可以处理它而不会遗漏任何重要信息。
端到端的隐私控制确保您的用户数据的安全。
交互式实时仪表板可让您持续洞察客户的旅程。
只需很少的技术知识即可执行复杂查询的工具。
在整个组织内实现数据民主化,以便每个部门都可以专注于他们最擅长的领域。
轻松让客户数据流入系统,以确保 AI 算法始终使用新鲜、准确的数据。
数据去偏是一个持续的过程,而不是一次性的检查,Scuba 可以使其尽可能轻松。