我有 csv 文件中的客户数据,其中有一列电话号码。我需要清理电话号码字段。我得到的电话号码列值如下
98377657(有效电话号码) 6578 8765(有效电话号码) 467584(丢弃) 5674839(丢弃)
我想使用长度恰好为 8 个字符的电话号码,因此有效输出为 98377657 6578 8765 我如何在 Azure 数据工厂中实现这一目标。请各位帮忙指点一下
清理和验证电话号码数据
基于您希望每个电话号码在输出中作为单独的行的假设。您应该能够使用数据流和派生列转换来完成此操作。
您可以使用 csv 作为源,然后进行派生列转换来创建数据流。您可以为该列命名任何您想要的名称,但是表达式部分中的代码
iif(length(trim(phoneNumber)) == 8, phoneNumber, null)
应该能够起到清理的作用(当然,用phoneNumber 替换您的电话号码列的名称)。
它将检查电话号码的长度(不包括空格),如果长度正好为 8,则返回电话号码,否则返回 null。从那里,您将需要连接到接收器(接收器连接到您所需的输出)。
请记住,这只会清理指定形式的数据,数据集中的任何字母数字也将通过此过滤器(当然前提是长度为 8)。
希望这有帮助!