如何将存储为文本的项目尺寸/测量值从列中提取到预先存在的列中?我正在处理的数据在维度数据在每列中的位置及其格式方面没有太多一致性。
示例:
索引 | 物品描述 |
---|---|
1 | 面板96H |
2 | 72W沙发 |
3 | 桌子 18x36 角 |
4 | 18"x20" 奥斯曼 |
5 | 桌子24英寸 |
6 | 海豹18' |
7 | 储物柜 48 英寸宽 * 16 英寸深 * 16 英寸高/抽屉 |
8 | 82.7 英寸宽 x 47/2 英寸高 x 0.4 英寸深 |
9 | 休息室 48 英寸宽 |
如果您能帮助我解决这个问题,我将不胜感激;我目前不知道如何解决这个问题。
*编辑:以防文本表格无法正确显示
通过 Python 使用正则表达式是一个不错的选择。这里有一个建议,使用 Excel 表单 Microsoft 365 中提供的 REGEXEXTRACT 函数 - Microsoft 支持:
=MAP(B2:B10, LAMBDA(a, CONCAT( REGEXEXTRACT(a,
"\d+([./]\d+)?['""]?[WHD]?(\s*[x*]\s*)?",
1))))
图案 | 要匹配 |
---|---|
|
带有可选小数或分数的数字 |
|
(可选)英尺或英寸 |
|
(可选)W、H 或 D |
|
(可选)x 或 * 之间 |