注意:这与数据库设计无关,也与 GUID 的一般使用无关。这是关于在 Microsoft SQL 服务器上确定性地为测试数据创建此类 GUID。
我们正在将数据库从整数标识符迁移到 uniqueidentifier 数据类型。
出于测试目的,我们希望将测试数据集迁移到已知的 GUID 值,确定性地基于我们以前的整数值
UPDATE Unit
SET UnitGuid = NEWID(UnitId)
显然这不会立即起作用。 如何使用UnitId创建确定性GUID?
停止从“字符串”角度思考问题。
int
由 4 个字节组成。 uniqueidentifier
由 16 个字节组成。您可以轻松地获取 12 个固定字节并将 int
中的四个字节附加到这些字节的末尾,并获得适用于所有 int
值的解决方案:
declare @Unit table
(
UniqueColumn UNIQUEIDENTIFIER DEFAULT NEWID(),
Characters VARCHAR(10),
IntegerId int
)
-- Add *3* data rows
INSERT INTO @Unit(Characters, IntegerId) VALUES ('abc', 1111),('def', 2222),('ghi',-17)
-- Deterministically creates a uniqueidentifier value out of an integer value.
DECLARE @GuidPrefix binary(12) = 0xefbeadde0000000000000000
UPDATE @Unit
SET UniqueColumn = CONVERT(uniqueidentifier,@GuidPrefix + CONVERT(binary(4),IntegerId))
-- Check the result
SELECT * FROM @Unit
结果:
UniqueColumn Characters IntegerId
------------------------------------ ---------- -----------
DEADBEEF-0000-0000-0000-000000000457 abc 1111
DEADBEEF-0000-0000-0000-0000000008AE def 2222
DEADBEEF-0000-0000-0000-0000FFFFFFEF ghi -17
(由于各种原因,我们必须以与将
uniqueidentifier
显示为字符串时默认使用的顺序不同的顺序提供前四个字节,这就是为什么如果我们想要显示 DEADBEEF
,我们必须以 efbeadde
) 启动我们的二进制文件
当然,还要插入常见的警告,即如果您正在创建 guid/唯一标识符,但没有使用其中一种指定的方法来生成它们,那么您就不能假设任何有关唯一性的常见保证。
您可以创建键盘映射表:
CREATE TABLE tab_map(id_old INT PRIMARY KEY, guid UNIQUEIDENTIFIER);
INSERT INTO tab_map(id_old, guid)
SELECT id, NEWID()
FROM src_table;
之后,您可以使用简单的查询或使用函数包装:
SELECT guid
FROM tab_map
WHERE id_old = ?
我最终自己解决了这个问题。这是我的解决方案供将来参考:
我以
deadbeef-0000-0000-0000-
的形式创建 GUID 的前缀部分,然后向其附加 Id 列整数值的“字符串化”、零填充版本,如 000000000001
,这将导致
DEADBEEF-0000-0000-0000-000000000001
在此示例中。
以下是对整个表执行此操作的 SQL 命令:
-- Deterministically creates a uniqueidentifier value out of an integer value.
DECLARE @GuidPrefix nvarchar(max) = N'deadbeef-0000-0000-0000-'; -- without the last 12 digits
UPDATE Unit
SET UniqueColumn =
(SELECT @GuidPrefix + RIGHT('000000000000' + CAST(IntegerId AS NVARCHAR (12)), 12 ) AS NUMBER_CONVERTED)
警告:
这是一个完整的工作示例:
-- Create an example table with random GUID's
CREATE TABLE Unit
(
UniqueColumn UNIQUEIDENTIFIER DEFAULT NEWID(),
Characters VARCHAR(10),
IntegerId int
)
-- Add 2 data rows
INSERT INTO Unit(Characters, IntegerId) VALUES ('abc', 1111)
INSERT INTO Unit(Characters, IntegerId) VALUES ('def', 2222)
-- Deterministically creates a uniqueidentifier value out of an integer value.
DECLARE @GuidPrefix nvarchar(max) = N'deadbeef-0000-0000-0000-'; -- without the last 12 digits
UPDATE Unit
SET UniqueColumn =
(SELECT @GuidPrefix + RIGHT('000000000000' + CAST(IntegerId AS NVARCHAR (12)), 12 ) AS NUMBER_CONVERTED)
-- Check the result
SELECT * FROM Unit
结果:
UniqueColumn Characters IntegerId
--------------------------------------- ---------- ---------
DEADBEEF-0000-0000-0000-000000001111 abc 1111
DEADBEEF-0000-0000-0000-000000002222 def 2222
如果您想要确定性的 GUID,但仍然看起来是随机的,您可以使用以下方法;
声明 @str_seed VARCHAR(10) = '测试'
声明@int_seed INT = 12
选择 CAST(HASHBYTES('SHA2_512',@str_seed) 作为唯一标识符)
选择 CAST(HASHBYTES('SHA2_512',CAST(@int_seed as varbinary)) 作为唯一标识符)