Sql-Server
多個字元串替換
我有一個替換地圖表
CREATE TABLE #ReplacementMap (old NVARCHAR(10), new NVARCHAR(10)) INSERT INTO #ReplacementMap VALUES ('A',5) INSERT INTO #ReplacementMap VALUES ('C',9) INSERT INTO #ReplacementMap VALUES ('D',4)
和一個字元串表
CREATE TABLE #String1 (name NVARCHAR(50), string1 NVARCHAR(100)) INSERT INTO #String1 VALUES ('John','AB') INSERT INTO #String1 VALUES ('Kyle','ABC') INSERT INTO #String1 VALUES ('Steven','ABCD')
其中我需要根據替換映射表替換字元串位,以便得到以下結果:
John,5B Kyle,5B9 Steven,5B94
我目前的解決方案是嵌套
REPLACE
函式,但由於我需要進行大量替換,這不是一種優雅的方式。
SQLCLR 函式可用於模擬SQL Server 2017 中新增的
TRANSLATE
Transact-SQL 函式。函式定義
CREATE ASSEMBLY [Translate] AUTHORIZATION [dbo] FROM dbo].[Translate] ( @Input nvarchar(4000), @Find nvarchar(4000), @Replace nvarchar(4000) ) RETURNS nvarchar(4000) AS EXTERNAL NAME [Translate].[UserDefinedFunctions].[Translate];
用法
SELECT S.[name], S.string1, Result = dbo.Translate(S.string1, N'ACD', N'594') FROM #String1 AS S;
╔════════╦═════════╦════════╗ ║ name ║ string1 ║ Result ║ ╠════════╬═════════╬════════╣ ║ John ║ AB ║ 5B ║ ║ Kyle ║ ABC ║ 5B9 ║ ║ Steven ║ ABCD ║ 5B94 ║ ╚════════╩═════════╩════════╝
這個簡單的展示實現使用區分大小寫的比較。
原始碼
using Microsoft.SqlServer.Server; using System; using System.Data.SqlTypes; public partial class UserDefinedFunctions { [SqlFunction( DataAccess = DataAccessKind.None, IsDeterministic = true, IsPrecise = true, SystemDataAccess = SystemDataAccessKind.None )] [return: SqlFacet(IsFixedLength = false, IsNullable = false, MaxSize = 4000)] public static SqlChars Translate ( [SqlFacet(IsFixedLength = false, IsNullable = false, MaxSize = 4000)] SqlChars Input, [SqlFacet(IsFixedLength = false, IsNullable = false, MaxSize = 4000)] SqlChars Find, [SqlFacet(IsFixedLength = false, IsNullable = false, MaxSize = 4000)] SqlChars Replace ) { if (Input.IsNull || Find.IsNull || Replace.IsNull) { // Return unchanged input for any NULL parameters return Input; } if (Find.Length != Replace.Length) { throw new ArgumentException("Find and Replace parameters must have the same length."); } // For each character in the input string for (int i = 0; i < Input.Length; i++) { // For each character in the Find string for (int j = 0; j < Find.Length; j++) { // If the character matches... if (Input[i] == Find[j]) { // ...replace it Input[i] = Replace[j]; } } } return Input; } }
這也可以使用遞歸 SQL 來完成,儘管我不能說這樣做是否是個好主意。我確實
ID
在您的替換地圖表中添加了一列。為了測試我生成了 456976 個四個字元串的程式碼:CREATE TABLE #ReplacementMap ( ID INT NOT NULL IDENTITY (1, 1), old NVARCHAR(10), new NVARCHAR(10), PRIMARY KEY (ID) ); INSERT INTO #ReplacementMap VALUES ('A',5); INSERT INTO #ReplacementMap VALUES ('C',9); INSERT INTO #ReplacementMap VALUES ('D',4); CREATE TABLE #String1 ( ID INT NOT NULL IDENTITY (1, 1), string1 NVARCHAR(100) ); WITH ALL_LETTERS AS ( SELECT distinct CHAR(number) LETTER FROM master..spt_values WHERE number >= 65 AND number <= 90 ) INSERT INTO #String1 WITH (TABLOCK) SELECT a1.LETTER + a2.LETTER + a3.LETTER + a4.LETTER FROM ALL_LETTERS a1 CROSS JOIN ALL_LETTERS a2 CROSS JOIN ALL_LETTERS a3 CROSS JOIN ALL_LETTERS a4;
這是進行翻譯的程式碼:
WITH rec_cte AS ( SELECT s.ID , REPLACE(s.string1, rm.old, rm.new) new_string1 , 1 replace_id FROM #String1 s INNER JOIN #ReplacementMap rm ON rm.ID = 1 UNION ALL SELECT s.ID , REPLACE(s.new_string1, rm.old, rm.new) new_string1 , replace_id + 1 FROM rec_cte s INNER JOIN #ReplacementMap rm ON rm.ID = replace_id + 1 ) SELECT ID, new_string1 FROM rec_cte WHERE replace_id = (SELECT COUNT(*) FROM #ReplacementMap);
假設您有 S 行 in
#String1
和 R 行 in#ReplacementMap
。我們對錶中的每一行進行#ReplacementMap
連接,過濾到下一行,然後REPLACE()
使用該行。#ReplacementMap
一旦在SXR 行的完整結果集中沒有更多行,就會返回。這被子查詢過濾到最終的翻譯。該程式碼將執行 SXRREPLACE()
操作和 R + 1 連接到單行結果集,以及一些內部 tempdb 操作。只要您的替換字元串少於 101 個,這應該無需任何修改即可工作。該程式碼的執行似乎與 Adán Bucio 發布的解決方案類似。在我的機器上,這個查詢在大約 10 秒內完成,他的解決方案在 20 秒內完成。但是,您不應該在此基礎上選擇您的解決方案。您應該使用您最熟悉的任何程式碼,只要它滿足您的響應時間要求。
請注意,SQL Server 2017 有一個內置函式可以讓這種操作變得微不足道:TRANSLATE。