SQL Server: Torne todo o caso UPPER em Caso Apropriado / Caso de Título

Eu tenho uma tabela que foi importada como todas as maiúsculas e gostaria de transformá-lo em caso adequado. Que roteiro algum de vocês usou para completar isso?

Aqui está um UDF que fará o truque …

create function ProperCase(@Text as varchar(8000)) returns varchar(8000) as begin declare @Reset bit; declare @Ret varchar(8000); declare @i int; declare @c char(1); if @Text is null return null; select @Reset = 1, @i = 1, @Ret = ''; while (@i < = len(@Text)) select @c = substring(@Text, @i, 1), @Ret = @Ret + case when @Reset = 1 then UPPER(@c) else LOWER(@c) end, @Reset = case when @c like '[a-zA-Z]' then 0 else 1 end, @i = @i + 1 return @Ret end 

Você ainda terá que usá-lo para atualizar seus dados.

Esta function:

  • “Casos apropriados” todas as palavras “maiúsculas” delimitadas por espaço em branco
  • deixa “palavras minúsculas” sozinhas
  • funciona corretamente mesmo para alfabetos não ingleses
  • é portável na medida em que não usa resources sofisticados de versões recentes do servidor SQL
  • pode ser facilmente alterado para usar NCHAR e NVARCHAR para suporte a unicode, bem como qualquer comprimento de parâmetro que você achar adequado
  • definição de espaço em branco pode ser configurada
 CREATE FUNCTION ToProperCase(@string VARCHAR(255)) RETURNS VARCHAR(255) AS BEGIN DECLARE @i INT -- index DECLARE @l INT -- input length DECLARE @c NCHAR(1) -- current char DECLARE @f INT -- first letter flag (1/0) DECLARE @o VARCHAR(255) -- output string DECLARE @w VARCHAR(10) -- characters considered as white space SET @w = '[' + CHAR(13) + CHAR(10) + CHAR(9) + CHAR(160) + ' ' + ']' SET @i = 1 SET @l = LEN(@string) SET @f = 1 SET @o = '' WHILE @i < = @l BEGIN SET @c = SUBSTRING(@string, @i, 1) IF @f = 1 BEGIN SET @o = @o + @c SET @f = 0 END ELSE BEGIN SET @o = @o + LOWER(@c) END IF @c LIKE @w SET @f = 1 SET @i = @i + 1 END RETURN @o END 

Resultado:

 dbo.ToProperCase('ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ') ----------------------------------------------------------------- All Upper Case and Some lower Ää Öö Üü Éé Øø Cc Ææ 
 UPDATE titles SET title = UPPER(LEFT(title, 1)) + LOWER(RIGHT(title, LEN(title) - 1)) 

http://sqlmag.com/t-sql/how-title-case-column-value

Se você pode habilitar o CLR no SQL Server (requer 2005 ou posterior), então você pode criar uma function CLR que usa a function interna TextInfo.ToTitleCase que permitiria criar uma maneira de fazer isso em apenas alguns linhas de código.

Estou um pouco atrasado no jogo, mas acredito que isso é mais funcional e funciona com qualquer idioma, incluindo Russo, Alemão, Tailandês, Vietnamita, etc. Ele fará qualquer coisa maiúscula depois de ‘ou – ou. ou (ou) ou espaço (obviamente :).

 CREATE FUNCTION [dbo].[fnToProperCase]( @name nvarchar(500) ) RETURNS nvarchar(500) AS BEGIN declare @pos int = 1 , @pos2 int if (@name <> '')--or @name = lower(@name) collate SQL_Latin1_General_CP1_CS_AS or @name = upper(@name) collate SQL_Latin1_General_CP1_CS_AS) begin set @name = lower(rtrim(@name)) while (1 = 1) begin set @name = stuff(@name, @pos, 1, upper(substring(@name, @pos, 1))) set @pos2 = patindex('%[- ''.)(]%', substring(@name, @pos, 500)) set @pos += @pos2 if (isnull(@pos2, 0) = 0 or @pos > len(@name)) break end end return @name END GO 

Eu sei que isso é tarde post neste segmento, mas vale a pena olhar. Essa function funciona para mim sempre. Então pensei em compartilhá-lo.

 CREATE FUNCTION [dbo].[fnConvert_TitleCase] (@InputString VARCHAR(4000) ) RETURNS VARCHAR(4000) AS BEGIN DECLARE @Index INT DECLARE @Char CHAR(1) DECLARE @OutputString VARCHAR(255) SET @OutputString = LOWER(@InputString) SET @Index = 2 SET @OutputString = STUFF(@OutputString, 1, 1,UPPER(SUBSTRING(@InputString,1,1))) WHILE @Index < = LEN(@InputString) BEGIN SET @Char = SUBSTRING(@InputString, @Index, 1) IF @Char IN (' ', ';', ':', '!', '?', ',', '.', '_', '-', '/', '&','''','(') IF @Index + 1 <= LEN(@InputString) BEGIN IF @Char != '''' OR UPPER(SUBSTRING(@InputString, @Index + 1, 1)) != 'S' SET @OutputString = STUFF(@OutputString, @Index + 1, 1,UPPER(SUBSTRING(@InputString, @Index + 1, 1))) END SET @Index = @Index + 1 END RETURN ISNULL(@OutputString,'') END 

Teste de chamadas:

 select dbo.fnConvert_TitleCase(Upper('ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ')) as test select dbo.fnConvert_TitleCase(upper('Whatever the mind of man can conceive and believe, it can achieve. – Napoleon hill')) as test 

Resultados:

insira a descrição da imagem aqui

Se você estiver no SSIS importando dados que misturaram maiúsculas e precisou fazer uma pesquisa em uma coluna com o caso apropriado, notará que a pesquisa falha onde a origem é mesclada e a fonte de pesquisa é adequada. Você também perceberá que não é possível usar as funções direita e esquerda no SSIS do SQL Server 2008r2 para obter colunas derivadas. Aqui está uma solução que funciona para mim:

 UPPER(substring(input_column_name,1,1)) + LOWER(substring(input_column_name, 2, len(input_column_name)-1)) 

O link que eu postei acima é uma ótima opção que aborda a questão principal: que nunca podemos contabilizar de forma programática todos os casos (Smith-Jones, von Haussen e John Smith MD), pelo menos não de uma maneira elegante. Tony introduz o conceito de um caractere de exceção / quebra para lidar com esses casos. De qualquer forma, baseando-se na ideia da Cervo (superior a todos os caracteres inferiores precedidos pelo espaço), as instruções de substituição podem ser colocadas em uma única tabela baseada em substituição. Realmente, qualquer combinação de caracteres low / up poderia ser inserida em @alpha e a instrução não mudaria:

 declare @str nvarchar(8000) declare @alpha table (low nchar(1), up nchar(1)) set @str = 'ALL UPPER CASE and SOME lower ÄÄ ÖÖ ÜÜ ÉÉ ØØ ĈĈ ÆÆ' -- stage the alpha (needs number table) insert into @alpha -- AZ / az select nchar(n+32), nchar(n) from dbo.Number where n between 65 and 90 or n between 192 and 223 -- append space at start of str set @str = lower(' ' + @str) -- upper all lower case chars preceded by space select @str = replace(@str, ' ' + low, ' ' + up) from @Alpha select @str 

Aqui está uma versão que usa uma tabela de seqüência ou números, em vez de um loop. Você pode modificar a cláusula WHERE para ajustar suas regras pessoais para quando converter um caractere em maiúscula. Eu acabei de include um conjunto simples que maiúscula qualquer letra que é precedida por uma não letra com a exceção de apóstrofos. Isso significa que o 123apple teria uma correspondência no “a” porque “3” não é uma letra. Se você quiser apenas espaço em branco (espaço, tabulação, retorno de carro, alimentação de linha), você pode replace o padrão '[^az]' por '[' + Char(32) + Char(9) + Char(13) + Char(10) + ']' .


 CREATE FUNCTION String.InitCap( @string nvarchar(4000) ) RETURNS nvarchar(4000) AS BEGIN -- 1. Convert all letters to lower case DECLARE @InitCap nvarchar(4000); SET @InitCap = Lower(@string); -- 2. Using a Sequence, replace the letters that should be upper case with their upper case version SELECT @InitCap = Stuff( @InitCap, n, 1, Upper( SubString( @InitCap, n, 1 ) ) ) FROM ( SELECT (1 + n1.n + n10.n + n100.n + n1000.n) AS n FROM (SELECT 0 AS n UNION SELECT 1 UNION SELECT 2 UNION SELECT 3 UNION SELECT 4 UNION SELECT 5 UNION SELECT 6 UNION SELECT 7 UNION SELECT 8 UNION SELECT 9) AS n1 CROSS JOIN (SELECT 0 AS n UNION SELECT 10 UNION SELECT 20 UNION SELECT 30 UNION SELECT 40 UNION SELECT 50 UNION SELECT 60 UNION SELECT 70 UNION SELECT 80 UNION SELECT 90) AS n10 CROSS JOIN (SELECT 0 AS n UNION SELECT 100 UNION SELECT 200 UNION SELECT 300 UNION SELECT 400 UNION SELECT 500 UNION SELECT 600 UNION SELECT 700 UNION SELECT 800 UNION SELECT 900) AS n100 CROSS JOIN (SELECT 0 AS n UNION SELECT 1000 UNION SELECT 2000 UNION SELECT 3000) AS n1000 ) AS Sequence WHERE n BETWEEN 1 AND Len( @InitCap ) AND SubString( @InitCap, n, 1 ) LIKE '[az]' /* this character is a letter */ AND ( n = 1 /* this character is the first `character` */ OR SubString( @InitCap, n-1, 1 ) LIKE '[^az]' /* the previous character is NOT a letter */ ) AND ( n < 3 /* only test the 3rd or greater characters for this exception */ OR SubString( @InitCap, n-2, 3 ) NOT LIKE '[az]''[az]' /* exception: The pattern ' should not capatolize the letter following the apostrophy */ ) -- 3. Return the modified version of the input RETURN @InitCap END 

Faria sentido manter uma pesquisa de exceções para cuidar de von Neumann, McCain, DeGuzman e Johnson-Smith.

Eu sei que o diabo está nos detalhes (especialmente no que diz respeito aos dados pessoais das pessoas), e que seria muito bom ter nomes apropriadamente capitalizados, mas o tipo de problema acima é por que o pragmático, consciente do tempo entre nós usa o seguinte :

SELECT UPPER('Put YoUR O'So oddLy casED McWeird-nAme von rightHERE here')

Na minha experiência, as pessoas estão bem vendo o SEU NOME … mesmo quando está na metade de uma frase.

Consulte: os russos usaram um lápis!

Eu acho que você vai achar que o seguinte é mais eficiente:

 IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE( @str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z') RETURN RIGHT(@str, LEN(@str) - 1) END GO 

A instrução replace poderia ser recortada e colada diretamente em uma consulta SQL. É ultra feio, no entanto, substituindo @str com a coluna que você está interessado, você não vai pagar um preço por um cursor implícito como você vai com os udfs assim postados. Acho que mesmo usando minha UDF é muito mais eficiente.

Ah, e em vez de gerar a instrução replace à mão, use isto:

 -- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000) SET @x = 0 SET @sql = '@str' -- actual variable/column you want to replace WHILE @x < 26 BEGIN SET @c = CHAR(ASCII('a') + @x) SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @x = @x + 1 END PRINT @sql 

De qualquer forma, depende do número de linhas. Eu queria que você pudesse fazer s / \ b ([az]) / uc $ 1 /, mas tudo bem, nós trabalhamos com as ferramentas que temos.

NOTA você teria que usar isso como você teria que usá-lo como .... SELECT dbo.ProperCase (LOWER (column)) desde que a coluna esteja em letras maiúsculas. Ele realmente funciona muito rápido na minha tabela de 5.000 inputs (nem mesmo um segundo), mesmo com o menor.

Em resposta à enxurrada de comentários sobre internacionalização, apresento a seguinte implementação que trata de todos os caracteres ASCII contando apenas com a Implementação de superior e inferior do SQL Server. Lembre-se, as variables ​​que estamos usando aqui são VARCHAR, o que significa que elas só podem conter valores ASCII. Para usar mais alfabetos internacionais, você tem que usar NVARCHAR. A lógica seria semelhante, mas você precisaria usar UNICODE e NCHAR no lugar de ASCII AND CHAR e a instrução replace seria muito mais grande ....

 -- Code Generator for expression DECLARE @x INT, @c CHAR(1), @sql VARCHAR(8000), @count INT SEt @x = 0 SET @count = 0 SET @sql = '@str' -- actual variable you want to replace WHILE @x < 256 BEGIN SET @c = CHAR(@x) -- Only generate replacement expression for characters where upper and lowercase differ IF @x = ASCII(LOWER(@c)) AND @x != ASCII(UPPER(@c)) BEGIN SET @sql = 'REPLACE(' + @sql + ', '' ' + @c+ ''', '' ' + UPPER(@c) + ''')' SET @count = @count + 1 END SET @x = @x + 1 END PRINT @sql PRINT 'Total characters substituted: ' + CONVERT(VARCHAR(255), @count) 

Basicamente, a premissa do método my está negociando pré-computação para eficiência. A implementação completa do ASCII é a seguinte:

 IF OBJECT_ID('dbo.ProperCase') IS NOT NULL DROP FUNCTION dbo.ProperCase GO CREATE FUNCTION dbo.PROPERCASE ( @str VARCHAR(8000)) RETURNS VARCHAR(8000) AS BEGIN SET @str = ' ' + @str SET @str = REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(@str, ' a', ' A'), ' b', ' B'), ' c', ' C'), ' d', ' D'), ' e', ' E'), ' f', ' F'), ' g', ' G'), ' h', ' H'), ' i', ' I'), ' j', ' J'), ' k', ' K'), ' l', ' L'), ' m', ' M'), ' n', ' N'), ' o', ' O'), ' p', ' P'), ' q', ' Q'), ' r', ' R'), ' s', ' S'), ' t', ' T'), ' u', ' U'), ' v', ' V'), ' w', ' W'), ' x', ' X'), ' y', ' Y'), ' z', ' Z'), ' š', ' Š'), ' œ', ' Œ'), ' ž', ' Ž'), ' à', ' À'), ' á', ' Á'), ' â', ' Â'), ' ã', ' Ã'), ' ä', ' Ä'), ' å', ' Å'), ' æ', ' Æ'), ' ç', ' Ç'), ' è', ' È'), ' é', ' É'), ' ê', ' Ê'), ' ë', ' Ë'), ' ì', ' Ì'), ' í', ' Í'), ' î', ' Î'), ' ï', ' Ï'), ' ð', ' Ð'), ' ñ', ' Ñ'), ' ò', ' Ò'), ' ó', ' Ó'), ' ô', ' Ô'), ' õ', ' Õ'), ' ö', ' Ö'), ' ø', ' Ø'), ' ù', ' Ù'), ' ú', ' Ú'), ' û', ' Û'), ' ü', ' Ü'), ' ý', ' Ý'), ' þ', ' Þ'), ' ÿ', ' Ÿ') RETURN RIGHT(@str, LEN(@str) - 1) END GO 

É tarde demais para voltar e obter os dados não-maiúsculos?

Os de von Neumann, McCain, DeGuzman e os Johnson-Smith da sua base de clientes podem não gostar do resultado do seu processamento …

Além disso, estou supondo que isso se destina a ser uma atualização única dos dados? Pode ser mais fácil exportar, filtrar / modificar e importar novamente os nomes corrigidos para o database e, em seguida, você pode usar abordagens não-SQL para nomear a correção …

Aqui está outra variação que encontrei nos fóruns do SQLTeam.com @ http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=47718

 create FUNCTION PROPERCASE ( --The string to be converted to proper case @input varchar(8000) ) --This function returns the proper case string of varchar type RETURNS varchar(8000) AS BEGIN IF @input IS NULL BEGIN --Just return NULL if input string is NULL RETURN NULL END --Character variable declarations DECLARE @output varchar(8000) --Integer variable declarations DECLARE @ctr int, @len int, @found_at int --Constant declarations DECLARE @LOWER_CASE_a int, @LOWER_CASE_z int, @Delimiter char(3), @UPPER_CASE_A int, @UPPER_CASE_Z int --Variable/Constant initializations SET @ctr = 1 SET @len = LEN(@input) SET @output = '' SET @LOWER_CASE_a = 97 SET @LOWER_CASE_z = 122 SET @Delimiter = ' ,-' SET @UPPER_CASE_A = 65 SET @UPPER_CASE_Z = 90 WHILE @ctr < = @len BEGIN --This loop will take care of reccuring white spaces WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) > 0 BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) SET @ctr = @ctr + 1 END IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @LOWER_CASE_a AND @LOWER_CASE_z BEGIN --Converting the first character to upper case SET @output = @output + UPPER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 WHILE CHARINDEX(SUBSTRING(@input,@ctr,1), @Delimiter) = 0 AND (@ctr < = @len) BEGIN IF ASCII(SUBSTRING(@input,@ctr,1)) BETWEEN @UPPER_CASE_A AND @UPPER_CASE_Z BEGIN SET @output = @output + LOWER(SUBSTRING(@input,@ctr,1)) END ELSE BEGIN SET @output = @output + SUBSTRING(@input,@ctr,1) END SET @ctr = @ctr + 1 END END RETURN @output END GO SET QUOTED_IDENTIFIER OFF GO SET ANSI_NULLS ON GO 

Acabei de aprender sobre InitCap() .

Aqui está um código de amostra:

 SELECT ID ,InitCap(LastName ||', '|| FirstName ||' '|| Nvl(MiddleName,'')) AS RecipientName FROM SomeTable 

Isso funcionou no SSMS:

 Select Jobtitle, concat(Upper(LEFT(jobtitle,1)), SUBSTRING(jobtitle,2,LEN(jobtitle))) as Propercase From [HumanResources].[Employee]