Articles of unicode

Exibindo caracteres árabes no aplicativo de console C #

Acredito que foi possível mostrar caracteres árabes em um aplicativo de console há mais de 13 anos, desde os dias do Windows ME. Agora estou usando o Visual Studio 2013, em um Windows 8 e o seguinte código mostra: ????? ?? Console.OutputEncoding = System.Text.Encoding.Unicode; Console.WriteLine(“مرحبا بك”); Existe alguma maneira de mostrar caracteres árabes na saída […]

Como posso executar um caractere Unicode por comparação de caracteres?

Meu aplicativo tem um alvo internacional, pessoas de muitos países o usarão e digitarão texto (texto que tenho que processar) usando seu próprio idioma. Se, por exemplo, eu tenho que listar as diferenças de duas seqüências de caracteres usando um caractere por comparação de caracteres é este simples código C # suficiente ou estou faltando […]

Como armazenar unicode no MySQL?

Como faço para armazenar Unicode na edição gratuita do MySQL? Não parece haver um tipo nvarchar como no SQL Server. O Unicode não é suportado no MySQL? Eu tentei usar o text mas isso também não está funcionando.

Remover caracteres unicode de arquivos de texto – sed, outros methods bash / shell

Como faço para remover caracteres unicode de um monte de arquivos de texto no terminal? Eu tentei isso, mas não funcionou: sed ‘g/\u’U+200E’//’ -i *.txt Eu preciso remover esses unicodes dos arquivos de texto U+0091 – sort of weird “control” space U+0092 – same sort of weird “control” space A0 – non-space break U+200E – […]

Como posso obter o (s) ponto (s) de código Unicode de um caractere?

Como posso extrair o (s) ponto (s) de código Unicode de um determinado Character sem primeiro convertê-lo em uma String ? Eu sei que posso usar o seguinte: let ch: Character = “A” let s = String(ch).unicodeScalars s[s.startIndex].value // returns 65 mas parece que deveria haver uma maneira mais direta de fazer isso usando apenas […]

Biblioteca Unicode Light C

Eu estou procurando uma pequena biblioteca C para lidar com strings utf8. Especificamente, divisão baseada em delimitadores unicode para uso com algoritmos stemming. Postagens relacionadas sugeriram: ICU http://www.icu-project.org/ (achei muito volumoso para meus propósitos em dispositivos embarcados) UTF8-CPP: http://utfcpp.sourceforge.net/ (excelente, mas C ++ não C) Alguém encontrou alguma plataforma independente, bibliotecas de base de código […]

Processamento Unicode em C ++

Qual é a melhor prática do processamento Unicode em C ++?

Como combinar caracteres cirílicos com uma expressão regular

Como faço para combinar caracteres do alfabeto cirílico francês e russo com uma expressão regular? Eu só quero fazer os caracteres alfa, sem números ou caracteres especiais. Agora eu tenho [A-Za-z]

Comprimentos do MySQL VARCHAR e UTF-8

No MySQL, se eu criar um novo campo VARCHAR(32) em uma tabela UTF-8, isso significa que posso armazenar 32 bytes de dados nesse campo ou 32 caracteres (multi-byte)?

Diferença entre BYTE e CHAR nos tipos de dados da coluna

No Oracle, qual é a diferença entre: CREATE TABLE CLIENT ( NAME VARCHAR2(11 BYTE), ID_CLIENT NUMBER ) e CREATE TABLE CLIENT ( NAME VARCHAR2(11 CHAR), — or even VARCHAR2(11) ID_CLIENT NUMBER )