Articles of unicode

Caracteres válidos em um nome de class Java

Quais caracteres são válidos em um nome de class Java? Quais outras regras governam nomes de classs Java (por exemplo, nomes de classs Java não podem começar com um número)?

utf-8 palavra limite regex em javascript

Em JavaScript: “ab abc cab ab ab”.replace(/\bab\b/g, “AB”); corretamente me dá: “AB abc cab AB AB” Quando eu uso utf-8 caracteres embora: “αβ αβγ γαβ αβ αβ”.replace(/\bαβ\b/g, “AB”); o operador de limite de palavras não parece funcionar: “αβ αβγ γαβ αβ αβ” Existe uma solução para isso?

Como converter um caractere Unicode em seu equivalente ASCII

Aqui está o problema: Em c # eu estou recebendo informações de um database ACCESS herdado. O .NET converte o conteúdo do database (no caso deste problema, uma string) para Unicode antes de entregar o conteúdo para mim. Como faço para converter essa string Unicode de volta para seu equivalente em ASCII? Editar Unicode char […]

Regex JavaScript concreto para caracteres acentuados (diacríticos)

Eu olhei no Stack Overflow ( substituindo caracteres .. eh , como JavaScript não segue o padrão Unicode relativo a RegExp , etc.) e realmente não encontrei uma resposta concreta para a pergunta: How can JavaScript match for accented characters (those with diacritical marks)? Eu estou forçando um campo em uma interface do usuário para […]

Colocando caracteres Unicode no valor de conteúdo CSS

Eu tenho um problema. Eu encontrei o código HTML para a seta para baixo, ↓ (↓) Legal. Agora eu preciso usá-lo em CSS assim: nav a:hover {content:”&darr”;} Isso obviamente não funcionará desde ↓ é um símbolo HTML. Parece haver menos informações sobre esses símbolos de “escape unicode” usados ​​no css. Existem outros símbolos, como o […]

UTF-8, UTF-16 e UTF-32

Quais são as diferenças entre UTF-8, UTF-16 e UTF-32? Eu entendo que todos eles irão armazenar Unicode, e que cada um usa um número diferente de bytes para representar um caractere. Existe uma vantagem em escolher um sobre o outro?

Existe um shell de comando do Windows que exibirá caracteres Unicode?

Supondo que eu tenho fonts instaladas que têm os glifos apropriados neles, há um shell de comando para o Windows XP que exibirá caracteres Unicode? No mínimo, duas coisas que devem exibir o Unicode corretamente: Listagens de diretório. Eu não me importo com o que eu tenho que digitar (dir, ls, get-childitem, etc.), desde que […]

Que codificação são nomes de arquivos em NTFS armazenados como?

Eu estou apenas começando em alguma programação para lidar com nomes de arquivos com nomes não ingleses em um sistema WinXP. Eu fiz algumas leituras recomendadas no unicode e acho que tenho a idéia básica, mas algumas partes ainda não estão muito claras para mim. Especificamente, que codificação (UTF-8, UTF-16LE / BE) são os nomes […]

Qual é a maneira correta de codificar URLs em caracteres Unicode?

Eu sei do esquema não-padrão% uxxxx, mas isso não parece ser uma escolha sábia, uma vez que o esquema foi rejeitado pelo W3C. Alguns exemplos interessantes: O personagem do coração. Se eu digitar isso no meu navegador: http://www.google.com/search?q=♥ Então copie e cole, vejo este URL http://www.google.com/search?q=%E2%99%A5 o que faz parecer que o Firefox (ou Safari) […]

Posso fazer o git reconhecer um arquivo UTF-16 como texto?

Estou rastreando um arquivo de máquina virtual do Virtual PC (* .vmc) no git, e depois de fazer uma mudança o git identificou o arquivo como binário e não o diferenciou para mim. Eu descobri que o arquivo foi codificado em UTF-16. O git pode ser ensinado a reconhecer que este arquivo é texto e […]