Articles of codificação de caracteres

UTF-8 safe equivalent of ord ou charCodeAt () em PHP

Eu preciso ser capaz de usar ord () para obter o mesmo valor que a function charCodeAt () do javascript. O problema é que ord () não suporta UTF8. Como posso obter Ą para traduzir para 260 em PHP? Eu tentei algumas funções uniord lá fora, mas todas elas relatam 256 em vez de 260. […]

.NET Core não sabe sobre o Windows 1252, como corrigir?

Este programa funciona bem quando compilado para o .NET 4, mas quando compilado para o .NET Core. Eu entendo o erro sobre a codificação não suportada, mas não como corrigi-lo. Public Class Program Public Shared Function Main(ByVal args As String()) As Integer System.Text.Encoding.GetEncoding(1252) End Function End Class

Algoritmo de Detecção de Codificação de Caracteres

Eu estou procurando uma maneira de detectar conjuntos de caracteres dentro de documentos. Eu tenho lido a implementação da detecção de conjunto de caracteres do Mozilla aqui: Detecção Universal Charset Eu também encontrei uma implementação Java deste chamado jCharDet: JCharDet Ambos são baseados em pesquisas realizadas usando um dataset estáticos. O que eu estou querendo […]

Como você usa corretamente WideCharToMultiByte

Eu li a documentação em WideCharToMultiByte , mas estou preso neste parâmetro: lpMultiByteStr [out] Pointer to a buffer that receives the converted string. Não tenho certeza de como inicializar corretamente a variável e alimentá-la na function

Quais são as diferenças entre utf8_general_ci e utf8_unicode_ci?

Duplicar Possível: Qual é a diferença entre utf8_general_ci e utf8_unicode_ci Eu tenho duas opções para unicode que parecem promissoras para um database mysql. utf8_general_ci unicode (multilingual), case-insensitive utf8_unicode_ci unicode (multilingual), case-insensitive Você pode por favor explicar qual é a diferença entre utf8_general_ci e utf8_unicode_ci? Quais são os efeitos de escolher um sobre o outro ao […]

Usando Unicode no código-fonte C ++

Qual é a codificação padrão do código fonte do C ++? O padrão C ++ ainda diz algo sobre isso? Posso escrever fonte C ++ em Unicode? Por exemplo, posso usar caracteres não ASCII, como caracteres chineses, nos comentários? Em caso afirmativo, o Unicode completo é permitido ou apenas um subconjunto do Unicode? (por exemplo, […]

Como faço para converter entre ISO-8859-1 e UTF-8 em Java?

Alguém sabe como converter uma string de ISO-8859-1 para UTF-8 e de volta em Java? Estou recebendo uma string da web e salvando-a no RMS (J2ME), mas quero preservar os caracteres especiais e obter a string do RMS, mas com a codificação ISO-8859-1. Como eu faço isso?

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql?

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql? Eu já conheço as codificações ASCII, UTF-8, UTF-16 e UTF-32 ; mas estou curioso para saber qual a diferença do grupo de codificações ‘utf8mb4’ com outros tipos de codificação definidos no servidor mysql. Há algum benefício / proposta especial de usar […]

Qual é a maneira correta de codificar URLs em caracteres Unicode?

Eu sei do esquema não-padrão% uxxxx, mas isso não parece ser uma escolha sábia, uma vez que o esquema foi rejeitado pelo W3C. Alguns exemplos interessantes: O personagem do coração. Se eu digitar isso no meu navegador: http://www.google.com/search?q=♥ Então copie e cole, vejo este URL http://www.google.com/search?q=%E2%99%A5 o que faz parecer que o Firefox (ou Safari) […]

Posso fazer o git reconhecer um arquivo UTF-16 como texto?

Estou rastreando um arquivo de máquina virtual do Virtual PC (* .vmc) no git, e depois de fazer uma mudança o git identificou o arquivo como binário e não o diferenciou para mim. Eu descobri que o arquivo foi codificado em UTF-16. O git pode ser ensinado a reconhecer que este arquivo é texto e […]