Articles of codificação

Melhor maneira de codificar dados de texto para XML em Java?

Muito semelhante a esta questão , exceto para Java. Qual é a maneira recomendada de codificar strings para uma saída XML em Java. As strings podem conter caracteres como “&”, “<" etc.

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql?

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql? Eu já conheço as codificações ASCII, UTF-8, UTF-16 e UTF-32 ; mas estou curioso para saber qual a diferença do grupo de codificações ‘utf8mb4’ com outros tipos de codificação definidos no servidor mysql. Há algum benefício / proposta especial de usar […]

Como suportar a codificação UTF-8 no Eclipse

Como posso adicionar suporte a UTF-8 no eclipse? Eu quero adicionar, por exemplo, o idioma russo, mas eclipse não vai suportá-lo. O que devo fazer? Por favor me guie.

ruby 1.9: sequência de bytes inválida em UTF-8

Estou escrevendo um rastreador em Ruby (1.9) que consome muito HTML de muitos sites randoms. Ao tentar extrair links, decidi usar apenas .scan(/href=”(.*?)”/i) vez de nokogiri / hpricot (maior aceleração). O problema é que agora recebo muitos erros de ” invalid byte sequence in UTF-8 “. Pelo que eu entendi, a biblioteca net/http não tem […]

Usar o atob de Javascript para decodificar base64 não decodifica corretamente as strings utf-8

Estou usando a function JavaScript window.atob() para decodificar uma string codificada em base64 (especificamente o conteúdo codificado em base64 da API do GitHub). O problema é que estou recebendo caracteres codificados em ASCII de volta (como ⢠vez de ™ ). Como posso lidar corretamente com o stream de input codificado em base64 para que […]

Como encontrar o conjunto de caracteres padrão / codificação em Java?

A resposta óbvia é usar Charset.defaultCharset() mas descobrimos recentemente que essa pode não ser a resposta correta. Foi-me dito que o resultado é diferente do charset padrão real usado pelas classs java.io em várias ocasiões. Parece que o Java mantém 2 conjuntos de charset padrão. Alguém tem alguma ideia sobre esse problema? Conseguimos reproduzir um […]

Como conseguir codificação segura de URL Base64 em c #?

Eu quero alcançar codificação segura URL Base64 em c #. Em Java, temos a biblioteca Codec comum que me fornece uma string codificada segura de URL. Como posso conseguir o mesmo usando c #? byte[] toEncodeAsBytes = System.Text.ASCIIEncoding.ASCII.GetBytes(“StringToEncode”); string returnValue = System.Convert.ToBase64String(toEncodeAsBytes); O código acima converte-o em Base64, mas ele é == . Existe uma […]

Qual é a diferença entre UTF-8 e Unicode?

Eu ouvi opiniões conflitantes de pessoas – de acordo com a Wikipedia, veja aqui . Eles são a mesma coisa, não são? Alguém pode esclarecer?

Como fazer codificação Base64 em node.js?

O node.js já possui codificação base64 embutida? A razão pela qual eu pergunto isso é que final() da crypto só pode gerar dados hexadecimais, binários ou ascii. Por exemplo: var cipher = crypto.createCipheriv(‘des-ede3-cbc’, encryption_key, iv); var ciph = cipher.update(plaintext, ‘utf8’, ‘hex’); ciph += cipher.final(‘hex’); var decipher = crypto.createDecipheriv(‘des-ede3-cbc’, encryption_key, iv); var txt = decipher.update(ciph, ‘hex’, […]

Como converter uma string com codificação Unicode em uma string de letras

Eu tenho uma string com codificação Unicode , \uXXXX , e eu quero convertê-lo em uma letra normal ( UTF-8 ). Por exemplo: String myString = “\u0048\u0065\u006C\u006C\u006F World”; Deve se tornar “Hello World” Eu sei que quando eu imprimo a corda mostra Hello world . Meu problema é que eu leio nomes de arquivos de […]