Articles of utf 8

MATLAB: como exibir texto codificado em UTF-8 lido do arquivo?

A essência da minha pergunta é esta: Como posso exibir caracteres Unicode na GUI do Matlab (OS X) para que eles sejam renderizados corretamente? Detalhes: Eu tenho uma tabela de seqüências de caracteres armazenadas em um arquivo e algumas dessas seqüências de caracteres contêm caracteres Unicode codificados em UTF-8. Eu tentei muitas maneiras diferentes (muitas […]

Qual é o número máximo de bytes para um caractere codificado em UTF-8?

Qual é o número máximo de bytes para um único caractere codificado em UTF-8? Estarei criptografando os bytes de uma String codificada em UTF-8 e, portanto, precisarei poder calcular o número máximo de bytes para uma String codificada em UTF-8. Alguém poderia confirmar o número máximo de bytes para um único caractere codificado UTF-8, por […]

Propriedades Java Codificação UTF-8 no Eclipse

Eu recentemente tive que mudar a codificação do webapp que estou trabalhando de ISO-xx para utf8 . Tudo correu bem, exceto arquivos de propriedades. Eu adicionei -Dfile.encoding=UTF-8 no eclipse.ini e arquivos normais funcionam bem. Propriedades, no entanto, mostram algum comportamento estranho. Se eu copiar as propriedades codificadas utf8 do Notepad ++ e colá-las no Eclipse, […]

Imprimindo strings UTF-8 com literais de cadeia de caracteres printf – wide vs. multibyte

Em declarações como essas, onde ambos são inseridos no código-fonte com a mesma codificação (UTF-8) e a localidade é configurada corretamente, existe alguma diferença prática entre eles? printf(“ο Δικαιοπολις εν αγρω εστιν\n”); printf(“%ls”, L”ο Δικαιοπολις εν αγρω εστιν\n”); E, consequentemente, há algum motivo para preferir um ao outro ao fazer a saída? Eu imagino que […]

Como faço para imprimir UTF-8 do aplicativo de console c ++ no Windows

Para um aplicativo de console C ++ compilado com o Visual Studio 2008 no Windows em inglês (XP, Vista ou 7). É possível imprimir para o console e exibir corretamente japonês codificado em UTF-8 usando cout ou wcout?

Converter caractere Unicode com escape de volta ao caractere real

Eu tenho o seguinte valor em uma variável de seqüência de caracteres em Java que tem caracteres UTF-8 codificados como abaixo Dodd\u2013Frank ao invés de Dodd–Frank (Suponha que eu não tenha controle sobre como esse valor é atribuído a essa variável de string) Agora, como faço para converter (codificar) corretamente e armazená-lo de volta em […]

Como posso produzir UTF-8 a partir do Perl?

Eu estou tentando escrever um script Perl usando o pragma “utf8” e estou obtendo resultados inesperados. Estou usando o Mac OS X 10.5 (Leopard) e estou editando com o TextMate. Todas as minhas configurações para o meu editor e sistema operacional são padronizadas para gravar arquivos no formato utf-8. No entanto, quando eu inserir o […]

Convertendo UTF-8 para ISO-8859-1 em Java – como mantê-lo como byte único

Eu estou tentando converter uma string codificada em java em UTF-8 para ISO-8859-1. Digamos, por exemplo, na string ”abcd’ ” ‘é representado em ISO-8859-1 como E2. Em UTF-8 é representado como dois bytes. C3 A2 eu acredito. Quando eu faço um getbytes (codificação) e, em seguida, criar uma nova seqüência de caracteres com os bytes […]

C # Converter cadeia de UTF-8 para ISO-8859-1 (Latin1) H

Eu pesquisei neste tópico e olhei todas as respostas, mas ainda não entendi. Basicamente eu preciso converter uma string UTF-8 para ISO-8859-1 e faço isso usando o seguinte código: Encoding iso = Encoding.GetEncoding(“ISO-8859-1”); Encoding utf8 = Encoding.UTF8; string msg = iso.GetString(utf8.GetBytes(Message)); Minha string de origem é Message = “ÄäÖöÕõÜü” Mas infelizmente minha string de resultado […]

Como faço para converter entre ISO-8859-1 e UTF-8 em Java?

Alguém sabe como converter uma string de ISO-8859-1 para UTF-8 e de volta em Java? Estou recebendo uma string da web e salvando-a no RMS (J2ME), mas quero preservar os caracteres especiais e obter a string do RMS, mas com a codificação ISO-8859-1. Como eu faço isso?