Articles of utf 8

Como suportar a codificação UTF-8 no Eclipse

Como posso adicionar suporte a UTF-8 no eclipse? Eu quero adicionar, por exemplo, o idioma russo, mas eclipse não vai suportá-lo. O que devo fazer? Por favor me guie.

Salvar arquivo de texto UTF-8 codificado com VBA

como posso escrever strings codificadas em UTF-8 para um arquivo de texto de vba, como Dim fnum As Integer fnum = FreeFile Open “myfile.txt” For Output As fnum Print #fnum, “special characters: äöüß” ‘latin-1 or something by default Close fnum Existe alguma configuração no nível do aplicativo?

UTF-8, UTF-16 e UTF-32

Quais são as diferenças entre UTF-8, UTF-16 e UTF-32? Eu entendo que todos eles irão armazenar Unicode, e que cada um usa um número diferente de bytes para representar um caractere. Existe uma vantagem em escolher um sobre o outro?

Qual é a maneira correta de codificar URLs em caracteres Unicode?

Eu sei do esquema não-padrão% uxxxx, mas isso não parece ser uma escolha sábia, uma vez que o esquema foi rejeitado pelo W3C. Alguns exemplos interessantes: O personagem do coração. Se eu digitar isso no meu navegador: http://www.google.com/search?q=♥ Então copie e cole, vejo este URL http://www.google.com/search?q=%E2%99%A5 o que faz parecer que o Firefox (ou Safari) […]

Como fazer o bloco de notas para salvar texto em UTF-8 sem BOM?

Eu tenho um arquivo CSV com acentos especiais e salvando-o no bloco de notas, selecionando a codificação UTF-8. Quando eu leio o arquivo usando Java, ele lê os caracteres da lista de materiais também. Então eu quero salvar este arquivo no formato UTF-8 sem append um BOM inicialmente no Bloco de Notas. Caso contrário, existe […]

ruby 1.9: sequência de bytes inválida em UTF-8

Estou escrevendo um rastreador em Ruby (1.9) que consome muito HTML de muitos sites randoms. Ao tentar extrair links, decidi usar apenas .scan(/href=”(.*?)”/i) vez de nokogiri / hpricot (maior aceleração). O problema é que agora recebo muitos erros de ” invalid byte sequence in UTF-8 “. Pelo que eu entendi, a biblioteca net/http não tem […]

Como usar símbolos gregos em ggplot2?

Minhas categorias precisam ser nomeadas com letras gregas. Eu estou usando ggplot2 e funciona lindamente com os dados. Infelizmente não consigo descobrir como colocar esses símbolos gregos no eixo x (nas marcas de escala) e também fazê-los aparecer na legenda. Há alguma forma de fazer isso? UPDATE: Eu dei uma olhada no link , no […]

Qual é a representação interna do Java para String? UTF-8 modificado? UTF-16?

Eu procurei a representação interna de Java para String, mas eu tenho dois materiais que parecem confiáveis, mas inconsistentes. Um é: http://www.codeguru.com/cpp/misc/misc/multi-lingualsupport/article.php/c10451 e diz: Java usa UTF-16 para a representação de texto interno e suporta uma modificação não padrão de UTF-8 para serialização de cadeia. O outro é: http://en.wikipedia.org/wiki/UTF-8#Modified_UTF-8 e diz: O Tcl também usa […]

Usar o atob de Javascript para decodificar base64 não decodifica corretamente as strings utf-8

Estou usando a function JavaScript window.atob() para decodificar uma string codificada em base64 (especificamente o conteúdo codificado em base64 da API do GitHub). O problema é que estou recebendo caracteres codificados em ASCII de volta (como ⢠vez de ™ ). Como posso lidar corretamente com o stream de input codificado em base64 para que […]

Qual é a diferença entre UTF-8 e ISO-8859-1?

Qual é a diferença entre UTF-8 e ISO-8859-1 ?