Articles of utf 8

utf-8 palavra limite regex em javascript

Em JavaScript: “ab abc cab ab ab”.replace(/\bab\b/g, “AB”); corretamente me dá: “AB abc cab AB AB” Quando eu uso utf-8 caracteres embora: “αβ αβγ γαβ αβ αβ”.replace(/\bαβ\b/g, “AB”); o operador de limite de palavras não parece funcionar: “αβ αβγ γαβ αβ αβ” Existe uma solução para isso?

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql?

Qual é a diferença entre os conjuntos de caracteres utf8mb4 e utf8 no mysql? Eu já conheço as codificações ASCII, UTF-8, UTF-16 e UTF-32 ; mas estou curioso para saber qual a diferença do grupo de codificações ‘utf8mb4’ com outros tipos de codificação definidos no servidor mysql. Há algum benefício / proposta especial de usar […]

Binário para texto em Java

Eu tenho uma String com dados binários (1110100) Eu quero tirar o texto para que eu possa imprimi-lo (1110100 iria imprimir “t”). Eu tentei isso, é semelhante ao que eu usei para transformar meu texto em binário, mas não está funcionando: public static String toText(String info)throws UnsupportedEncodingException{ byte[] encoded = info.getBytes(); String text = new […]

Como suportar a codificação UTF-8 no Eclipse

Como posso adicionar suporte a UTF-8 no eclipse? Eu quero adicionar, por exemplo, o idioma russo, mas eclipse não vai suportá-lo. O que devo fazer? Por favor me guie.

Salvar arquivo de texto UTF-8 codificado com VBA

como posso escrever strings codificadas em UTF-8 para um arquivo de texto de vba, como Dim fnum As Integer fnum = FreeFile Open “myfile.txt” For Output As fnum Print #fnum, “special characters: äöüß” ‘latin-1 or something by default Close fnum Existe alguma configuração no nível do aplicativo?

UTF-8, UTF-16 e UTF-32

Quais são as diferenças entre UTF-8, UTF-16 e UTF-32? Eu entendo que todos eles irão armazenar Unicode, e que cada um usa um número diferente de bytes para representar um caractere. Existe uma vantagem em escolher um sobre o outro?

Qual é a maneira correta de codificar URLs em caracteres Unicode?

Eu sei do esquema não-padrão% uxxxx, mas isso não parece ser uma escolha sábia, uma vez que o esquema foi rejeitado pelo W3C. Alguns exemplos interessantes: O personagem do coração. Se eu digitar isso no meu navegador: http://www.google.com/search?q=♥ Então copie e cole, vejo este URL http://www.google.com/search?q=%E2%99%A5 o que faz parecer que o Firefox (ou Safari) […]

Como fazer o bloco de notas para salvar texto em UTF-8 sem BOM?

Eu tenho um arquivo CSV com acentos especiais e salvando-o no bloco de notas, selecionando a codificação UTF-8. Quando eu leio o arquivo usando Java, ele lê os caracteres da lista de materiais também. Então eu quero salvar este arquivo no formato UTF-8 sem append um BOM inicialmente no Bloco de Notas. Caso contrário, existe […]

ruby 1.9: sequência de bytes inválida em UTF-8

Estou escrevendo um rastreador em Ruby (1.9) que consome muito HTML de muitos sites randoms. Ao tentar extrair links, decidi usar apenas .scan(/href=”(.*?)”/i) vez de nokogiri / hpricot (maior aceleração). O problema é que agora recebo muitos erros de ” invalid byte sequence in UTF-8 “. Pelo que eu entendi, a biblioteca net/http não tem […]

Como usar símbolos gregos em ggplot2?

Minhas categorias precisam ser nomeadas com letras gregas. Eu estou usando ggplot2 e funciona lindamente com os dados. Infelizmente não consigo descobrir como colocar esses símbolos gregos no eixo x (nas marcas de escala) e também fazê-los aparecer na legenda. Há alguma forma de fazer isso? UPDATE: Eu dei uma olhada no link , no […]