Articles of utf 8

UTF-8 safe equivalent of ord ou charCodeAt () em PHP

Eu preciso ser capaz de usar ord () para obter o mesmo valor que a function charCodeAt () do javascript. O problema é que ord () não suporta UTF8. Como posso obter Ą para traduzir para 260 em PHP? Eu tentei algumas funções uniord lá fora, mas todas elas relatam 256 em vez de 260. […]

Como detectar o UTF-8 em C simples?

Eu estou procurando um trecho de código em C antigo, que detecta que a string dada está na codificação UTF-8. Eu sei que a solução com regex, mas por várias razões, seria melhor evitar o uso de qualquer coisa, mas simples C neste caso particular. Solução com regex se parece com isso (aviso: vários cheques […]

Biblioteca Unicode Light C

Eu estou procurando uma pequena biblioteca C para lidar com strings utf8. Especificamente, divisão baseada em delimitadores unicode para uso com algoritmos stemming. Postagens relacionadas sugeriram: ICU http://www.icu-project.org/ (achei muito volumoso para meus propósitos em dispositivos embarcados) UTF8-CPP: http://utfcpp.sourceforge.net/ (excelente, mas C ++ não C) Alguém encontrou alguma plataforma independente, bibliotecas de base de código […]

Outlook autocleaning minha linha quebra e estragar o meu formato de e-mail

Estou enviando um email usando o framework dotnet. Aqui está o modelo que estou usando para criar a mensagem: Date of Hire: %HireDate% Annual Salary: %AnnualIncome% Reason for Request: %ReasonForRequest% Name of Voluntary Employee: %FirstName% %LastName% Total Coverage Applied For: %EECoverageAmount% Guaranteed Coverage Portion: %GICoveragePortion% Amount Subject to Medical Evident: %GIOverage% Quando as mensagens são […]

Como exibir o Kanji japonês dentro de uma janela cmd sob o windows?

Eu tenho um servidor Windows 2003 em inglês com suporte de idioma asiático ativado. As duas únicas fonts disponíveis para a janela de comando (configurações cmd) são raster e console lúcido. Nem um nem o outro exibem o Kanji corretamente (exibido como ponto de interrogação). Existe uma solução para mostrá-los? Existe alguma transformação que devo […]

i18n com arquivos de propriedades codificados em UTF-8 no aplicativo JSF 2.0

Eu estou usando o jsf-ri 2.0.3 onde o suporte hebraico e russo é necessário. O problema é que eu vejo rabiscos na canvas em vez do texto correto. Primeiro de tudo eu tenho definido bundles (* _locale.properties) para cada idioma. Os arquivos estão na codificação UTF-8. Em segundo lugar, defini as localidades padrão e suportadas […]

Comprimentos do MySQL VARCHAR e UTF-8

No MySQL, se eu criar um novo campo VARCHAR(32) em uma tabela UTF-8, isso significa que posso armazenar 32 bytes de dados nesse campo ou 32 caracteres (multi-byte)?

Diferenças entre utf8 e latin1

qual a diferença entre utf8 e latin1?

Java equivalente ao encodeURIComponent do JavaScript que produz uma saída idêntica?

Eu tenho experimentado com vários pedaços de código Java tentando chegar a algo que irá codificar uma string contendo citações, espaços e caracteres Unicode “exóticos” e produzir uma saída idêntica à function encodeURIComponent do JavaScript. Minha string de teste de tortura é: “A” B ± “ Se eu inserir a seguinte instrução JavaScript no Firebug: […]

Qual é a diferença entre Unicode e UTF-8?

Considerar: É verdade que unicode=utf16 ? Muitos estão dizendo que o Unicode é um padrão, não uma codificação, mas a maioria dos editores suporta salvar como codificação Unicode.