Articles of unicode

Como converter char * para wchar_t *?

Eu tentei implementar uma function como essa, mas infelizmente não funciona: const wchar_t *GetWC(const char *c) { const size_t cSize = strlen(c)+1; wchar_t wc[cSize]; mbstowcs (wc, c, cSize); return wc; } Meu principal objective aqui é poder integrar cadeias de caractere normais em um aplicativo Unicode. Qualquer conselho que vocês possam oferecer é muito apreciado.

definindo um UTF-8 no arquivo java e csv

Eu estou usando este código para adicionar palavras persas para um arquivo csv via OpenCSV : String[] entries=”\u0645 \u062E\u062F\u0627″.split(“#”); try{ CSVWriter writer=new CSVWriter(new OutputStreamWriter(new FileOutputStream(“C:\\test.csv”), “UTF-8″)); writer.writeNext(entries); writer.close(); } catch(IOException ioe){ ioe.printStackTrace(); } Quando abro o arquivo csv resultante, no Excel, ele contém “ứỶờịỆ” . Outros programas como o notepad.exe não têm esse problema, mas […]

Uma string Unicode válida pode conter FFFF? O Java / CharacterIterator está quebrado?

Aqui está um trecho da documentação de java.text.CharacterIterator : Essa interface define um protocolo para iteração bidirecional sobre texto. O iterador repete uma sequência limitada de caracteres. […] Os methods previous() e next() são usados ​​para iteração. Eles retornam DONE se […], sinalizando que o iterador atingiu o final da seqüência. static final char DONE […]

Convertendo o TMemoryStream em ‘String’ no Delphi 2009

Nós tínhamos o seguinte código antes do Delphi 2009: function MemoryStreamToString(M: TMemoryStream): String; var NewCapacity: Longint; begin if (M.Size = 0) or (M.Memory = nil) then Result:= ” else begin if TMemoryStreamProtected(M).Capacity = M.Size then begin NewCapacity:= M.Size+1; TMemoryStreamProtected(M).Realloc(NewCapacity); end; NullString(M.Memory^)[M.Size]:= #0; Result:= StrPas(M.Memory); end; end; Como podemos converter este código para suportar Unicode agora […]

Diferença entre Char.IsDigit () e Char.IsNumber () em c #

Qual é a diferença entre Char.IsDigit() e Char.IsNumber() em C #?

Como converter um valor unichar em um NSString em Objective-C?

Eu tenho um caractere internacional armazenado em uma variável unichar. Este caractere não vem de um arquivo ou url. A própria variável armazena apenas um curto não assinado (0xce91) que está no formato UTF-8 e traduz para a letra maiúscula ‘A’ em grego. Estou tentando colocar esse caractere em uma variável NSString, mas falho miseravelmente. […]

Diferença entre MBCS e UTF-8 no Windows

Eu estou lendo sobre o conjunto charater e codificações no Windows. Notei que há dois sinalizadores de compilador no compilador do Visual Studio (para C ++) chamados MBCS e UNICODE. Qual a diferença entre eles ? O que eu não entendo é como o UTF-8 é conceitualmente diferente de uma codificação MBCS? Além disso, encontrei […]

Usando o PDFBox para gravar strings codificadas em UTF-8 em um PDF

Estou tendo problemas para gravar caracteres unicode em um PDF usando o PDFBox. Aqui está um código de exemplo que gera caracteres ilegíveis em vez de gerar “š”. O que posso adicionar para obter suporte para strings UTF-8? PDDocument document = new PDDocument(); PDPage page = new PDPage(); document.addPage(page); PDPageContentStream contentStream = new PDPageContentStream(document, page); […]

Como fazer python 3 print () utf8

Como posso fazer o python 3 (3.1) print(“Some text”) para stdout em UTF-8, ou como exportar bytes brutos? Test.py TestText = “Test – āĀēĒčČ..šŠūŪžŽ” # this is UTF-8 TestText2 = b”Test2 – \xc4\x81\xc4\x80\xc4\x93\xc4\x92\xc4\x8d\xc4\x8c..\xc5\xa1\xc5\xa0\xc5\xab\xc5\xaa\xc5\xbe\xc5\xbd” # just bytes print(sys.getdefaultencoding()) print(sys.stdout.encoding) print(TestText) print(TestText.encode(“utf8”)) print(TestText.encode(“cp1252″,”replace”)) print(TestText2) Saída (no CP1257 e substituímos chars por valores de byte [x00] ): utf-8 […]

Exibir caracteres Unicode na conversão de HTML para PDF

Eu estou usando itextsharp dll para converter HTML para PDF. O HTML tem alguns caracteres Unicode como α, β … quando tento converter HTML em PDF, os caracteres Unicode não são mostrados em PDF. Minha function: Document doc = new Document(PageSize.LETTER); using (FileStream fs = new FileStream(Path.Combine(“Test.pdf”), FileMode.Create, FileAccess.Write, FileShare.Read)) { PdfWriter.GetInstance(doc, fs); doc.Open(); doc.NewPage(); […]