Articles of cpu arquitetura

Qual é a diferença entre sjlj vs dwarf vs seh?

Não consigo encontrar informações suficientes para decidir qual compilador devo usar para compilar meu projeto. Existem vários programas em diferentes computadores que simulam um processo. No Linux, estou usando o GCC. Tudo é bom. Eu posso otimizar o código, ele compila rápido e usa memory não tão grande. Eu faço meu próprio benchmark com compiladores […]

Como usar instruções Fused Multiply-Add (FMA) com SSE / AVX

Eu aprendi que alguns processadores Intel / AMD podem fazer multiplicação simultânea e adicionar com SSE / AVX: FLOPS por ciclo para ponte de areia e haswell SSE2 / AVX / AVX2 . Eu gosto de saber como fazer isso melhor em código e também quero saber como é feito internamente na CPU. Quero dizer […]

Qual técnica de mapeamento de cache é usada no processador Intel Core i7?

Eu aprendi sobre diferentes técnicas de mapeamento de cache como mapeamento direto, mapeamento associado e técnica de mapeamento associativo de conjunto e também aprendi as compensações. Mas estou curioso sobre o que é usado atualmente no processador Intel Core i7 ou AMD. E como as técnicas são evoluídas. E quais são as coisas que precisam […]

Como posso determinar para qual plataforma um executável é compilado?

Eu tenho uma necessidade de trabalhar com executáveis ​​do Windows que são feitos para x86, x64 e IA64. Eu gostaria de descobrir programaticamente a plataforma examinando os arquivos em si. Meu idioma de destino é o PowerShell, mas um exemplo do C # serve. Caso contrário, se você conhece a lógica necessária, isso seria ótimo.

FLOPS por ciclo para ponte de areia e haswell SSE2 / AVX / AVX2

Estou confuso sobre quantos flops por ciclo por núcleo podem ser feitos com Sandy-Bridge e Haswell. Pelo que entendi, com SSE, ele deve ter 4 flops por ciclo por núcleo para SSE e 8 flops por ciclo por núcleo para AVX / AVX2. Isso parece ser verificado aqui: Como eu alcanço o máximo teórico de […]

Por que o tamanho do cache L1 é menor que o cache L2 na maioria dos processadores?

Por que o tamanho do cache L1 é menor que o cache L2 na maioria dos processadores?

Qual é o objective da configuração “Prefer 32-bit” no Visual Studio 2012 e como ela realmente funciona?

Não está claro para mim como o compilador saberá automaticamente compilar para 64 bits quando for necessário. Como ele sabe quando pode segmentar com segurança de 32 bits? Eu estou principalmente curioso sobre como o compilador sabe qual arquitetura deve ser direcionada ao compilar. Analisa o código e toma uma decisão com base no que […]