Articles of cuda

Como medir o tempo do kernel interno no NVIDIA CUDA?

Eu quero medir tempo núcleo interno da GPU, como como medi-lo em NVIDIA CUDA? por exemplo __global__ void kernelSample() { some code here get start time some code here get stop time some code here }

Como a memory CUDA é gerenciada?

Quando executo meu programa CUDA, que aloca apenas uma pequena quantidade de memory global (abaixo de 20 M), recebi um erro de “falta de memory”. (De mensagens de outras pessoas, acho que o problema está relacionado à fragmentação de memory) Eu tento entender esse problema e percebo que tenho algumas perguntas relacionadas ao gerenciamento de […]

Requisitos de capacidade de computação CUDA

Quais são os requisitos mínimos de capacidade de computação para: CUDA 5.5? CUDA 6.0? CUDA 6.5?

Por que cudaMalloc () usa ponteiro para ponteiro?

Por exemplo, cudaMalloc((void**)&device_array, num_bytes); Esta pergunta foi feita antes, e a resposta foi “porque cudaMalloc retorna um código de erro”, mas não entendi – o que um ponteiro duplo tem a ver com retornar um código de erro? Por que um ponteiro simples não pode fazer o trabalho? Se eu escrever cudaError_t catch_status; catch_status = […]

Emulador de GPU para programação CUDA sem o hardware

Pergunta: Existe um emulador para uma placa Geforce que me permita programar e testar CUDA sem ter o hardware real? Info: Eu estou olhando para acelerar algumas simulações minhas em CUDA, mas meu problema é que eu não estou sempre na minha área de trabalho para fazer este desenvolvimento. Eu gostaria de fazer algum trabalho […]

Como os blocos / warps / threads do CUDA são mapeados nos núcleos CUDA?

Eu tenho usado o CUDA por algumas semanas, mas tenho algumas dúvidas sobre a alocação de blocos / warps / thread. Eu estou estudando a arquitetura do ponto de vista didático (projeto universitário), então alcançar o desempenho máximo não é problema meu. Primeiro de tudo, eu gostaria de entender se entendi esses fatos diretamente: O […]

enviando matriz 3d para o kernel CUDA

Tomei o código dado como uma resposta para Como posso sumr dois arrays 2D (inclinados) usando loops for nesteds? e tentou usá-lo para 3D em vez de 2D e mudou outras partes um pouco também, agora parece o seguinte: __global__ void doSmth(int*** a) { for(int i=0; i<2; i++) for(int j=0; j<2; j++) for(int k=0; k<2; […]

Modificando o registro para aumentar o tempo limite da GPU, windows 7

Estou tentando aumentar o tempo limite na GPU de sua configuração padrão de 2 segundos para algo um pouco mais. Eu encontrei o link a seguir, mas parece que é um pouco diferente no Windows 7, como eu não posso ver nada mencionado na página da web. Alguém já fez isso antes? Se assim você […]

CUDA incompatível com a minha versão do gcc

Eu tenho problemas para compilar alguns dos exemplos fornecidos com o CUDA SDK. Eu instalei o driver de desenvolvedores (versão 270.41.19) e o kit de ferramentas CUDA, e finalmente o SDK (a versão 4.0.17). Inicialmente não compilou nada: error — unsupported GNU version! gcc 4.5 and up are not supported! Eu encontrei a linha responsável […]

Qual é a versão do cuda para nvidia 304.125

Eu estou usando o Ubuntu 14.04. Eu quero instalar o CUDA. Mas eu não sei qual versão é boa para o meu laptop. Eu traço minha unidade que é $cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.125 Mon Dec 1 19:58:28 PST 2014 GCC version: gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1) Tentei instalar CUDA […]