Articles of cuda

CUDA ligando erro – Visual Express 2008 – nvcc fatal devido ao arquivo de configuração (nulo)

Eu estive procurando extensivamente por uma possível solução para o meu erro nas últimas duas semanas. Instalei com êxito o compilador Cuda de 64 bits (ferramentas) e o SDK, bem como a versão de 64 bits do Visual Studio Express 2008 e do Windows 7 SDK com o Framework 3.5. Estou usando o Windows XP […]

128 bit inteiro no cuda?

Acabei de instalar meu cuda SDK no Linux Ubuntu 10.04. Minha placa gráfica é uma NVIDIA GeForce GT 425M, e eu gostaria de usá-la para algum problema computacional pesado. O que eu me pergunto é: existe alguma maneira de usar alguns int de 128 bits não assinados? Ao usar o gcc para executar meu programa […]

Estrutura de matrizes vs matriz de estruturas em CUDA

De alguns comentários que eu li aqui, por algum motivo, é preferível ter Structure of Arrays ( SoA ) sobre Array of Structures ( AoS ) para implementações paralelas como CUDA? Se isso é verdade, alguém pode explicar por quê? Desde já, obrigado!

Melhor abordagem para GPGPU / CUDA / OpenCL em Java?

Computação de propósito geral em unidades de processamento gráfico ( GPGPU ) é um conceito muito atraente para aproveitar o poder da GPU para qualquer tipo de computação. Eu adoraria usar o GPGPU para processamento de imagens, partículas e operações geométricas rápidas. Neste momento, parece que os dois contendores neste espaço são CUDA e OpenCL. […]

Como definir sinalizadores de compilador CUDA no Visual Studio 2010?

Depois persistentemente recebendo error : identifier “atomicAdd” is undefined , eu encontrei a solução para ser compilar com -arch sm_20 bandeira. Mas como passar este flag do compilador no VS 2010? Eu tentei assim em Project > Properties : Mas isso aparentemente não teve efeito e o erro persiste – o que estou fazendo errado? […]

Copiar um object para o dispositivo?

Posso copiar um object C ++ para o dispositivo? digamos que eu tenha: class CudaClass { public: int* data; CudaClass(int x) { data = new int[1]; data[0] = x; } }; __global__ void useClass(CudaClass cudaClass) { printf(“%d” cudaClass.data[0]); }; int main() { CudaClass c(1); } Agora, como copio “c” para a memory do dispositivo e […]

Como os blocos CUDA são divididos em warps?

Se eu iniciar meu kernel com uma grade cujos blocos tenham dimensões: dim3 block_dims(16,16); Como os blocos de grade agora são divididos em deformações? As duas primeiras linhas desse bloco formam uma distorção, ou as duas primeiras colunas, ou isso é arbitrariamente ordenado? Assuma uma capacidade de computação de GPU de 2,0.

nvidia-smi Explicação de utilização de GPU volátil?

Eu sei que nvidia-smi -l 1 dará o uso da GPU a cada um segundo (similar ao seguinte). No entanto, gostaria de receber uma explicação sobre o que o Volatile GPU-Util realmente significa. Esse é o número de SMs usados ​​em relação ao total de SMs, à ocupação ou a alguma outra coisa? +—————————————————————————–+ | […]

CUDA e nvcc: usando o pré-processador para escolher entre float ou double

O problema : Tendo um .h, eu quero definir real para ser duplo se compilar para c / c ++ ou cuda com capacidade de computação> = 1,3. Se compilar para cuda com capacidade de computação <1.3, defina real como float. Depois de muitas horas eu vim para isso (o que não funciona) # se […]

Como calcular o Gflops de um kernel

Eu quero uma medida de quanto do desempenho máximo meu kernel arquiva. Digamos que eu tenha um NVIDIA Tesla C1060, que tem um pico de GFLOPS de 622,08 (~ = 240Cores * 1300MHz * 2). Agora no meu kernel eu contei para cada thread 16000 flop (4000 x (2 subtração, 1 multiplicação e 1 sqrt)). […]