Articles of nvidia

128 bit inteiro no cuda?

Acabei de instalar meu cuda SDK no Linux Ubuntu 10.04. Minha placa gráfica é uma NVIDIA GeForce GT 425M, e eu gostaria de usá-la para algum problema computacional pesado. O que eu me pergunto é: existe alguma maneira de usar alguns int de 128 bits não assinados? Ao usar o gcc para executar meu programa […]

nvidia-smi Explicação de utilização de GPU volátil?

Eu sei que nvidia-smi -l 1 dará o uso da GPU a cada um segundo (similar ao seguinte). No entanto, gostaria de receber uma explicação sobre o que o Volatile GPU-Util realmente significa. Esse é o número de SMs usados ​​em relação ao total de SMs, à ocupação ou a alguma outra coisa? +—————————————————————————–+ | […]

O que posso fazer contra a versão do driver CUDA é insuficiente para a versão de tempo de execução CUDA?

Quando vou para /usr/local/cuda/samples/1_Utilities/deviceQuery e executo moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make clean rm -f deviceQuery deviceQuery.o rm -rf ../../bin/x86_64/linux/release/deviceQuery moose@pc09 /usr/local/cuda/samples/1_Utilities/deviceQuery $ sudo make “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -I../../common/inc -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 -gencode arch=compute_35,code=sm_35 -gencode arch=compute_37,code=sm_37 -gencode arch=compute_50,code=sm_50 -gencode arch=compute_52,code=sm_52 -gencode arch=compute_52,code=compute_52 -o deviceQuery.o -c deviceQuery.cpp “/usr/local/cuda-7.0″/bin/nvcc -ccbin g++ -m64 -gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30 […]

O que é um conflito bancário? (Fazendo programação Cuda / OpenCL)

Eu tenho lido o guia de programação para CUDA e OpenCL, e não consigo descobrir o que é um conflito bancário. Eles apenas mergulham em como resolver o problema sem elaborar sobre o assunto em si. Alguém pode me ajudar a entender isso? Não tenho preferência se a ajuda está no contexto de CUDA / […]

Desempenho de redesenho horrível do DataGridView em uma das minhas duas canvass

Eu realmente resolvi isso, mas estou postando para a posteridade. Eu me deparei com um problema muito estranho com o DataGridView no meu sistema de monitor duplo. O problema se manifesta como uma repetição EXTREMAMENTE lenta do controle ( como 30 segundos para uma repintura completa ), mas apenas quando está em uma das minhas […]

Noções básicas sobre dimensões de grade CUDA, dimensões de bloco e organização de threads (explicação simples)

Como os threads são organizados para serem executados por uma GPU?

Como medir o tempo do kernel interno no NVIDIA CUDA?

Eu quero medir tempo núcleo interno da GPU, como como medi-lo em NVIDIA CUDA? por exemplo __global__ void kernelSample() { some code here get start time some code here get stop time some code here }

Como a memory CUDA é gerenciada?

Quando executo meu programa CUDA, que aloca apenas uma pequena quantidade de memory global (abaixo de 20 M), recebi um erro de “falta de memory”. (De mensagens de outras pessoas, acho que o problema está relacionado à fragmentação de memory) Eu tento entender esse problema e percebo que tenho algumas perguntas relacionadas ao gerenciamento de […]

Como os blocos / warps / threads do CUDA são mapeados nos núcleos CUDA?

Eu tenho usado o CUDA por algumas semanas, mas tenho algumas dúvidas sobre a alocação de blocos / warps / thread. Eu estou estudando a arquitetura do ponto de vista didático (projeto universitário), então alcançar o desempenho máximo não é problema meu. Primeiro de tudo, eu gostaria de entender se entendi esses fatos diretamente: O […]

Qual é a versão do cuda para nvidia 304.125

Eu estou usando o Ubuntu 14.04. Eu quero instalar o CUDA. Mas eu não sei qual versão é boa para o meu laptop. Eu traço minha unidade que é $cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.125 Mon Dec 1 19:58:28 PST 2014 GCC version: gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1) Tentei instalar CUDA […]