Articles of cuda

Qual é a versão do cuda para nvidia 304.125

Eu estou usando o Ubuntu 14.04. Eu quero instalar o CUDA. Mas eu não sei qual versão é boa para o meu laptop. Eu traço minha unidade que é $cat /proc/driver/nvidia/version NVRM version: NVIDIA UNIX x86_64 Kernel Module 304.125 Mon Dec 1 19:58:28 PST 2014 GCC version: gcc version 4.8.2 (Ubuntu 4.8.2-19ubuntu1) Tentei instalar CUDA […]

Reduza as linhas da matriz com CUDA

Windows 7, NVidia GeForce 425M. Eu escrevi um código CUDA simples que calcula as sums de linha de uma matriz. A matriz tem representação unidimensional (ponteiro para um float). A versão serial do código está abaixo (tem 2 loops, como esperado): void serial_rowSum (float* m, float* output, int nrow, int ncol) { float sum; for […]

Como faço para iniciar um aplicativo CUDA no Visual Studio 2010?

Pergunta Direta: Como faço para criar um projeto Hello World CUDA simples no visual studio 2010? Background: Eu escrevi kernels CUDA. Eu estou intimamente familiarizado com os arquivos .vcproj do Visual Studio 2005 – tweaked vários à mão. No VS 2005, se eu quiser construir um kernel CUDA, incluo uma regra de compilation personalizada e, […]

Empurrar dentro de kernels escritos pelo usuário

Eu sou um novato em Thrust. Vejo que todas as apresentações e exemplos do Thrust mostram apenas o código do host. Gostaria de saber se posso passar um device_vector para o meu próprio kernel? Como? Se sim, quais são as operações permitidas dentro do kernel / código do dispositivo?

O limite de CUDA parece ser alcançado, mas que limite é esse?

Eu tenho um programa CUDA que parece estar atingindo algum tipo de limite de algum recurso, mas não consigo descobrir qual é esse recurso. Aqui está a function do kernel: __global__ void DoCheck(float2* points, int* segmentToPolylineIndexMap, int segmentCount, int* output) { int segmentIndex = threadIdx.x + blockIdx.x * blockDim.x; int pointCount = segmentCount + 1; […]

Como inicio um novo projeto CUDA no Visual Studio 2008?

Essa é uma pergunta incrivelmente básica, mas como faço para iniciar um novo projeto CUDA no Visual Studio 2008? Eu encontrei toneladas e toneladas de documentação sobre assuntos relacionados a CUDA, mas nada sobre como iniciar um novo projeto. Eu estou trabalhando com o Windows 7 x 64 Visual Studio 2008 C ++. Eu realmente […]

Usando Java com GPU da Nvidia (cuda)

Estou trabalhando em um projeto de negócios que é feito em java e precisa de grande poder de computação para computar os mercados de negócios. Matemática simples, mas com enorme quantidade de dados. Nós pedimos alguns cuda gpu para experimentá-lo com e desde que o Java não é suportado pelo cuda, estou querendo saber por […]

falha de segmentação cudaMemcpy

Eu tenho sido assombrado por esse erro por um bom tempo, então decidi postar aqui. Essa falha de segmentação aconteceu quando um cudaMemcpy é chamado: CurrentGrid->cdata[i] = new float[size]; cudaMemcpy(CurrentGrid->cdata[i], Grid_dev->cdata[i], size*sizeof(float),\ cudaMemcpyDeviceToHost); CurrentGrid e Grid_dev são ponteiro para um object de class de grid no host e dispositivo respectivamente e i = 0 neste […]

Falha de boot não especificada no Memcpy

Estou encontrando uma “falha de boot não especificada” ao executar meu programa no Cuda. Eu verifiquei os erros. O programa é um solucionador de uma equação diferencial. Itera TOTAL_ITER vezes. ROOM_X e ROOM_Y são a largura e a altura das matrizes. Aqui está o header, seu nome é “único: #define ITER_BETWEEN_SAVES 10000 #define TOTAL_ITER 10000 […]

Como posso adicionar dois arrays 2D (inclinados) usando loops nesteds?

Eu sou novo no cuda. Eu quero adicionar dois 2d array em um terceiro array. Eu uso o seguinte código: cudaMallocPitch((void**)&device_a, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_b, &pitch, 2*sizeof(int),2); cudaMallocPitch((void**)&device_c, &pitch, 2*sizeof(int),2); agora meu problema é que eu não quero usar esses array como array 2D achatado todos no meu código do kernel eu quero di é usar […]