Articles of aprendizagem de máquina

Por que uma function de ativação não-linear deve ser usada em uma neural network de retropropagação?

Eu tenho lido algumas coisas em redes neurais e entendo o princípio geral de uma neural network de camada única. Eu entendo a necessidade de camadas adicionais, mas por que as funções de ativação não lineares são usadas? Esta questão é seguida por esta: O que é um derivado da function de ativação usada na […]

Perda e precisão – Essas curvas de aprendizado são razoáveis?

Estou aprendendo redes neurais e criei uma simples em Keras para a sorting de conjuntos de dados da íris do repository de aprendizado de máquina da UCI. Eu usei uma rede de camada oculta com 8 nós ocultos. O otimizador Adam é usado com uma taxa de aprendizado de 0,0005 e é executado por 200 […]

Qual é o parâmetro meta `weight_decay` no Caffe?

Olhando para um exemplo ‘solver.prototxt’ , postado no BVLC / caffe git, existe um meta parâmetro de treinamento weight_decay: 0.04 O que esse meta parâmetro significa? E qual valor devo atribuir a ele?

Caffe | solver.prototxt define a estratégia de configuração

No Caffe, estou tentando implementar uma Rede Totalmente Convolutiva para segmentação semântica. Eu queria saber se existe uma estratégia específica para configurar seus valores de ‘solver.prototxt’ para os seguintes hiper-parâmetros: test_iter test_interval iter_size max_iter Depende do número de imagens que você tem para o seu conjunto de treinamento? Se sim, como?

Reconhecimento de logotipo em imagens

Alguém sabe do trabalho acadêmico recente que foi feito em reconhecimento de logotipo em imagens? Por favor, responda apenas se você estiver familiarizado com este assunto específico (eu posso pesquisar no Google por “reconhecimento de logotipo” eu mesmo, muito obrigado). Qualquer pessoa que tenha conhecimento em visão computacional e tenha trabalhado no reconhecimento de objects […]

Como interpretar o caffe log com debug_info?

Ao enfrentar dificuldades durante o treinamento ( nan s , perda não converge , etc.), às vezes é útil consultar um registro de treinamento mais detalhado definindo debug_info: true no arquivo ‘solver.prototxt’ . O log de treinamento, em seguida, parece algo como: I1109 …] [Forward] Layer data, top blob data data: 0.343971 I1109 …] [Forward] […]

Causas comuns de nans durante o treinamento

Tenho notado que uma ocorrência freqüente durante o treinamento é a introdução da NAN . Muitas vezes parece ser introduzido por pesos em produtos internos / totalmente conectados ou explodir camadas de convolução. Isso está ocorrendo porque a computação de gradiente está explodindo? Ou é por causa da boot do peso (nesse caso, por que […]

Encontrar vizinhos K mais próximos e sua implementação

Eu estou trabalhando na sorting de dados simples usando KNN com distância euclidiana. Eu vi um exemplo sobre o que eu gostaria de fazer que é feito com a function knnsearch do MATLAB como mostrado abaixo: load fisheriris x = meas(:,3:4); gscatter(x(:,1),x(:,2),species) newpoint = [5 1.45]; [n,d] = knnsearch(x,newpoint,’k’,10); line(x(n,1),x(n,2),’color’,[.5 .5 .5],’marker’,’o’,’linestyle’,’none’,’markersize’,10) O código acima […]

Um guia para convert_imageset.cpp

Eu sou relativamente novo no aprendizado de máquina / python / ubuntu. Eu tenho um conjunto de imagens no formato .jpg, onde metade contém um recurso que eu quero aprender e metade não. Estou tendo problemas em encontrar uma maneira de convertê-los para o formato requerido do lmdb. Eu tenho os arquivos de input de […]