Articles of r

R: Como geocodificar um endereço simples usando o Data Science Toolbox

Estou farto da geocodificação do Google e decidi tentar uma alternativa. O Data Science Toolkit ( http://www.datasciencetoolkit.org ) permite que você geocodifique um número ilimitado de endereços. R tem um excelente pacote que serve como um wrapper para suas funções (CRAN: RDSTK). O pacote tem uma function chamada street2coordinates() que faz interface com o utilitário […]

Função não encontrada em R doParallel ‘foreach’ – Erro em {: task 1 failed – “não foi possível encontrar a function” raster “”

Estou tentando usar um cluster de alto desempenho na minha instituição pela primeira vez e tenho um problema que não consigo resolver. O código a seguir retorna um erro: ptime<-system.time({ r <- foreach(z = 1:length(files),.combine=cbind) %dopar% { raster <- raster(paste(folder,files[1],sep="")) data<-getValues(raster) clp <- na.omit(data) for(i in 1:length(classes)){ results[i,z]<-length(clp[clp==classes[i]])/length(clp) print(z) } } }) Error in { […]

Como adicionar uma coluna cumulativa a um dataframe R usando dplyr?

Eu tenho a mesma pergunta que este post , mas eu quero usar dplyr : Com um dataframe R, por exemplo: df <- data.frame(id = rep(1:3, each = 5) , hour = rep(1:5, 3) , value = sample(1:15)) Como faço para adicionar uma coluna de sum cumulativa que corresponda ao id? Sem dplyr a solução […]

use ggpairs para criar este enredo

Eu tenho algum código em um aplicativo shiny que produz o primeiro gráfico abaixo. Como você pode ver, o tamanho da fonte varia de acordo com o tamanho do coeficiente de correlação. Eu gostaria de produzir algo semelhante com ggpairs (GGally) ou ggplot2. A segunda imagem abaixo foi produzida com o seguinte código: library(GGally) ggpairs(df, […]

Adicionando espaço entre barras no ggplot2

Caro tudo, gostaria de adicionar espaços entre as barras no ggplot2. Esta página oferece uma solução: http://www.streamreader.org/stats/questions/6204/how-to-increase-the-space-between-the-bars-in-a-bar-plot-in-ggplot2 . Em vez de usar níveis de fator para os agrupamentos do eixo x, no entanto, essa solução cria uma sequência numérica, x.seq, para posicionar manualmente as barras e, em seguida, redimensioná-las usando o argumento width (). width […]

bigramas em vez de palavras únicas em matriz de documento termo usando R e Rweka

Eu encontrei uma maneira de usar bigrams em vez de tokens únicos em uma matriz de documentos de termo. A solução foi colocada em stackoverflow aqui: findAssocs para vários termos em R A ideia é algo assim: library(tm) library(RWeka) data(crude) #Tokenizer for n-grams and passed on to the term-document matrix constructor BigramTokenizer <- function(x) NGramTokenizer(x, […]

Tornar o condicionalPanel depende dos arquivos carregados com fileInput

Então, eu estou tentando fazer um aplicativo shiny, onde eu tenho um botão que só aparece se os arquivos foram carregados; para este im usando o condicionalPanel. ui.R: require(shiny) shinyUI(pageWithSidebar( headerPanel(“My App”), sidebarPanel( fileInput(“files”, “Choose file”), conditionalPanel( condition = “input.files”, actionButton(“submitFiles”, “Submit files for processing”))), mainPanel(h3(“Nothing to see here”)) )) Eu não acho que há […]

Gere N inteiros randoms que summ M em R

Eu gostaria de gerar N inteiros positivos randoms que summ a M Eu gostaria que os inteiros positivos randoms fossem selecionados em torno de uma distribuição razoavelmente normal, cuja média é M/N , com um pequeno desvio padrão (é possível definir isso como uma restrição?). Finalmente, como você generalizaria a resposta para gerar N números […]

Use nomes de variables ​​nas funções do dplyr

Eu quero usar nomes de variables ​​como seqüências de caracteres em funções de dplyr . Veja o exemplo abaixo: df <- data.frame( color = c("blue", "black", "blue", "blue", "black"), value = 1:5) filter(df, color == "blue") Funciona perfeitamente, mas eu gostaria de me referir a color por string, algo assim: var <- "color" filter(df, this_probably_should_be_a_function(var) […]

Plotar com colors condicionais baseadas em valores em R

Eu quero traçar um gráfico com colors diferentes com base em valores. Eu escrevi o código abaixo, np_graph <- data.frame(C1 = -5:5, C2 = -5:5) x=np_graph2$C1 y=np_graph2$C2 plot(x,y,xlab="PC1",ylab="PC2") Agora, se o valor de X for> 0, esse valor deverá estar em verde (no gráfico). se o valor de Y for> 0, esse valor deverá estar […]