Articles of r faq

Passar um nome de coluna data.frame para uma function

Eu estou tentando escrever uma function para aceitar um data.frame ( x ) e uma column dele. A function executa alguns cálculos em x e depois retorna outro data.frame. Eu estou preso no método de melhores práticas para passar o nome da coluna para a function. Os dois exemplos mínimos fun1 e fun2 abaixo produzem […]

Encontre o complemento de um quadro de dados (anti-join)

Eu tenho dois frameworks de dados (df e df1). df1 é um subconjunto de df. Eu quero obter um quadro de dados que é complemento de df1 em df, ou seja, linhas de retorno do primeiro dataset que não são correspondidos no segundo. Por exemplo, vamos quadro de dados df: heads row1 row2 row3 row4 […]

Remover linhas duplicadas

Eu li um arquivo CSV em um data.frame R. Algumas das linhas têm o mesmo elemento em uma das colunas. Gostaria de remover linhas que são duplicatas nessa coluna. Por exemplo: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost 1 platform_external_dbus 202 16 users.sourceforge 8 platform_external_dbus 202 16 hughsie […]

Como faço para instalar um pacote R a partir do código-fonte?

Um amigo me enviou ao longo deste ótimo tutorial em webscraping NYtimes com R. Eu realmente adoraria tentar. No entanto, o primeiro passo é instalar um pacote chamado RJSONIO da origem. Eu sei R razoavelmente bem, mas não tenho idéia de como instalar um pacote da fonte. Estou executando o Mac OSX.

Adicionar legenda ao gráfico de linha ggplot2

Eu tenho uma pergunta sobre legendas no ggplot2. Consegui traçar três linhas no mesmo gráfico e quero adicionar uma legenda com as três colors usadas. Este é o código usado library(ggplot2) require(RCurl) link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt") datos<- read.csv(textConnection(link),header=TRUE,sep=";") datos$fecha <- as.POSIXct(datos[,1], format="%d/%m/%Y") temp = ggplot(data=datos,aes(x=fecha, y=TempMax,colour="1")) + geom_line(colour="red") + opts(title="TITULO") + ylab("Temperatura (C)") + xlab(" ") + scale_y_continuous(limits […]

Solte as colunas do frame de dados por nome

Eu tenho um número de colunas que gostaria de remover de um quadro de dados. Eu sei que podemos excluí-los individualmente usando algo como: df$x <- NULL Mas eu estava esperando fazer isso com menos comandos. Além disso, sei que posso descartar colunas usando indexação inteira como esta: df <- df[ -c(1, 3:6, 12) ] […]

Existe uma function incorporada para encontrar o modo?

Em R, mean() e median() são funções padrão que fazem o que você espera. mode() informa o modo de armazenamento interno do object, não o valor que ocorre mais em seu argumento. Mas existe uma function de biblioteca padrão que implementa o modo estatístico para um vetor (ou lista)?

Calcule a média do grupo (ou outras statistics de resumo) e atribua a dados originais

Eu quero calcular mean (ou qualquer outra estatística de resumo de comprimento um, por exemplo, min , max , length , sum ) de uma variável numérica (“valor”) dentro de cada nível de uma variável de agrupamento (“grupo”). A estatística de resumo deve ser atribuída a uma nova variável que tenha o mesmo tamanho que […]

Como depurar o erro “os contrastes podem ser aplicados apenas a fatores com 2 ou mais níveis”?

Aqui estão todas as variables ​​com as quais estou trabalhando: str(ad.train) $ Date : Factor w/ 427 levels “2012-03-24″,”2012-03-29”,..: 4 7 12 14 19 21 24 29 31 34 … $ Team : Factor w/ 18 levels “Adelaide”,”Brisbane Lions”,..: 1 1 1 1 1 1 1 1 1 1 … $ Season : int 2012 […]

Quais são as diferenças entre “=” e “<-" em R?

Quais são as diferenças entre os operadores de atribuição = e <- em R? Eu sei que os operadores são um pouco diferentes, como mostra este exemplo x <- y <- 5 x = y = 5 x = y <- 5 x <- y = 5 # Error in (x <- y) = 5 […]