Articles of r

Extraia uma coluna dplyr tbl como um vetor

Existe uma maneira mais sucinta de obter uma coluna de um dinderr tbl como vetor, a partir de um tbl com back-end de database (ou seja, o quadro / tabela de dados não pode ser subconjunto diretamente)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Isso teria sido muito […]

Subscrito fora dos limites – definição geral e solução?

Ao trabalhar com o RI, freqüentemente receba a mensagem de erro “subscript out of bounds”. Por exemplo : # Load necessary libraries and data library(igraph) library(NetData) data(kracknets, package = “NetData”) # Reduce dataset to nonzero edges krack_full_nonzero_edges 0 | friendship_tie > 0 | reports_to_tie > 0)) # convert to graph data farme krack_full <- graph.data.frame(krack_full_nonzero_edges) […]

Como obter um geom_vline vertical para um eixo x de data de class?

Embora eu tenha encontrado o post de Hadley no grupo do google em POSIXct e geom_vline , eu não consegui terminar. Eu tenho uma série de tempo e gostaria de desenhar uma linha vertical para os anos de 1998, 2005 e 2010, por exemplo. Eu tentei com a syntax qplot e qplot , mas ainda […]

R: O ggplot não funciona se estiver dentro de um loop for embora funcione fora dele

Estou usando uma function ggplot simples que funciona bem fora de um loop, mas não dentro, mesmo que o valor iterativo não interfira na function ggplot. Por que é tão ? Aqui está meu código x=1:7 y=1:7 df = data.frame(x=x,y=y) ggplot(df,aes(x,y))+geom_point() Funciona ! Mas se o ggplot estiver dentro de um loop for … for […]

Windows 7, problema update.packages: “incapaz de mover instalação temporária”?

Estou usando o R 2.13.0 com o windows 7, depois de dar privilégios completos ao meu usuário para a pasta R (conforme descrito aqui ). Isso me permite instalar novos pacotes muito bem. No entanto, ao usar update.packages (), para atualizar pacotes existentes, continuo recebendo o seguinte erro (por exemplo, ao atualizar o pacote MASS): […]

YAML data atual em rmarkdown

Eu estou querendo saber se há um truque para colocar a data atual na frente do YAML de um documento .rmd a ser processado pelo knitr e pelo pacote rmarkdown . Eu costumava ter a seguinte linha no topo das minhas páginas wiki, _baptiste, `r format(Sys.time(), “%d %B, %Y”)`_ e seria convertido para baptiste, 03 […]

R passar índices de coluna variável para ggplot2

Eu estou tentando passar os índices de coluna para ggplot como parte de uma function que vou usar repetidamente. gostar: myplot <- function(df){ ggplot(df, aes(df[, 1], df[, 2])) + geom_point() } Sempre usarei a primeira coluna como minha variável xea segunda coluna como minha variável y, mas os nomes das colunas serão alterados entre os […]

Remover uma coluna inteira de um data.frame em R

Alguém sabe como remover uma coluna inteira de um data.frame em R? Por exemplo, se eu receber este data.frame: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon e eu quero remover a segunda coluna.

Por que X join de data.tables não permite uma junit externa completa ou uma junit esquerda?

Esta é uma questão filosófica sobre data.table join syntax. Eu estou encontrando mais e mais usos para data.tables, mas ainda aprendendo … O formato de junit X[Y] para data.tables é muito conciso, prático e eficiente, mas, até onde eu sei, ele apenas suporta junções internas e junções externas à direita. Para obter uma junit externa […]

Como remover outliers de um dataset

Eu tenho alguns dados multivariados de beleza versus idades. As idades variam de 20-40 em intervalos de 2 (20, 22, 24 … 40), e para cada registro de dados, eles recebem uma idade e uma sorting de beleza de 1-5. Quando faço boxplots desses dados (idades ao longo do eixo X, classificações de beleza em […]