Articles of dplyr

mutate_each / summarise_each em dplyr: como seleciono determinadas colunas e atribuo novos nomes a colunas com mutação?

Estou um pouco confuso sobre o verbo mutate_each. É bastante simples usar a mutate básica para transformar uma coluna de dados em, por exemplo, z-scolors, e criar uma nova coluna em seu data.frame (aqui com o nome z_score_data ): newDF % select(one_column) %>% mutate(z_score_data = one_column – (mean(one_column) / sd(one_column)) No entanto, como tenho muitas […]

dplyr left_join por menos que, maior que condição

Esta questão é de alguma forma relacionada a questões mesclando eficientemente dois frameworks de dados em um critério não-trivial e verificar se a data é entre duas datas em r . E o que eu postei aqui solicitando se o recurso existe: questão do GitHub Eu estou olhando para juntar dois frameworks de dados usando […]

dplyr: Como usar group_by dentro de uma function?

Eu quero usar use a function dplyr::group_by dentro de outra function, mas eu não sei como passar os argumentos para essa function. Alguém pode fornecer um exemplo de trabalho? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n = n()) # ## Source: local data frame [3 x 2] ## Species n ## 1 virginica 50 ## […]

Como strsplit diferente número de seqüências de caracteres em determinada coluna por fazer function

Eu tenho um problema com o valor da coluna dividida quando o elemento da coluna tem um número diferente de seqüências de caracteres. Eu posso fazer isso em plyr, por exemplo: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) […]

dplyr mutate rowSums cálculos ou funções personalizadas

Estou tentando mudar uma nova variável do tipo de cálculo de linha, digamos rowSums como abaixo iris %>% mutate_(sumVar = iris %>% select(Sepal.Length:Petal.Width) %>% rowSums) o resultado é que “sumVar” é truncado para seu primeiro valor (10.2): Source: local data frame [150 x 6] Groups: Sepal.Length Sepal.Width Petal.Length Petal.Width Species sumVar 1 5.1 3.5 1.4 […]

Aplicando uma function para cada linha de uma tabela usando dplyr?

Ao trabalhar com plyr , muitas vezes achei útil usar adply para funções escalares que eu tenho que aplicar a cada linha. por exemplo data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 […]

Média rolante (média móvel) por grupo / id com dplyr

Eu tenho um acompanhamento longitudinal das gravações de pressão arterial. O valor em um determinado ponto é menos preditivo do que a média móvel (média móvel), e é por isso que eu gostaria de calculá-lo. Os dados parecem test <- read.table(header=TRUE, text = " ID AGE YEAR_VISIT BLOOD_PRESSURE TREATMENT 1 20 2000 NA 3 1 […]

Ordem de barra empilhada inversa

Estou criando um gráfico de barras empilhadas usando o ggplot assim: plot_df <- df[!is.na(df$levels), ] ggplot(plot_df, aes(group)) + geom_bar(aes(fill = levels), position = "fill") O que me dá algo assim: Como faço para inverter a ordem das barras empilhadas, de modo que o nível 1 esteja na parte inferior e o nível 5 esteja na […]

Remover linhas duplicadas usando dplyr

Eu tenho um data.frame como este – set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df xyz 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Gostaria […]

Linha de filtragem que contém uma determinada string usando dplyr

Eu tenho que filtrar um quadro de dados usando como critério a linha em que está contida a string RTB . Estou usando o dplyr . d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Eu sei que posso usar o filter function no dplyr mas não sei exatamente como dizê-lo para verificar […]