Articles of plyr

Linhas únicas, considerando duas colunas, em R, sem ordem

Ao contrário das perguntas que encontrei, quero obter o exclusivo de duas colunas sem ordem. Eu tenho um df: df df [,1] [,2] [1,] “a” “b” [2,] “b” “d” [3,] “c” “e” [4,] “b” “a” Nesse caso, linha 1 e linha 4 são “duplicatas” no sentido de que ba é o mesmo que ba. Eu […]

Por que resume ou muta não funciona com group_by quando eu carrego `plyr` depois de` dplyr`?

Nota: O título desta questão foi editado para torná-la a questão canônica para problemas quando plyr funções plyr mascaram suas contrapartes dplyr . O resto da questão permanece inalterado. Suponha que eu tenha os seguintes dados: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F"), size = 29, replace […]

Como selecionar as linhas com valores máximos em cada grupo com dplyr?

Eu gostaria de selecionar uma linha com valor máximo em cada grupo com dplyr. Em primeiro lugar eu gerei alguns dados randoms para mostrar minha pergunta set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) No plyr, eu poderia usar uma function personalizada para selecionar essa linha. library(plyr) ddply(df, […]

Como criar uma variável de atraso dentro de cada grupo?

Eu tenho um data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a 3 -0.8204684 […]

Converter dados do formato longo para o formato amplo com várias colunas de medida

Estou com dificuldades para descobrir a maneira mais elegante e flexível de trocar dados de formato longo para formato amplo quando tenho mais de uma variável de medida que desejo acompanhar. Por exemplo, aqui está um quadro de dados simples em formato longo. ID é o sujeito, TIME é uma variável de tempo e X […]

Remodele o quadro de dados de três colunas para a matriz (formato “longo” para “amplo”)

Eu tenho um data.frame que se parece com isso. xa 1 xb 2 xc 3 ya 3 yb 3 yc 2 Eu quero isso em forma de matriz para que eu possa alimentá-lo ao mapa de calor para fazer um gráfico. O resultado deve ser algo como: abc x 1 2 3 y 3 3 […]