Articles of plyr

dplyr: “Erro na function n (): não deve ser chamado diretamente”

Eu estou tentando reproduzir um dos exemplos no pacote dplyr mas esta mensagem de erro. Espero ver uma nova coluna n produzida com a frequência de cada combinação. Alguém pode me dizer o que estou perdendo? Eu triplo verifiquei que o pacote está carregado. Obrigado pela ajuda, como sempre. library(dplyr) # summarise peels off a […]

dplyr resume: Equivalente de “.drop = FALSE” para manter grupos com comprimento zero na saída

Ao usar o summarise com a function ddply do ddply , as categorias vazias são descartadas por padrão. Você pode alterar esse comportamento adicionando .drop = FALSE . No entanto, isso não funciona ao usar summarise com dplyr . Existe outra maneira de manter categorias vazias no resultado? Aqui está um exemplo com dados falsos. […]

Agregue um dataframe em uma determinada coluna e exiba outra coluna

Eu tenho um dataframe no R da seguinte forma: > head(data) Group Score Info 1 1 1 a 2 1 2 b 3 1 3 c 4 2 4 d 5 2 3 e 6 2 1 f Eu gostaria de agregá-lo seguindo a coluna Score usando a function max > aggregate(data$Score, list(data$Group), max) Group.1 […]

Maneira mais rápida de adicionar linhas para valores ausentes em um data.frame?

Eu tenho uma coluna em meus conjuntos de dados em que os períodos de tempo ( Time ) são inteiros que variam de ab. Às vezes pode haver falta de períodos de tempo para qualquer grupo. Eu gostaria de preencher essas linhas com NA . Abaixo estão dados de exemplo para 1 (de vários 1000) […]

Agrupe por várias colunas e some outras colunas múltiplas

Eu tenho um quadro de dados com cerca de 200 colunas, a partir deles eu quero agrupar a tabela pelos primeiros 10 ou mais, que são fatores e summ o resto das colunas. Eu tenho uma lista de todos os nomes de coluna que eu quero agrupar por e a lista de todos os cols […]

Linhas únicas, considerando duas colunas, em R, sem ordem

Ao contrário das perguntas que encontrei, quero obter o exclusivo de duas colunas sem ordem. Eu tenho um df: df df [,1] [,2] [1,] “a” “b” [2,] “b” “d” [3,] “c” “e” [4,] “b” “a” Nesse caso, linha 1 e linha 4 são “duplicatas” no sentido de que ba é o mesmo que ba. Eu […]

Por que resume ou muta não funciona com group_by quando eu carrego `plyr` depois de` dplyr`?

Nota: O título desta questão foi editado para torná-la a questão canônica para problemas quando plyr funções plyr mascaram suas contrapartes dplyr . O resto da questão permanece inalterado. Suponha que eu tenha os seguintes dados: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F"), size = 29, replace […]

Como selecionar as linhas com valores máximos em cada grupo com dplyr?

Eu gostaria de selecionar uma linha com valor máximo em cada grupo com dplyr. Em primeiro lugar eu gerei alguns dados randoms para mostrar minha pergunta set.seed(1) df <- expand.grid(list(A = 1:5, B = 1:5, C = 1:5)) df$value <- runif(nrow(df)) No plyr, eu poderia usar uma function personalizada para selecionar essa linha. library(plyr) ddply(df, […]

Como criar uma variável de atraso dentro de cada grupo?

Eu tenho um data.table: set.seed(1) data <- data.table(time = c(1:3, 1:4), groups = c(rep(c("b", "a"), c(3, 4))), value = rnorm(7)) data # groups time value # 1: b 1 -0.6264538 # 2: b 2 0.1836433 # 3: b 3 -0.8356286 # 4: a 1 1.5952808 # 5: a 2 0.3295078 # 6: a 3 -0.8204684 […]

Converter dados do formato longo para o formato amplo com várias colunas de medida

Estou com dificuldades para descobrir a maneira mais elegante e flexível de trocar dados de formato longo para formato amplo quando tenho mais de uma variável de medida que desejo acompanhar. Por exemplo, aqui está um quadro de dados simples em formato longo. ID é o sujeito, TIME é uma variável de tempo e X […]