Articles of plyr

Existe uma function R que aplica uma function a cada par de colunas?

Muitas vezes preciso aplicar uma function a cada par de colunas em um dataframe / matriz e retornar os resultados em uma matriz. Agora eu sempre escrevo um loop para fazer isso. Por exemplo, para fazer uma matriz contendo os valores p de correlações, escrevo: df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100)) n <- ncol(df) foo <- matrix(0,n,n) for […]

Agregar um quadro de dados com base em pares não ordenados de colunas

Eu tenho um dataset que é algo como isto: id1 id2 size 1 5400 5505 7 2 5033 5458 1 3 5452 2873 24 4 5452 5213 2 5 5452 4242 26 6 4823 4823 4 7 5505 5400 11 Onde id2 e id2 são nós únicos em um gráfico, e size é um valor […]

Como strsplit diferente número de seqüências de caracteres em determinada coluna por fazer function

Eu tenho um problema com o valor da coluna dividida quando o elemento da coluna tem um número diferente de seqüências de caracteres. Eu posso fazer isso em plyr, por exemplo: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) […]

Aplicando uma function para cada linha de uma tabela usando dplyr?

Ao trabalhar com plyr , muitas vezes achei útil usar adply para funções escalares que eu tenho que aplicar a cada linha. por exemplo data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 […]

dplyr: “Erro na function n (): não deve ser chamado diretamente”

Eu estou tentando reproduzir um dos exemplos no pacote dplyr mas esta mensagem de erro. Espero ver uma nova coluna n produzida com a frequência de cada combinação. Alguém pode me dizer o que estou perdendo? Eu triplo verifiquei que o pacote está carregado. Obrigado pela ajuda, como sempre. library(dplyr) # summarise peels off a […]

dplyr resume: Equivalente de “.drop = FALSE” para manter grupos com comprimento zero na saída

Ao usar o summarise com a function ddply do ddply , as categorias vazias são descartadas por padrão. Você pode alterar esse comportamento adicionando .drop = FALSE . No entanto, isso não funciona ao usar summarise com dplyr . Existe outra maneira de manter categorias vazias no resultado? Aqui está um exemplo com dados falsos. […]

Agregue um dataframe em uma determinada coluna e exiba outra coluna

Eu tenho um dataframe no R da seguinte forma: > head(data) Group Score Info 1 1 1 a 2 1 2 b 3 1 3 c 4 2 4 d 5 2 3 e 6 2 1 f Eu gostaria de agregá-lo seguindo a coluna Score usando a function max > aggregate(data$Score, list(data$Group), max) Group.1 […]

Maneira mais rápida de adicionar linhas para valores ausentes em um data.frame?

Eu tenho uma coluna em meus conjuntos de dados em que os períodos de tempo ( Time ) são inteiros que variam de ab. Às vezes pode haver falta de períodos de tempo para qualquer grupo. Eu gostaria de preencher essas linhas com NA . Abaixo estão dados de exemplo para 1 (de vários 1000) […]

Agrupe por várias colunas e some outras colunas múltiplas

Eu tenho um quadro de dados com cerca de 200 colunas, a partir deles eu quero agrupar a tabela pelos primeiros 10 ou mais, que são fatores e summ o resto das colunas. Eu tenho uma lista de todos os nomes de coluna que eu quero agrupar por e a lista de todos os cols […]

Linhas únicas, considerando duas colunas, em R, sem ordem

Ao contrário das perguntas que encontrei, quero obter o exclusivo de duas colunas sem ordem. Eu tenho um df: df df [,1] [,2] [1,] “a” “b” [2,] “b” “d” [3,] “c” “e” [4,] “b” “a” Nesse caso, linha 1 e linha 4 são “duplicatas” no sentido de que ba é o mesmo que ba. Eu […]