Articles of r

Maneira mais rápida de adicionar linhas para valores ausentes em um data.frame?

Eu tenho uma coluna em meus conjuntos de dados em que os períodos de tempo ( Time ) são inteiros que variam de ab. Às vezes pode haver falta de períodos de tempo para qualquer grupo. Eu gostaria de preencher essas linhas com NA . Abaixo estão dados de exemplo para 1 (de vários 1000) […]

Estilo do dictionary substitui vários itens

Eu tenho um grande data.frame de dados de caracteres que eu quero converter com base no que é comumente chamado de dictionary em outros idiomas. Atualmente eu estou indo sobre isso assim: foo <- data.frame(snp1 = c("AA", "AG", "AA", "AA"), snp2 = c("AA", "AT", "AG", "AA"), snp3 = c(NA, "GG", "GG", "GC"), stringsAsFactors=FALSE) foo <- […]

Fusão / substituição condicional em R

Eu tenho dois frameworks de dados: df1 x1 x2 1 a 2 b 3 c 4 d e df2 x1 x2 2 zz 3 qq Eu quero replace alguns dos valores em df1 $ x2 com valores em df2 $ x2 com base na correspondência condicional entre df1 $ x1 e df2 $ x2 para […]

Maneira fácil de converter o formato longo para o grande com contagens

Eu tenho o seguinte dataset: sample.data <- data.frame(Step = c(1,2,3,4,1,2,1,2,3,1,1), Case = c(1,1,1,1,2,2,3,3,3,4,5), Decision = c("Referred","Referred","Referred","Approved","Referred","Declined","Referred","Referred","Declined","Approved","Declined")) sample.data Step Case Decision 1 1 1 Referred 2 2 1 Referred 3 3 1 Referred 4 4 1 Approved 5 1 2 Referred 6 2 2 Declined 7 1 3 Referred 8 2 3 Referred 9 3 3 […]

Como posso colocar uma escala transformada no lado direito de um ggplot2?

Estou criando um gráfico mostrando a mudança nos níveis do lago ao longo do tempo. Anexei um exemplo simples abaixo. Gostaria de adicionar uma escala (marcas de escala e anotação) no lado direito do gráfico que mostra a elevação em pés. Eu sei que o ggplot2 não permite duas escalas diferentes (veja Gráfico com dois […]

Existe uma function R para encontrar o índice de um elemento em um vetor?

Em R, eu tenho um elemento x um vetor v . Eu quero encontrar o primeiro índice de um elemento em v que é igual a x . Eu sei que uma maneira de fazer isso é: which(x == v)[[1]] , mas isso parece excessivamente ineficiente. Existe uma maneira mais direta de fazer isso? Para […]

tipo de dados equivalente long / bigint / decimal em R

Quais opções de dados temos para lidar com grandes números em R? Por padrão, o tamanho de um número inteiro parece ser de 32 bits, portanto, números bigint do sql server, assim como qualquer número grande passado de python via rpy2, são desconfigurados. > 123456789123 [1] 123456789123 > 1234567891234 [1] 1.234568e+12 Ao ler um valor […]

Remodelar várias colunas de valor para o formato amplo

Eu tenho o seguinte quadro de dados e eu quero usar o cast para criar uma “tabela dinâmica” com colunas para dois valores (valor e porcentagem). Aqui está o quadro de dados: expensesByMonth <- structure(list(month = c("2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-02-01", "2012-03-01", "2012-03-01", "2012-03-01", "2012-03-01", "2012-03-01", "2012-03-01", "2012-03-01", […]

combinando dois frameworks de dados de diferentes comprimentos

Eu tenho dois frameworks de dados. O primeiro é de apenas uma coluna e 10 linhas. O segundo é de 3 colunas e 50 linhas. Quando tento combinar isso usando o cbind , ele apresenta este erro: Erro no data.frame (…, check.names = FALSE): Alguém pode sugerir outra function para fazer isso? PS Eu tentei […]

Colar várias colunas juntas

Eu tenho um monte de colunas em um dataframe que eu quero colar juntos (separados por “-“) da seguinte forma: data <- data.frame('a' = 1:3, 'b' = c('a','b','c'), 'c' = c('d', 'e', 'f'), 'd' = c('g', 'h', 'i')) ie abcd 1 adg 2 beh 3 cfi Qual eu quero me tornar: ax 1 adg 2 […]