Articles of r

R resumindo várias colunas com data.table

Eu estou tentando usar dados.table para acelerar o processamento de um grande data.frame (300k x 60) feito de vários data.frames mesclados menores. Eu sou novo em data.table. O código até agora é o seguinte library(data.table) a = data.table(index=1:5,a=rnorm(5,10),b=rnorm(5,10),z=rnorm(5,10)) b = data.table(index=6:10,a=rnorm(5,10),b=rnorm(5,10),c=rnorm(5,10),d=rnorm(5,10)) dt = merge(a,b,by=intersect(names(a),names(b)),all=T) dt$category = sample(letters[1:3],10,replace=T) e me perguntei se havia uma maneira mais […]

Como instalar a versão de desenvolvimento do repository github de pacotes R

Como posso instalar um pacote que está sendo desenvolvido diretamente de um repository do github e, uma vez instalado, como posso alternar entre versões de desenvolvimento e do CRAN? O pacote específico que eu estou interessado em instalar do git é ggplot2.

Configurando Manualmente as Cores do Grupo para ggplot2

Eu tenho um dataset do qual eu tenho que fazer várias dúzias de charts. Os dados consistem em 30 Grupos e várias medições dentro de cada grupo. A maioria dos charts não usa todos os grupos de uma vez. Meu objective é ter uma única paleta de colors para o conjunto de grupos, de modo […]

Como procurar por materiais “R”?

“O Google” é muito útil … a menos que o seu idioma seja chamado de “R”, caso em que ele libera toneladas de material irrelevante. Alguém tem algum truque de mecanismo de pesquisa para “R”? Existem alguns sites especializados, como os abaixo, mas como você pode dizer ao Google que você quer dizer “R” no […]

Como criar um exemplo de dataset a partir de dados privados (substituindo nomes e níveis de variables ​​por detentores não informativos)?

Para fornecer um exemplo reproduzível de uma abordagem, um dataset geralmente deve ser fornecido. Em vez de criar um dataset de exemplo, desejo usar alguns dos meus próprios dados. No entanto, esses dados não podem ser liberados. Desejo replace os nomes das variables ​​(coluna) e os níveis dos fatores por suportes não informativos (por exemplo, […]

Selecionando apenas colunas numéricas de um quadro de dados

Suponha que você tenha um data.frame como este: x <- data.frame(v1=1:20,v2=1:20,v3=1:20,v4=letters[1:20]) Como você selecionaria apenas as colunas em x que são numéricas?

Número do formato como largura fixa, com zeros à esquerda

O seguinte código a <- seq(1,101,25) b <- paste("name", 1:length(a), sep = "_") produz esta saída: “name_1” “name_26” “name_51” “name_76” “name_101” Eu gostaria de ter a mesma largura de todos os valores, o que significa preencher os valores com zeros como este: “name_001” “name_026” “name_051” “name_076” “name_101” Como faço para lidar com isso? (Esta questão […]

Colando valores variables ​​de fator em R ou Python com base na data – criando quebras de escola

Eu tenho o seguinte dataset ( Break_data ) coletado do calendar escolar começando e terminando os intervalos: print(Break_data) Start End Break Year 1 2016-02-24 2016-02-29 Spring_Break 2016 2 2016-03-23 2016-03-28 Easter_Recess 2016 3 2016-10-05 2016-10-10 Mid_Term_Break 2016 4 2017-03-01 2017-03-06 Spring_Break 2017 5 2017-04-12 2017-04-17 Easter_Recess 2017 6 2017-10-04 2017-10-09 Mid_Term_Break 2017 7 2018-02-28 2018-03-05 […]

Qual a maior pegadinha que você já encontrou?

Existe uma certa pegadinha que você realmente surpreendeu um dia? Acho que todos nós ganhamos ao compartilhar isso. Aqui está o meu: na indexação de listas, my.list[[1]] não é my.list[1] . Aprendi isso nos primeiros dias de R.

Aplicando uma function para cada linha de uma tabela usando dplyr?

Ao trabalhar com plyr , muitas vezes achei útil usar adply para funções escalares que eu tenho que aplicar a cada linha. por exemplo data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 […]