Articles of data.table

Erro: falha no pacote ou no espaço de nomes para ggplot2 e para data.table

Não consigo abrir os pacotes ggplot2 e data.table. Isso me dá o seguinte erro (exemplo para ggplot2) > library(ggplot2) Error in loadNamespace(j <- i[[1L]], c(lib.loc, .libPaths()), versionCheck = vI[[j]]) : there is no package called 'Rcpp' Error: package or namespace load failed for 'ggplot2' Consegui trabalhar bem com esses 2 pacotes antes de fechar minha […]

Selecione o subconjunto de colunas em data.table R

Eu tenho uma tabela de dados com um monte de colunas, por exemplo: dt<-data.table(matrix(runif(10*10),10,10)) Eu quero executar alguma operação na tabela de dados, como a produção de uma matriz de correlação ( cor(dt) ). Para fazer isso, desejo remover algumas colunas que contêm valores não numéricos ou valores fora de um determinado intervalo. Digamos que […]

Como replace os valores de NA em uma tabela * para colunas selecionadas *? data.frame, data.table

Há muitos posts sobre como replace os valores de NA. Estou ciente de que alguém poderia replace NAs na seguinte tabela / frame com o seguinte: x[is.na(x)]<-0 Mas, e se eu quiser restringi-lo apenas a certas colunas? Deixe-me mostrar um exemplo. Primeiro, vamos começar com um dataset. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, […]

Por que X join de data.tables não permite uma junit externa completa ou uma junit esquerda?

Esta é uma questão filosófica sobre data.table join syntax. Eu estou encontrando mais e mais usos para data.tables, mas ainda aprendendo … O formato de junit X[Y] para data.tables é muito conciso, prático e eficiente, mas, até onde eu sei, ele apenas suporta junções internas e junções externas à direita. Para obter uma junit externa […]

Meta-programação Data.table

Eu acho que a meta-programação é o termo certo aqui. Eu quero ser capaz de usar data.table muito como se usaria o MySQL em dizer um webapp. Ou seja, os usuários da Web usam algum front-end da Web (como o servidor Shiny, por exemplo) para selecionar uma base de dados, selecionar colunas para filtrar, selecionar […]

Caminho correto / mais rápido para reformular um data.table

Eu tenho uma tabela de dados em R: library(data.table) set.seed(1234) DT <- data.table(x=rep(c(1,2,3),each=4), y=c("A","B"), v=sample(1:100,12)) DT xyv [1,] 1 A 12 [2,] 1 B 62 [3,] 1 A 60 [4,] 1 B 61 [5,] 2 A 83 [6,] 2 B 97 [7,] 2 A 1 [8,] 2 B 22 [9,] 3 A 99 [10,] 3 […]

Maneira mais rápida de adicionar linhas para valores ausentes em um data.frame?

Eu tenho uma coluna em meus conjuntos de dados em que os períodos de tempo ( Time ) são inteiros que variam de ab. Às vezes pode haver falta de períodos de tempo para qualquer grupo. Eu gostaria de preencher essas linhas com NA . Abaixo estão dados de exemplo para 1 (de vários 1000) […]

Selecione várias colunas em data.table por seus índices numéricos

Como podemos selecionar várias colunas usando um vetor de seus índices numéricos (posição) em data.table ? É assim que faríamos com um data.frame : df <- data.frame(a = 1, b = 2, c = 3) df[ , 2:3] # bc # 1 2 3

Maneira eficiente de rbind data.frames com diferentes colunas

Eu tenho uma lista de frameworks de dados com diferentes conjuntos de colunas, gostaria de combiná-los por linhas em um quadro de dados. Eu uso o plyr::rbind.fill para fazer isso. Eu estou procurando algo que faria isso de forma mais eficiente. Semelhante à resposta dada aqui require(plyr) set.seed(45) sample.fun <- function() { nam <- sample(LETTERS, […]

.EACHI em data.table?

Não consigo encontrar nenhuma documentação sobre o que exatamente .EACHI faz em data.table . Eu vejo uma breve menção na documentação: A agregação para um subconjunto de grupos conhecidos é particularmente eficiente ao passar esses grupos em i e definindo by=.EACHI . Quando i é um data.table, DT[i,j,by=.EACHI] avalia j para os grupos de DT […]