Articles of r

Por que X join de data.tables não permite uma junit externa completa ou uma junit esquerda?

Esta é uma questão filosófica sobre data.table join syntax. Eu estou encontrando mais e mais usos para data.tables, mas ainda aprendendo … O formato de junit X[Y] para data.tables é muito conciso, prático e eficiente, mas, até onde eu sei, ele apenas suporta junções internas e junções externas à direita. Para obter uma junit externa […]

Como remover outliers de um dataset

Eu tenho alguns dados multivariados de beleza versus idades. As idades variam de 20-40 em intervalos de 2 (20, 22, 24 … 40), e para cada registro de dados, eles recebem uma idade e uma sorting de beleza de 1-5. Quando faço boxplots desses dados (idades ao longo do eixo X, classificações de beleza em […]

Como o predict.lm () calcula o intervalo de confiança e o intervalo de previsão?

Eu corri uma regressão: CopierDataRegression <- lm(V1~V2, data=CopierData1) e minha tarefa era obter um Intervalo de confiança de 90% para a resposta média dada V2=6 e Intervalo de previsão de 90% quando V2=6 . Eu usei o seguinte código: X6 <- data.frame(V2=6) predict(CopierDataRegression, X6, se.fit=TRUE, interval="confidence", level=0.90) predict(CopierDataRegression, X6, se.fit=TRUE, interval="prediction", level=0.90) e eu tenho […]

Alterando os nomes das colunas de um quadro de dados

Eu tenho um quadro de dados chamado “newprice” (veja abaixo) e eu quero mudar os nomes das colunas no meu programa em R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Na verdade, isso é o que estou fazendo: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Eu não coloquei isso […]

Cortando um arquivo csv enorme (3,5 GB) para ler em R

Então eu tenho um arquivo de dados (ponto-e-vírgula separado) que tem muitos detalhes e linhas incompletas (levando Access e SQL a sufocar). É o dataset no nível do condado dividido em segmentos, sub-segmentos e sub-sub-segmentos (para um total de ~ 200 fatores) por 40 anos. Em suma, é enorme e não vai caber na memory […]

Como numerar / rotular tabela de dados por número de grupo de group_by?

Eu tenho um tbl_df onde eu quero group_by(u, v) para cada combinação de números distintos observada com (u, v) . EDIT: isso foi resolvido adicionando group_indices() volta em dplyr 0.4.0 a) Então eu quero atribuir a cada grupo distinto algum número arbitrário de label distinto = 1,2,3 … por exemplo, a combinação (u, v) == […]

Aumentar o número de marcas no eixo

Estou gerando charts para alguns dados, mas o número de ticks é muito pequeno, preciso de mais precisão na leitura. Existe alguma maneira de aumentar o número de marcas de eixo no ggplot2? Eu sei que posso dizer ggplot para usar um vetor como eixo tiques, mas o que eu quero é aumentar o número […]

Quais são as formas de editar uma function em R?

Vamos supor que temos a seguinte function: foo <- function(x) { line1 <- x line2 <- 0 line3 <- line1 + line2 return(line3) } E que queremos mudar a segunda linha a ser: line2 <- 2 Como você faria isso? Uma maneira é usar fix(foo) E mude a function. Outra maneira é apenas escrever a […]

Gráfico de barras empilhadas

Eu gostaria de criar um gráfico empilhado usando ggplot2 e geom_bar. Aqui estão os meus dados de origem: Rank F1 F2 F3 1 500 250 50 2 400 100 30 3 300 155 100 4 200 90 10 Eu quero um gráfico empilhado onde x é a sorting e y são os valores em F1, […]

Agregue um dataframe em uma determinada coluna e exiba outra coluna

Eu tenho um dataframe no R da seguinte forma: > head(data) Group Score Info 1 1 1 a 2 1 2 b 3 1 3 c 4 2 4 d 5 2 3 e 6 2 1 f Eu gostaria de agregá-lo seguindo a coluna Score usando a function max > aggregate(data$Score, list(data$Group), max) Group.1 […]