Articles of r

Como excluir linhas de um dataframe que contenha n * NA

Eu tenho um número de grandes conjuntos de dados com ~ 10 colunas e ~ 200.000 linhas. Nem todas as colunas contêm valores para cada linha, embora pelo menos uma coluna deva conter um valor para a linha estar presente, gostaria de definir um limite para quantas NA são permitidas em uma linha. Meu Dataframe […]

Determine a coluna de caracteres e encontre valores únicos

Eu tenho um dataframe com a seguinte estrutura test <- data.frame(col = c('a; ff; cc; rr;', 'rr; a; cc; e;')) Agora, quero criar um dataframe a partir dele que contenha uma coluna nomeada para cada um dos valores exclusivos no dataframe de teste. Um valor único é um valor finalizado por ‘;’ personagem e começando […]

Sequenciar todos os inteiros entre dois vetores em R

Eu tenho dois vetores: Start = c(1,10,20) Finish = c(9,19,30) Eu gostaria que algo assim funcionasse … Início: terminar Mas é claro que isso não acontece . Eu gostaria de produzir uma lista como a seguinte: [1] 1,2,3,4,5,6,7,8,9 [2] 10 11 12 13 14 15 16 17 18 19 [3] 20 21 22 23 24 […]

Anexar um object a uma lista em R no tempo constante amortizado, O (1)?

Se eu tiver alguma lista mylist , você pode acrescentar um item obj a ele da seguinte forma: mylist[[length(mylist)+1]] <- obj Mas certamente há uma maneira mais compacta. Quando eu era novo no R, eu tentei escrever o lappend() assim: lappend <- function(lst, obj) { lst[[length(lst)+1]] <- obj return(lst) } mas é claro que isso […]

Alternar, entrelaçar ou entrelaçar dois vetores

Eu quero entrelaçar dois vetores do mesmo modo e igual comprimento. Dizer: a <- rpois(lambda=3,n=5e5) b <- rpois(lambda=4,n=5e5) Gostaria de entrelaçar ou entrelaçar esses dois vetores, para criar um vetor que seria equivalente c(a[1],b[1],a[2],b[2],…,a[length(a)],b[length(b)]) Minha primeira tentativa foi essa: sapply(X=rep.int(c(3,4),times=5e5),FUN=rpois,n=1) mas requer que o rpois seja chamado muito mais vezes do que o necessário. Minha […]

Agregar um quadro de dados com base em pares não ordenados de colunas

Eu tenho um dataset que é algo como isto: id1 id2 size 1 5400 5505 7 2 5033 5458 1 3 5452 2873 24 4 5452 5213 2 5 5452 4242 26 6 4823 4823 4 7 5505 5400 11 Onde id2 e id2 são nós únicos em um gráfico, e size é um valor […]

Verificar existência de diretório e criar se não existe

Muitas vezes me vejo escrevendo scripts R que geram muita saída. Acho mais limpo colocar essa saída em seu (s) próprio (s) diretório (s). O que escrevi abaixo verificará a existência de um diretório e passará para ele, ou criará o diretório e passará para ele. Existe uma maneira melhor de abordar isso? mainDir <- […]

Linhas em colapso onde algumas são todas NA, outras são desarticuladas com algumas NAs

Eu tenho um dataframe simples como tal: ID Col1 Col2 Col3 Col4 1 NA NA NA NA 1 5 10 NA NA 1 NA NA 15 20 2 NA NA NA NA 2 25 30 NA NA 2 NA NA 35 40 E eu gostaria de reformatá-lo como tal: ID Col1 Col2 Col3 Col4 1 […]

Como strsplit diferente número de seqüências de caracteres em determinada coluna por fazer function

Eu tenho um problema com o valor da coluna dividida quando o elemento da coluna tem um número diferente de seqüências de caracteres. Eu posso fazer isso em plyr, por exemplo: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) […]

Como posso classificar as observações em grupo mais rapidamente?

Eu tenho um problema muito simples, mas provavelmente não estou pensando em vector-y o suficiente para resolvê-lo eficientemente. Eu tentei duas abordagens diferentes e eles estão em looping em dois computadores diferentes por um longo tempo agora. Eu gostaria de poder dizer que a competição tornou mais emocionante, mas … bleh. classificar as observações no […]