Articles of r

Como converter uma lista que consiste em vetor de diferentes comprimentos para um quadro de dados utilizável em R?

Eu tenho uma lista (bastante longa) de vetores. Os vetores consistem em palavras russas que obtive usando a function strsplit() em sentenças. O seguinte é o que o head() retorna: [[1]] [1] “модно” “создавать” “резюме” “в” “виде” [[2]] [1] “ты” “начианешь” “работать” “с” “этими” [[3]] [1] “модно” “называть” “блогер-рилейшенз” “―” “начинается” “задолго” [[4]] [1] “видел” […]

Por que o rbindlist é “melhor” que o rbind?

Eu estou passando pela documentação do data.table e também notei de algumas das conversas aqui no SO que o rbindlist deveria ser melhor que o rbind . Eu gostaria de saber por que o rbindlist é melhor que o rbind e em quais cenários o rbindlist realmente melhor que o rbind ? Existe alguma vantagem […]

Encomende um vetor “misto” (números com letras)

Como posso pedir um vetor como c(“7″,”10a”,”10b”,”10c”,”8″,”9″,”11c”,”11b”,”11a”,”12″) -> alph dentro alph [1] “7”,”8″,”9″,”10a”,”10b”,”10c”,”11a”,”11b”,”11c”,”12″ e usá-lo para classificar um data.frame, como V1 <- c("A","A","B","B","C","C","D","D","E","E") V2 <- 2:1 V3 <- alph df <- data.frame(V1,V2,V3) e ordenar a linha para obter (ordem V2 e depois V3) V1 V2 V3 C 1 9 A 1 10a B 1 10c […]

Como alterar a ordem dos labels facetados em ggplot (labels de envoltório facet personalizados)

Oi eu tracei um gráfico de faceta usando ggplot em R e aqui está o enredo O problema que tenho é, as facetas (labels) são classificadas em ordem alfabética (Ex: E1, E10, E11, E13, E2, E3, I1, I10, I2), mas eu preciso que eles sejam uma ordem personalizada como E1, I1, E2 , I2, E3, […]

Intercalar listas em R

Digamos que eu tenha duas listas em R, não necessariamente de igual duração, como: a <- list('a.1','a.2', 'a.3') b <- list('b.1','b.2', 'b.3', 'b.4') Qual é a melhor maneira de construir uma lista de elementos intercalados onde, depois de adicionado o elemento da lista mais curta, os elementos restantes da lista mais longa são acrescentados no […]

Montagem de um modelo linear com múltiplos LHS

Eu sou novo em R e quero melhorar o seguinte script com uma function *apply (eu li sobre apply , mas não consegui usá-lo). Eu quero usar a function lm em várias variables ​​independentes (que são colunas em um quadro de dados). eu usei for (i in (1:3) { assign(paste0(‘lm.’,names(data[i])), lm(formula=formula(i),data=data)) } Formula(i) é definida […]

Atribuir várias colunas usando: = em data.table, por grupo

Qual é a melhor maneira de atribuir várias colunas usando data.table ? Por exemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Eu gostaria de fazer algo assim (claro que esta syntax está incorreta): x[ , (col1, col2) := f(), by = “id] E para estender isso eu posso ter muitas colunas com […]

ggplot: Como alterar os labels facetados?

Eu usei o seguinte comando ggplot: ggplot(survey,aes(x=age))+stat_bin(aes(n=nrow(h3),y=..count../n), binwidth=10) +scale_y_continuous(formatter = “percent”, breaks=c(0, 0.1, 0.2)) + facet_grid(hospital ~ .) + opts(panel.background = theme_blank()) para produzir Eu gostaria de mudar os labels facetados , no entanto, para algo mais curto (como Hosp 1, Hosp 2 …) porque eles são muito longos agora e parecem apertados (aumentar a […]

Dividindo uma coluna de string do dataframe em várias colunas diferentes

O que estou tentando realizar é dividir uma coluna em várias colunas. Eu preferiria que a primeira coluna contivesse “F”, segunda coluna “US”, terceira “CA6” ou “DL”, e a quarta como “Z13” ou “U13” etc etc. Todo o meu df segue o mesmo padrão de X.XX.XXXX.XXX ou X.XX.XXX.XXX ou X.XX.XX.XXX e eu sei que a […]

ggplot2: classificando um gráfico

Eu tenho um data.frame, que é classificado do maior para o menor. Por exemplo: x <- structure(list(variable = structure(c(10L, 6L, 3L, 4L, 2L, 8L, 9L, 5L, 1L, 7L), .Label = c("a", "b", "c", "d", "e", "f", "g", "h", "i", "j"), class = c("ordered", "factor")), value = c(0.990683229813665, 0.975155279503106, 0.928571428571429, 0.807453416149068, 0.717391304347826, 0.388198757763975, 0.357142857142857, 0.201863354037267, 0.173913043478261, […]