Articles of r

Substitua um valor em um quadro de dados com base em uma instrução condicional (`if`)

No quadro de dados R codificado abaixo, gostaria de replace todas as vezes que B aparece com b . junk <- data.frame(x <- rep(LETTERS[1:4], 3), y <- letters[1:12]) colnames(junk) <- c("nm", "val") isso fornece: nm val 1 A a 2 B b 3 C c 4 D d 5 A e 6 B f 7 […]

Extrair informações dentro de todos os parênteses em R

Eu tenho uma seqüência de caracteres e o que extrair as informações dentro de vários parênteses. Atualmente posso extrair as informações do último parêntese com o código abaixo. Como eu faria isso para extrair vários parênteses e retornar como um vetor? j <- "What kind of cheese isn't your cheese? (wonder) Nacho cheese! (groan) (Laugh)" […]

Como usar uma imagem como um ponto no ggplot?

Existe alguma maneira de usar uma pequena imagem específica como um ponto em um gráfico de dispersão com ggplot2. Idealmente, quero resize as imagens com base em uma variável. Aqui está um exemplo: library(ggplot2) p <- ggplot(mtcars, aes(wt, mpg)) p + geom_point(aes(size = qsec, shape = factor(cyl))) Então eu basicamente quero saber se existe uma […]

Prever o Day-Ahead em ambiente paralelizado e escalável – Pacote H2O – R ou Python

Seguindo minha pergunta respondida: R ou Python – faça o loop dos dados de teste – Validação de previsão nas próximas 24 horas (96 valores por dia) Eu quero prever o próximo dia usando o pacote H2o. Você pode encontrar explicações detalhadas para o meu dataset no mesmo link acima . A dimensão de dados […]

Adicionando uma coluna de médias por grupo aos dados originais

Eu quero adicionar uma coluna de médias com base na coluna do fator em R data.frame . Como isso: df1 <- data.frame(X = rep(x = LETTERS[1:2], each = 3), Y = 1:6) df2 <- aggregate(data = df1, Y ~ X, FUN = mean) df3 <- merge(x = df1, y = df2, by = "X", suffixes […]

Faça o fundo de um gráfico de colors diferentes em diferentes regiões

Eu estou fazendo um simples barchart em R usando o pacote ggplot2. Em vez do padrão cinza, eu gostaria de dividir o plano de fundo em cinco regiões, cada uma com uma cor diferente (mas similarmente subestimada). Como eu faço isso? Mais especificamente, eu gostaria que as cinco regiões coloridas funcionassem de 0 a 25, […]

Uso múltiplo do operador posicional `$` para atualizar matrizes aninhadas

Esta questão está intimamente relacionada a esta e vou considerar o conselho dado com relação ao design do esquema em um contexto NoSQL, mas estou curioso para entender isso: Perguntas reais Suponha que você tenha o seguinte documento: _id : 2 abcd name : 2 unittest.com paths : 4 0 : 3 path : 2 […]

Definindo limites de eixo individuais com facet_wrap e scale = “free” em ggplot2

Estou criando um gráfico facetado para ver os valores previstos x reais lado a lado com um gráfico do valor previsto versus os resíduos. Estarei usando shiny para ajudar a explorar os resultados dos esforços de modelagem usando diferentes parâmetros de treinamento. Eu treino o modelo com 85% dos dados, teste os 15% restantes e […]

Criar um barplot empilhado onde cada pilha é dimensionada para sumr 100%

Eu tenho um data.frame como este: df <- read.csv(text = "ONE,TWO,THREE 23,234,324 34,534,12 56,324,124 34,234,124 123,534,654") Eu quero produzir uma plotagem de barra de porcentagem que se parece com isso (feita no LibreOffice Calc): Assim, as barras devem ser padronizadas para que todas as pilhas tenham a mesma altura e sums para 100%. Até agora, […]

Interpretando a advertência “condition has length> 1” da function `if`

Eu tenho uma matriz: a <- c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, […]