Articles of r

Formatando grandes valores monetários ou monetários em milhões / bilhões

Eu preciso de uma function simples ou pacote que irá formatar: 1 6,000,000 2 75,000,400 3 743,450,000 4 340,000 5 4,300,000 Para: 1 6.0 M 2 75.0 M 3 743.5 M 4 0.3 M 5 4.3 M Ou, de outra forma, tornar os valores maiores (milhões, bilhões) mais legíveis para imprimir em uma tabela.

Lendas diferentes e colors de preenchimento para ggplot facetado?

Desculpe por não incluiu nenhum dado de exemplo para o meu problema. Não consegui encontrar uma maneira de produzir facilmente um arquivo de formato de exemplo. Espero que os usuários experientes do ggplot possam ver o que eu gostaria de fazer na descrição abaixo. Eu tenho: Um data.frame X com informações sobre charts de amostra […]

Alternativa de xrange do Python para o R OR como executar um loop sobre um grande dataset lazilly?

O exemplo a seguir baseia-se na discussão sobre o uso de expand.grid com dados grandes. Como você pode ver, acaba com erro. Eu acho que isso é devido a possíveis combinações que é de acordo com a página mencionada 68,7 bilhões: > v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 expand.grid(v1, […]

R corretor de retorno como object

corrplot plota uma matriz de correlação, mas não retorna um object gráfico (grob) Eu gostaria de plotar várias matrizes de correlação em uma única página. Para charts normais, eu usaria grid.arrange do pacote gridExtra . No entanto, como o corrplot só imprime e não retorna um object, não consigo ver como fazer isso. Existe uma […]

Estratégias de leitura em arquivos CSV em pedaços?

Eu tenho um arquivo de tamanho moderado (CSV de 4 GB) em um computador que não tem RAM suficiente para lê-lo (8 GB no Windows de 64 bits). No passado, eu apenas o carregava em um nó de cluster e o lia, mas meu novo cluster parece limitar arbitrariamente os processos a 4 GB de […]

gerar seqüência dentro do grupo em R

Eu estou tentando obter uma seqüência dentro da categoria. Meus dados são: AB 1 1 1 2 1 2 1 3 1 3 1 3 1 4 1 4 e eu quero pegar a variável “c” como meus dados se parecem com: ABC 1 1 1 1 2 1 1 2 2 1 3 1 […]

Função de número primo em R

Eu estou tentando criar uma function para testar se um dado inteiro é um número primo, tentei usar o seguinte: tpn <- function(prime.num){ if(prime.num==2){ print("PRIME") } else { if(prime.num%%(2:(prime.num-1))!=0){ print("PRIME") } else { print("NOT PRIME") }}} Isso não funciona, embora eu não consiga entender por quê. Estou verificando se o número fornecido pode ser dividido […]

pontos duplos em um ggplot

Eu não consigo encontrar a documentação para os pontos duplos em torno da densidade set.seed(1234) df <- data.frame(cond = factor(rep(c("A","B"), each=200)), rating = c(rnorm(200),rnorm(200, mean=.8))) print(head(df)) print(ggplot(df, aes(x=rating)) + geom_histogram(aes(y=..density..), # Histogram with density instead of count on y-axis binwidth=.5, colour="black", fill="white") + geom_density(alpha=.2, fill="#FF6666") + geom_vline(aes(xintercept=mean(rating, na.rm=T)), # Ignore NA values for mean color="red", […]

Melhor maneira de converter lista em vetor?

Eu tenho uma lista de valores nomeados: myList <- list('A'=1, 'B'=2, 'C'=3) Eu quero um vetor com o valor 1:3 Não consigo descobrir como extrair os valores sem definir uma function. Existe uma maneira mais simples que eu não conheço? library(plyr) myvector <- laply(myList, function(x) x) Existe algo parecido com myList$Values para retirar os nomes […]

Como preencher geom_polygon com colors diferentes acima e abaixo de y = 0?

Considerando o seguinte gráfico de polígonos: ggplot(df, aes(x=year,y=afw)) + geom_polygon() + scale_x_continuous(“”, expand=c(0,0), breaks=seq(1910,2010,10)) + theme_bw() No entanto, eu quero preencher isso com duas colors diferentes. Por exemplo, vermelho para as áreas pretas acima de 0 e azul para as áreas pretas abaixo de 0 . Infelizmente, usar fill=col não preenche as áreas corretas. Eu […]