Articles of r faq

Amostra de linhas aleatórias no dataframe

Eu estou lutando para encontrar a function apropriada que retornaria um número especificado de linhas capturadas aleatoriamente sem substituição de um quadro de dados na linguagem R? Alguém pode me ajudar?

Como você usa “<< -” (atribuição de escopo) em R?

Acabei de terminar de ler sobre o escopo na introdução de R e estou muito curioso sobre o <<- assignment. O manual mostrou um exemplo (muito interessante) para <<- , que eu sinto que entendi. O que ainda sinto falta é o contexto de quando isso pode ser útil. Então, o que eu adoraria ler […]

Limpando os níveis dos fatores (reduzindo vários níveis / labels)

Qual é a maneira mais eficiente (ou seja, eficiente / apropriada) de limpar um fator que contém vários níveis que precisam ser recolhidos? Ou seja, como combinar dois ou mais níveis de fator em um. Aqui está um exemplo em que os dois níveis “Sim” e “Y” devem ser recolhidos para “Sim” e “Não” e […]

Encontre o dia de uma semana

Digamos que eu tenha uma data em R e esteja formatada da seguinte maneira. date 2012-02-01 2012-02-01 2012-02-02 Existe alguma maneira em R para adicionar outra coluna com o dia da semana associada à data? O dataset é muito grande, por isso não faria sentido passar manualmente e fazer as alterações. df = data.frame(date=c(“2012-02-01”, “2012-02-01”, […]

Instalando a versão mais antiga do pacote R

Eu estou tentando usar Rpy2 e ggplot2, mas recebo um erro. Depois de procurar o erro on-line, descobri que o erro ocorre porque há mudanças no pacote ggplot2 que ainda não estão refletidas no Rpy2 (por exemplo, veja este post (Edit: Link está morto)). Então agora preciso instalar uma versão mais antiga do ggplot2. Aqui […]

Entendendo a function order ()

Eu estou tentando entender como funciona a function order() . Fiquei com a impressão de que ele retornava uma permutação de índices, que, quando classificados, classificavam o vetor original. Por exemplo, > a order(a) [1] 3 1 2 4 Eu teria esperado que isso retornasse c(2, 3, 1, 4) , já que a lista classificada […]

Crie um data.frame vazio

Eu estou tentando inicializar um data.frame sem linhas. Basicamente, eu quero especificar os tipos de dados para cada coluna e nomeá-los, mas não ter nenhuma linha criada como resultado. O melhor que consegui fazer até agora é algo como: df <- data.frame(Date=as.Date("01/01/2000", format="%m/%d/%Y"), File="", User="", stringsAsFactors=FALSE) df <- df[-1,] O que cria um data.frame com […]

Por que resume ou muta não funciona com group_by quando eu carrego `plyr` depois de` dplyr`?

Nota: O título desta questão foi editado para torná-la a questão canônica para problemas quando plyr funções plyr mascaram suas contrapartes dplyr . O resto da questão permanece inalterado. Suponha que eu tenha os seguintes dados: dfx <- data.frame( group = c(rep('A', 8), rep('B', 15), rep('C', 6)), sex = sample(c("M", "F"), size = 29, replace […]

Ajustando uma curva de densidade a um histograma em R

Existe uma function em R que se ajusta a uma curva em um histograma? Digamos que você tenha o seguinte histograma hist(c(rep(65, times=5), rep(25, times=5), rep(35, times=10), rep(45, times=4))) Parece normal, mas está distorcido. Eu quero ajustar uma curva normal que é inclinada para envolver este histograma. Esta questão é bastante básica, mas não consigo […]

Como subconjunto da matriz para uma coluna, manter o tipo de dados da matriz, manter os nomes das linhas / colunas?

Quando eu subconjunto uma matriz para uma única coluna, o resultado é de class numérica, não matriz (ou seja, myMatrix [, 5] para subconjunto à quinta coluna). Existe uma maneira compacta de se agrupar em uma única coluna, manter o formato da matriz e manter os nomes de linha / coluna sem fazer algo complicado […]