Gostaria de remover as linhas neste quadro de dados que: a) conter NA em todas as colunas. Abaixo está meu quadro de dados de exemplo. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 […]
Esta é uma pergunta do FAQ, por isso, seja o mais completo possível. A resposta é uma resposta da comunidade, portanto, sinta-se à vontade para editá-la se achar que algo está faltando. Esta questão foi discutida e aprovada na meta. Eu estou usando R e tentei some.function mas eu tenho seguinte mensagem de erro: Error: […]
Eu tenho um quadro de dados que segue o padrão longo abaixo: Name MedName Name1 atenolol 25mg Name1 aspirin 81mg Name1 sildenafil 100mg Name2 atenolol 50mg Name2 enalapril 20mg E gostaria de obter abaixo (eu não me importo se eu posso obter as colunas a serem nomeadas dessa maneira, só quero os dados neste formato): […]
Eu tenho um dataset que se parece com isso: Month count 2009-01 12 2009-02 310 2009-03 2379 2009-04 234 2009-05 14 2009-08 1 2009-09 34 2009-10 2386 Eu quero plotar os dados (meses como valores x e contados como valores y). Como há lacunas nos dados, desejo converter as informações do mês em uma data. […]
Eu quero agregar uma coluna em um quadro de dados de acordo com duas variables de agrupamento e separar os valores individuais por uma vírgula. Aqui estão alguns dados: data <- data.frame(A = c(rep(111, 3), rep(222, 3)), B = rep(1:2, 3), C = c(5:10)) data # ABC # 1 111 1 5 # 2 111 […]
R fornece dois methods diferentes para acessar os elementos de uma lista ou data.frame – os operadores [] e [[]] . Qual é a diferença entre os dois? Em que situações devo usar uma sobre a outra?
Eu gostaria de pegar dados do formulário before = data.frame(attr = c(1,30,4,6), type=c(‘foo_and_bar’,’foo_and_bar_2′)) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 e use split() na coluna ” type ” acima para obter algo assim: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 foo bar […]
Eu tenho tabelas muito grandes (30 milhões de linhas) que eu gostaria de carregar como um dataframes em R. read.table() tem um monte de características convenientes, mas parece que há muita lógica na implementação que retardaria coisas para baixo. No meu caso, estou assumindo que eu conheço os tipos das colunas antes do tempo, a […]
Eu preciso traçar um gráfico de barras mostrando contagens e um gráfico de linhas mostrando taxa de todos em um gráfico, eu posso fazer os dois separadamente, mas quando eu colocá-los juntos, eu dimensionar a primeira camada (ou seja, o geom_bar ) é sobreposto pelo segunda camada (ou seja, a geom_line ). Posso mover o […]
Eu tenho uma lista de muitos data.frames que eu quero mesclar. A questão aqui é que cada data.frame difere em termos do número de linhas e colunas, mas todos compartilham as variables-chave (que chamei de “var1” e “var2” no código abaixo). Se os data.frames fossem idênticos em termos de colunas, eu poderia simplesmente rbind , […]