Articles of dataframe

Converter nomes de linha na primeira coluna

Eu tenho um quadro de dados como este: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at “957.729231881542” “P” “0.00486279317241156” 1053_at “320.632701283368” “P” “0.0313356324173416” 117_at “429.842323161046” “P” “0.0170004527476119” 121_at “2395.7364289242” “P” “0.0114473584876183” 1255_g_at “116.493632746934” “A” “0.39799368200131” 1294_at “739.927122116896” “A” “0.0668649772942343” Eu quero converter os nomes das linhas na primeira coluna. Atualmente eu uso algo assim para criar nomes […]

Selecione apenas as primeiras linhas para cada valor único de uma coluna em R

De um dataframe como este test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 5 J Eu quero criar um novo com […]

Como replace os valores de NA em uma tabela * para colunas selecionadas *? data.frame, data.table

Há muitos posts sobre como replace os valores de NA. Estou ciente de que alguém poderia replace NAs na seguinte tabela / frame com o seguinte: x[is.na(x)]<-0 Mas, e se eu quiser restringi-lo apenas a certas colunas? Deixe-me mostrar um exemplo. Primeiro, vamos começar com um dataset. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, […]

R passar índices de coluna variável para ggplot2

Eu estou tentando passar os índices de coluna para ggplot como parte de uma function que vou usar repetidamente. gostar: myplot <- function(df){ ggplot(df, aes(df[, 1], df[, 2])) + geom_point() } Sempre usarei a primeira coluna como minha variável xea segunda coluna como minha variável y, mas os nomes das colunas serão alterados entre os […]

Remover uma coluna inteira de um data.frame em R

Alguém sabe como remover uma coluna inteira de um data.frame em R? Por exemplo, se eu receber este data.frame: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS 4 chr1 hg19_refGene exon 5 chr1 hg19_refGene CDS 6 chr1 hg19_refGene exon e eu quero remover a segunda coluna.

Alterando os nomes das colunas de um quadro de dados

Eu tenho um quadro de dados chamado “newprice” (veja abaixo) e eu quero mudar os nomes das colunas no meu programa em R. > newprice Chang. Chang. Chang. 1 100 36 136 2 120 -33 87 3 150 14 164 Na verdade, isso é o que estou fazendo: names(newprice)[1]<-paste("premium") names(newprice)[2]<-paste("change") names(newprice)[3]<-paste("newprice") Eu não coloquei isso […]

Chame a function apply-like em cada linha de dataframe com vários argumentos de cada linha

Eu tenho um dataframe com várias colunas. Para cada linha no dataframe, desejo chamar uma function na linha e a input da function está usando várias colunas dessa linha. Por exemplo, digamos que eu tenha esses dados e este testFunc que aceita dois argumentos: > df df xyz 1 1 3 5 2 2 4 […]

Extraindo colunas específicas de um quadro de dados

Eu tenho um quadro de dados R com 6 colunas e quero criar um novo dataframe que tenha apenas três das colunas. Supondo que meu quadro de dados seja df e eu queira extrair as colunas A , B e E , este é o único comando que posso descobrir: data.frame(df$A,df$B,df$E) Existe uma maneira mais […]

Maneira mais rápida de adicionar linhas para valores ausentes em um data.frame?

Eu tenho uma coluna em meus conjuntos de dados em que os períodos de tempo ( Time ) são inteiros que variam de ab. Às vezes pode haver falta de períodos de tempo para qualquer grupo. Eu gostaria de preencher essas linhas com NA . Abaixo estão dados de exemplo para 1 (de vários 1000) […]

Estilo do dictionary substitui vários itens

Eu tenho um grande data.frame de dados de caracteres que eu quero converter com base no que é comumente chamado de dictionary em outros idiomas. Atualmente eu estou indo sobre isso assim: foo <- data.frame(snp1 = c("AA", "AG", "AA", "AA"), snp2 = c("AA", "AT", "AG", "AA"), snp3 = c(NA, "GG", "GG", "GC"), stringsAsFactors=FALSE) foo <- […]