Articles of dataframe

Selecionando várias colunas ou linhas ímpares ou pares para o dataframe

Existe uma maneira em R de selecionar várias linhas / colunas não consecutivas, ou seja, ímpares ou pares? Estou planejando as cargas para minha análise de componentes principais. Tenho 84 linhas de dados ordenadas como esta: x_1 y_1 x_2 ….. x_42 y_42 E no momento estou criando os dataframes para as figuras x e y […]

Anule a coluna do quadro de dados preservando as informações de outra coluna

Eu tenho um quadro de dados que consiste em duas colunas: um vetor de caractere col1 e uma coluna de list , col2 . myVector <- c("A","B","C","D") myList <- list() myList[[1]] <- c(1, 4, 6, 7) myList[[2]] <- c(2, 7, 3) myList[[3]] <- c(5, 5, 3, 9, 6) myList[[4]] <- c(7, 9) myDataFrame <- data.frame(row […]

Como transformar dados XML em um data.frame?

Estou tentando aprender o pacote XML do R. Estou tentando criar um data.frame do arquivo de dados xml de exemplo books.xml. Aqui está o que eu recebo: library(XML) books <- "http://www.w3schools.com/XQuery/books.xml" doc <- xmlTreeParse(books, useInternalNodes = TRUE) doc xpathApply(doc, "//book", function(x) do.call(paste, as.list(xmlValue(x)))) xpathSApply(doc, "//book", function(x) strsplit(xmlValue(x), " ")) xpathSApply(doc, "//book/child::*", xmlValue) Cada um desses […]

Transpor um quadro de dados

Eu preciso transpor um grande quadro de dados e então eu usei: df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) Isto é o que eu obtenho: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 4.651735e+04 4.120606e+04 Meu […]

Atualizar frame de dados via function não funciona

Eu me deparei com um pequeno problema usando R… No seguinte quadro de dados test <- data.frame(v1=c(rep(1,3),rep(2,3)),v2=0) Eu quero alterar os valores de v2 nas linhas em que v1 é 1. test[test$v1==1,”v2″] <- 10 funciona muito bem. test v1 v2 1 1 10 2 1 10 3 1 10 4 2 0 5 2 0 […]

Remodele vários valores de uma só vez

Eu tenho um longo dataset que eu gostaria de fazer ampla e estou curioso para saber se há uma maneira de fazer isso tudo em uma única etapa usando os pacotes reshape2 ou tidyr em R. O frame de dados df parece com isso: id type transactions amount 20 income 20 100 20 expense 25 […]

Converter nomes de linha na primeira coluna

Eu tenho um quadro de dados como este: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at “957.729231881542” “P” “0.00486279317241156” 1053_at “320.632701283368” “P” “0.0313356324173416” 117_at “429.842323161046” “P” “0.0170004527476119” 121_at “2395.7364289242” “P” “0.0114473584876183” 1255_g_at “116.493632746934” “A” “0.39799368200131” 1294_at “739.927122116896” “A” “0.0668649772942343” Eu quero converter os nomes das linhas na primeira coluna. Atualmente eu uso algo assim para criar nomes […]

Selecione apenas as primeiras linhas para cada valor único de uma coluna em R

De um dataframe como este test <- data.frame('id'= rep(1:5,2), 'string'= LETTERS[1:10]) test <- test[order(test$id), ] rownames(test) test id string 1 1 A 2 1 F 3 2 B 4 2 G 5 3 C 6 3 H 7 4 D 8 4 I 9 5 E 10 5 J Eu quero criar um novo com […]

Como replace os valores de NA em uma tabela * para colunas selecionadas *? data.frame, data.table

Há muitos posts sobre como replace os valores de NA. Estou ciente de que alguém poderia replace NAs na seguinte tabela / frame com o seguinte: x[is.na(x)]<-0 Mas, e se eu quiser restringi-lo apenas a certas colunas? Deixe-me mostrar um exemplo. Primeiro, vamos começar com um dataset. set.seed(1234) x <- data.frame(a=sample(c(1,2,NA), 10, replace=T), b=sample(c(1,2,NA), 10, […]

R passar índices de coluna variável para ggplot2

Eu estou tentando passar os índices de coluna para ggplot como parte de uma function que vou usar repetidamente. gostar: myplot <- function(df){ ggplot(df, aes(df[, 1], df[, 2])) + geom_point() } Sempre usarei a primeira coluna como minha variável xea segunda coluna como minha variável y, mas os nomes das colunas serão alterados entre os […]