Articles of dataframe

Substituir valores em um dataframe com base na tabela de pesquisa

Estou com algum problema ao replace valores em um dataframe. Eu gostaria de replace os valores com base em uma tabela separada. Abaixo está um exemplo do que estou tentando fazer. Eu tenho uma tabela onde cada linha é um cliente e cada coluna é um animal que eles compraram. Vamos chamar essa table dataframe. […]

calcular a média para cada coluna de uma matriz em R

Eu estou trabalhando em R em R studio. Eu preciso calcular a média para cada coluna de um quadro de dados. cluster1 // 5 by 4 data frame mean(cluster1) // Eu tenho : Warning message: In mean.default(cluster1) : argument is not numeric or logical: returning NA Mas eu posso usar mean(cluster1[[1]]) para obter a média […]

Calculando statistics em subconjuntos de dados

Aqui está um pequeno exemplo reproduzível dos meus dados: > mydata mydata subject time measure 1 0 10 1 1 12 1 2 8 2 0 7 2 1 0 2 2 0 Eu gostaria de gerar uma nova variável contendo o meio de measure para esse assunto em particular, então: subject time measure mn_measure […]

Crie um data.frame onde uma coluna é uma lista

Eu sei como adicionar uma coluna de lista: > df df$b df ab 1 1 1 2 2 1, 2 3 3 1, 2, 3 Isso funciona, mas não: > df <- data.frame(a=1:3, b=list(1:1, 1:2, 1:3)) Error in data.frame(1L, 1:2, 1:3, check.names = FALSE, stringsAsFactors = TRUE) : arguments imply differing number of rows: 1, […]

Como converter uma lista que consiste em vetor de diferentes comprimentos para um quadro de dados utilizável em R?

Eu tenho uma lista (bastante longa) de vetores. Os vetores consistem em palavras russas que obtive usando a function strsplit() em sentenças. O seguinte é o que o head() retorna: [[1]] [1] “модно” “создавать” “резюме” “в” “виде” [[2]] [1] “ты” “начианешь” “работать” “с” “этими” [[3]] [1] “модно” “называть” “блогер-рилейшенз” “―” “начинается” “задолго” [[4]] [1] “видел” […]

Atribuir várias colunas usando: = em data.table, por grupo

Qual é a melhor maneira de atribuir várias colunas usando data.table ? Por exemplo: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10) Eu gostaria de fazer algo assim (claro que esta syntax está incorreta): x[ , (col1, col2) := f(), by = “id] E para estender isso eu posso ter muitas colunas com […]

Dividindo uma coluna de string do dataframe em várias colunas diferentes

O que estou tentando realizar é dividir uma coluna em várias colunas. Eu preferiria que a primeira coluna contivesse “F”, segunda coluna “US”, terceira “CA6” ou “DL”, e a quarta como “Z13” ou “U13” etc etc. Todo o meu df segue o mesmo padrão de X.XX.XXXX.XXX ou X.XX.XXX.XXX ou X.XX.XX.XXX e eu sei que a […]

Obtendo dados json importados em um quadro de dados

Eu tenho um arquivo contendo mais de 1500 objects json com os quais eu quero trabalhar em R. Eu pude importar os dados como uma lista, mas estou tendo problemas para coagi-los em uma estrutura útil. Eu quero criar um quadro de dados contendo uma linha para cada object json e uma coluna para cada […]

Apenas mantenha o valor mínimo para cada nível de fator

Eu tenho um problema que me incomoda há algum tempo … espero que alguém aqui possa me ajudar. Eu tenho o seguinte quadro de dados f <- c('a','a','b','b','b','c','d','d','d','d') v1 <- c(1.3,10,2,10,10,1.1,10,3.1,10,10) v2 <- c(1:10) df <- data.frame(f,v1,v2) f é um fator; v1 e v2 são valores. Para cada nível de f, quero apenas manter uma […]

Como atribuir um número de identificação exclusivo a cada grupo de valores idênticos em uma coluna

Eu tenho um quadro de dados com um número de colunas. Eu gostaria de criar uma nova coluna chamada “id” que fornece um número de identificação exclusivo para cada grupo de valores idênticos na coluna “sample”. Exemplo de dados: # dput(df) df <- structure(list(index = 1:30, val = c(14L, 22L, 1L, 25L, 3L, 34L, 35L, […]