Articles of r faq

A diferença entre colchete e colchete duplo ] para acessar os elementos de uma lista ou dataframe

R fornece dois methods diferentes para acessar os elementos de uma lista ou data.frame – os operadores [] e [[]] . Qual é a diferença entre os dois? Em que situações devo usar uma sobre a outra?

Dividir coluna da cadeia de frameworks de dados em várias colunas

Eu gostaria de pegar dados do formulário before = data.frame(attr = c(1,30,4,6), type=c(‘foo_and_bar’,’foo_and_bar_2′)) attr type 1 1 foo_and_bar 2 30 foo_and_bar_2 3 4 foo_and_bar 4 6 foo_and_bar_2 e use split() na coluna ” type ” acima para obter algo assim: attr type_1 type_2 1 1 foo bar 2 30 foo bar_2 3 4 foo bar […]

Rapidamente lendo tabelas muito grandes como dataframes

Eu tenho tabelas muito grandes (30 milhões de linhas) que eu gostaria de carregar como um dataframes em R. read.table() tem um monte de características convenientes, mas parece que há muita lógica na implementação que retardaria coisas para baixo. No meu caso, estou assumindo que eu conheço os tipos das colunas antes do tempo, a […]

Plotar com dois eixos y, um eixo y à esquerda e outro eixo y à direita

Eu preciso traçar um gráfico de barras mostrando contagens e um gráfico de linhas mostrando taxa de todos em um gráfico, eu posso fazer os dois separadamente, mas quando eu colocá-los juntos, eu dimensionar a primeira camada (ou seja, o geom_bar ) é sobreposto pelo segunda camada (ou seja, a geom_line ). Posso mover o […]

Simultaneamente mesclar vários data.frames em uma lista

Eu tenho uma lista de muitos data.frames que eu quero mesclar. A questão aqui é que cada data.frame difere em termos do número de linhas e colunas, mas todos compartilham as variables-chave (que chamei de “var1” e “var2” no código abaixo). Se os data.frames fossem idênticos em termos de colunas, eu poderia simplesmente rbind , […]

Ordem Barras no gráfico de barras ggplot2

Eu estou tentando fazer um gráfico de barras onde a barra maior seria a mais próxima do eixo y e a barra mais curta seria a mais distante. Então, isso é como a tabela que eu tenho Name Position 1 James Goalkeeper 2 Frank Goalkeeper 3 Jean Defense 4 Steve Defense 5 John Defense 6 […]

Diminua os níveis dos fatores em um quadro de dados subconjunto

Eu tenho um quadro de dados contendo um fator. Quando eu crio um subconjunto desse quadro de dados usando o subset() ou outra function de indexação, um novo quadro de dados é criado. No entanto, a variável de fator mantém todos os seus níveis originais – mesmo quando eles não existem no novo quadro de […]

Como devo lidar com “pacote ‘xxx’ não está disponível (para R versão xyz)” aviso?

Eu tentei instalar um pacote usando install.packages(“foobarbaz”) mas recebeu o aviso Warning message: package ‘foobarbaz’ is not available (for R version xyz) Por que o R não acha que o pacote está disponível? Veja também estas questões referentes a instâncias específicas deste problema: Meu pacote não funciona para R 2.15.2 pacote ‘Rbbg’ não está disponível […]

Como sumr uma variável por grupo?

Digamos que eu tenha duas colunas de dados. O primeiro contém categorias como “Primeiro”, “Segundo”, “Terceiro”, etc. O segundo tem números que representam o número de vezes que vi “Primeiro”. Por exemplo: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 Second 3 Eu quero classificar os dados por categoria […]

Funções de agrupamento (tapply, by, aggregate) e a família * apply

Sempre que eu quero fazer algo “mapear” py em R, geralmente tento usar uma function na família apply . No entanto, eu nunca entendi as diferenças entre eles – como { sapply , lapply , etc.} aplica a function à input de input / agrupada, a aparência da saída ou até mesmo o que a […]