Articles of grep

Encontrando os índices de substrings correspondentes múltiplas / sobrepostas

Eu tenho uma string, s=”CCCGTGCC” e uma sub-string ss=”CC” . Eu quero pegar todos os índices em s que iniciam a string ss . No meu exemplo, eu gostaria de recuperar o array c(1,2,6) . Existe alguma function de string que alcança isso? Observe que minha string está no formato “CCCGTGCC” , e não c(“C”,”C”,”C”,”G”,”T”,”G”,”C”,”C”) […]

Como escaping aspas simples no Bash / Grep?

Eu quero pesquisar com grep para uma string que se parece com isso: something ~* ‘bla’ Eu tentei isso, mas o shell remove aspas simples. grep -i ‘”something ~* ‘[:alnum:]'”‘ /var/log/syslog Qual seria a pesquisa correta?

Maneira mais rápida de encontrar linhas de um arquivo de outro arquivo maior no Bash

Eu tenho dois arquivos, file1.txt e file2.txt . file1.txt tem cerca de 14k linhas e file2.txt tem cerca de 2 bilhões. file1.txt tem um único campo f1 por linha enquanto o file2.txt possui 3 campos, f1 a f3 , delimitados por | . Eu quero encontrar todas as linhas de file2.txt onde f1 de file1.txt […]

Como remover todo o espaço em branco de uma string?

Então ” xx yy 11 22 33 ” se tornará “xxyy112233” . Como posso conseguir isso?

Como faço grep recursivamente?

Como recursivamente grep todos os diretórios e subdiretórios? find . | xargs grep “texthere” *

Como usar grep () para encontrar correspondência exata

string = c(“apple”, “apples”, “applez”) grep(“apple”, string) Isso me daria o índice para todos os três elementos em string . Mas eu quero uma correspondência exata sobre a palavra “apple” (ou seja, eu só quero grep() para retornar o índice 1).

Maneira rápida de encontrar linhas em um arquivo que não estão em outro?

Eu tenho dois arquivos grandes (conjuntos de nomes de arquivos). Aproximadamente 30.000 linhas em cada arquivo. Eu estou tentando encontrar uma maneira rápida de encontrar linhas no arquivo1 que não estão presentes no arquivo2. Por exemplo, se este for o arquivo1: line1 line2 line3 E isso é file2: line1 line4 line5 Então meu resultado / […]

Validando endereços IPv4 com regexp

Eu tenho tentado obter um regex eficiente para a validação do IPv4, mas sem muita sorte. Parecia que em um ponto eu tive com (25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?(\.|$)){4} , mas produz alguns resultados estranhos: [chris@helios bashscripts]$ grep –version grep (GNU grep) 2.7 [chris@helios bashscripts]$ grep -E ‘\b(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?(\.|$)){4}\b’ <<< 192.168.1.1 192.168.1.1 [chris@helios bashscripts]$ grep -E '\b(25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?(\.|$)){4}\b' <<< 192.168.1.255 192.168.1.255 […]

Como faço para grep para todos os caracteres não-ASCII?

Eu tenho vários arquivos XML muito grandes e estou tentando encontrar as linhas que contêm caracteres não-ASCII. Eu tentei o seguinte: grep -e “[\x{00FF}-\x{FFFF}]” file.xml Mas isso retorna todas as linhas do arquivo, independentemente de a linha conter um caractere no intervalo especificado. Eu tenho a syntax errada ou estou fazendo algo errado? Eu também […]

Como mesclar todas as duas linhas em uma a partir da linha de comando?

Eu tenho um arquivo de texto com o seguinte formato. A primeira linha é a “CHAVE” e a segunda linha é a “VALOR”. KEY 4048:1736 string 3 KEY 0:1772 string 1 KEY 4192:1349 string 1 KEY 7329:2407 string 2 KEY 0:1774 string 1 Eu preciso do valor na mesma linha da chave. Então a saída […]