Estou interessado no poder do PCRE (expressões regulares compatíveis com Perl) e me pergunto se eles provavelmente se tornarão uma abordagem de fato em todas as principais linguagens (estou interessado em Java). Estou preparado para usar uma biblioteca, se necessário. Eu também não consegui encontrar uma boa página no SO descrevendo os prós e contras […]
Eu estou lendo o documento PCRE, e ele se refere a quantificadores possessivos , mas não explicitamente ou especificamente os define. Eu sei o que é um quantificador ganancioso e sei o que é um quantifer preguiçoso. Mas possessivo? A man page do PCRE parece estar trapaceando quando usa o termo sem defini-lo. A página […]
Eu sempre tive a impressão de que você não poderia usar quantificadores de repetição em assertivas de largura zero (expressões regulares compatíveis com Perl [PCRE]). No entanto, recentemente me ocorreu que você pode usá-los em declarações antecipadas. Então minha pergunta é: Como o mecanismo de regex do PCRE funciona ao pesquisar com uma aparência de […]
Por exemplo, o regex abaixo fará com que o relatório de falha lookbehind assertion não tenha comprimento fixo : #(?<!(?:(?:src)|(?:href))=["\']?)((?:https?|ftp)://[^\s\'"()]+)#S Esse tipo de restrição não existe para lookahead .
Eu estava lendo recentemente na documentação do PCRE – (expressões regulares compatíveis com Perl) e encontrei alguns truques interessantes com expressão regular. Enquanto continuei a ler e a me exaurir, parei por causa de alguma confusão em relação ao uso de alguns dos padrões (*…) . Minha dúvida e confusão está relacionada com (*PRUNE) e […]
Expressões regulares podem se tornar bastante complexas. A falta de espaço em branco dificulta a leitura. Eu não posso pisar embora uma expressão regular com um depurador. Então, como os especialistas depuram expressões regulares complexas?
Eu estou tentando usar sed para limpar linhas de URLs para extrair apenas o domínio .. Então, de: http://www.suepearson.co.uk/product/174/71/3816/ Eu quero: http://www.suepearson.co.uk/ (com ou sem a barra de treino, não importa) Eu tentei: sed ‘s|\(http:\/\/.*?\/\).*|\1|’ e (escapando do quantificador não ganancioso) sed ‘s|\(http:\/\/.*\?\/\).*|\1|’ mas eu não consigo fazer o quantificador não ganancioso funcionar, então ele […]