Articles of regex

Como faço para remover emoji de string

Meu problema é remover emoji de uma string, mas não caracteres CJK (chinês, japonês, coreano) de uma string usando regex. Eu tentei usar este regex: REGEX = /[^\u1F600-\u1F6FF\s]/i Este regex funciona bem, exceto que também detecta o caractere chinês, japonês e coreano, onde eu preciso desses caracteres. Alguma idéia de como resolver esse problema?

gVim encontrar / replace com contador

Existe uma maneira de inserir o valor de algum tipo de variável de contador em gVim search / replace? Por exemplo, converta este documento: para este documento resultante: Eu imagino que o comando seria algo como: :%s/^\(\s*<SomeElement Id="\)F\(".*\)$/\1\2/g Estou usando uma compilation recente do Windows, do instalador fornecido. Eu prefiro não instalar ferramentas adicionais. Além […]

Como faço para usar uma nova linha de substituição em um BSD sed?

Saudações, como faço o seguinte no BSD sed? sed ‘s/ /\n/g’ A partir do man-page, afirma que \ n será tratado literalmente dentro de uma string de substituição, como evito esse comportamento? Existe um suplente? Estou usando o Mac OS Snow Leopard, posso instalar o fink para obter o GNU sed.

Dividido por Caps em Javascript

Eu estou tentando dividir uma string por caps usando Javascript, Exemplos do que estou tentando fazer: “HiMyNameIsBob” -> “Hi My Name Is Bob” “GreetingsFriends” -> “Greetings Friends” Estou ciente do método str.split() , no entanto, não tenho certeza de como fazer essa function funcionar com letras maiúsculas. Eu tentei: str.split(“(?=\\p{Upper})”) Infelizmente isso não funciona, qualquer […]

Posso melhorar essa verificação de regex para nomes de domínio válidos?

Então, eu tenho trabalhado nesta expressão regular de nome de domínio. Até agora, parece encontrar nomes de domínio com SLDs e TLDs (com o ccTLD opcional), mas há duplicação da listview de TLDs. Isso pode ser refatorado ainda mais? params[:domain_name].downcase.strip.match(/^[a-z0-9\-]{2,63} \.((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)| (c[acdfghiklmnorsuvxyz]|cat|com|coop)|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]| (g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)| (j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]| (m[acdghklmnopqrstuvwxyz]|me|mil|mobi|museum)|(n[acefgilopruz]|name|net)|(om|org)| (p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]| (t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw]) (\.((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)| (c[acdfghiklmnorsuvxyz]|cat|com|coop)|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]| (g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)| (j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]| m[acdghklmnopqrstuvwxyz]|mil|mobi|museum)| (n[acefgilopruz]|name|net)|(om|org)| (p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]| (t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw]))?$/)

Por que o replaceAll falha com a “referência ilegal do grupo”?

Eu estou precisando replace \\\s+\\$\\$ to $$ eu usei String s = ” $$”; s = s.replaceAll(“\\s+\\$\\$”,”$$”); mas lança exceção java.lang.IllegalArgumentException: Referência de grupo ilegal

Como replace barra invertida para encaminhar barra usando java?

Estou importando um arquivo CSV para o database MySQL. Isso pode ser feito usando o suporte java.mysql para barra no caminho do arquivo. Se o usuário der o caminho c:\upload\date\csv\sample.csv O MySQL não suporta esse tipo de padrão de caminho. Eu quero procurar barras invertidas no caminho e substituí-las por uma barra, para dar isto: […]

Alguém pode me explicar Quantificadores Possessivos? (Expressões regulares)

Eu estou lendo o documento PCRE, e ele se refere a quantificadores possessivos , mas não explicitamente ou especificamente os define. Eu sei o que é um quantificador ganancioso e sei o que é um quantifer preguiçoso. Mas possessivo? A man page do PCRE parece estar trapaceando quando usa o termo sem defini-lo. A página […]

Como capturar vários grupos repetidos?

Eu preciso capturar vários grupos do mesmo padrão. Suponha que eu tenha uma string a seguir: HELLO,THERE,WORLD E eu escrevi um padrão a seguir ^(?:([AZ]+),?)+$ O que eu quero fazer é capturar cada palavra, então o grupo 1 é: “HELLO”, o grupo 2 é “THERE” e o grupo 3 é “WORLD” O que meu regex […]

Identificador de endereço IP privado na expressão regular

Eu estou querendo saber se esta é a melhor maneira de coincidir com uma seqüência de caracteres que começa com um endereço IP privado (Regex estilo Perl): (^127\.0\.0\.1)|(^192\.168)|(^10\.)|(^172\.1[6-9])|(^172\.2[0-9])|(^172\.3[0-1]) Muito obrigado!