Skip to content

Latest commit

 

History

History
23 lines (18 loc) · 1.04 KB

regex.md

File metadata and controls

23 lines (18 loc) · 1.04 KB

geral

buscar caractere literal

  • para procurar literalmente um ponto . sem que isso seja interpretado na sintaxe do regex, contrabarra antes -> \.

repetições

  • adicionar {x} depois do que se quer ver repetir, x = número de repetições

achar números e letras

  • dígitos -> (\d)

  • letras minúsculas e maiúsculas -> ([a-z]) e ([A-Z])

  • qualquer letra minúscula ou maiúscula, com ou sem acento -> [A-zÀ-ú]

  • combinando letras minúsculas, maiúsculas e espaços -> ([a-zA-Z ]+)

  • caracteres chineses/japoneses: Han -> ([\u3402-\uFA6D]+)

  • caracteres japoneses: Hiragana -> ([\u3041-\u30A0\u30A0-\u31FF]+)

  • caracteres japoneses: Katakana -> ([\u30A0-\u31FF]+)

  • combinando todos caracteres japoneses -> ([\u3402-\uFA6D\u3041-\u30A0\u30A0-\u31FF]+)

  • exemplo: achar sequências do tipo 3 letras e 4 números (e.g. ABC1234) -> ([a-z]){3}(\d){4}

substituir linhas repetidas (fonte)

  • buscar por: ^(.*)(\r?\n\1)+$
  • substituir por $1