Uma expressão regular (ou regex) é uma sequência de caracteres que especifica um padrão de pesquisa. Na prática, você encontrará expressões regulares em muitos aplicativos, como mecanismos de busca, caixas de diálogo de pesquisa e substituição de editores de texto.
Em Python, uma expressão regular é uma linguagem de programação separada. Está incorporado em Python. Para interagir com as expressões regulares, você usa o módulo integrado re
:
O re
módulo possui muitas classes e funções úteis que ajudam você a gerenciar expressões regulares de maneira eficaz.
Seção 1. Expressões Regulares Básicas
Esta seção apresenta os conceitos básicos de expressões regulares, incluindo funções, conjuntos de caracteres, âncoras e limites de palavras.
- Expressões regulares – aprenda como as expressões regulares funcionam em Python e como usar funções no
re
módulo para combinar uma string com um padrão. - Conjuntos de caracteres – apresenta os conjuntos de caracteres (
\d
,\w
,\s
) que correspondem a dígitos, caracteres de palavras e espaços. - Âncoras – mostra como usar as âncoras circunflexo (
^
) e cifrão ($
) para corresponder no início e no final de uma string. - Limite da palavra – orienta você sobre como usar o limite da palavra (
\b
) para corresponder à palavra inteira.
Seção 2. Quantificadores
Esta seção mostra como aplicar quantificadores a partes específicas e dois modos de quantificadores, incluindo ganancioso e preguiçoso.
- Quantificadores – aprenda como usar os quantificadores para corresponder a um número de instâncias de um personagem ou classe de personagem.
- Quantificadores gananciosos – aprenda como funcionam os quantificadores gananciosos.
- Quantificadores não gananciosos (ou preguiçosos) – explique como funcionam os quantificadores não gananciosos e mostre como transformar quantificadores gananciosos em quantificadores não gananciosos.
Seção 3. Conjuntos e intervalos
Esta seção cobre os conjuntos e intervalos para corresponder aos caracteres.
- Conjuntos e intervalos – aprenda como usar conjuntos e intervalos para combinar um caractere em um conjunto ou intervalo de caracteres.
Seção 4. Agrupamento
Esta seção mostra como usar o agrupamento para extrair porções de informações, fazer referência ao grupo anterior e aplicar alternância.
- Capturando grupos – inclua uma parte de uma correspondência na matriz de correspondências e atribua um nome a ela usando um grupo nomeado.
- Referências anteriores – aprenda sobre referências anteriores e como aplicá-las de forma eficaz.
- Alternação – mostra como usar o operador “OR” em expressões regulares.
- Grupos sem captura – crie um grupo mas não salve-o nos grupos da partida.
Seção 5. Olhe ao redor
Esta seção explica os conceitos de diferentes tipos de mecanismos de look-around.
- Lookahead – apresente o conceito lookahead e como usá-lo para corresponder a X somente se ele for seguido por Y.
- Lookbehind – explique o conceito lookbehind e como combinar X somente se houver Y antes dele.
Seção 6. Funções regex do Python
re
Esta seção discute detalhadamente as funções de expressão regular no módulo e os sinalizadores regex.
- findall() – encontra todas as correspondências que correspondem a uma expressão regular em uma string.
- fullmatch() – combina a string inteira com um padrão.
- finditer() – retorna um iterador que produz objetos Match sobre todas as correspondências não sobrepostas para uma expressão regular em uma string.
- match() – verifica se zero ou mais caracteres no início de uma string correspondem a uma expressão regular.
- search() – pesquisa a primeira correspondência em uma string.
- sub() – retorna uma string com correspondências substituídas por uma substituição.
- split() – divide uma string pelas correspondências de uma expressão regular.
- Sinalizadores Regex – aprenda sobre os sinalizadores regex e como eles mudam a forma como o mecanismo regex corresponde aos padrões.
Seção 7. Folha de referências do Python Regex
- Folha de referências do Regex – fornece uma folha de referências de expressões regulares do Python.