Muchas herramientas de programación, desde utilerías como grep
hasta lenguajes de programación como Perl y JavaScript, trabajan con expresiones regulares. A continuación se resume un subconjunto de la notación más común al momento de usar expresiones regulares.
Notación | Descripción |
---|---|
x |
Cualquier carácter x, siempre que no se uno de: ( ) * + ? [ ] . ^ | $ {
}
|
\x | Cualquier carácter x |
AB | A seguido de B |
A|B | Seleccionar uno de entre A y B |
(A) | A como grupo capturado |
A* | A cero o más veces |
A+ | A una o más veces |
A? | A cero o una vez |
A*? | A cero o más veces, lo menos que sea posible |
A+? | A una a más veces, lo menos que sea posible |
A?? | A cero o una vez, lo menos que sea posible |
A{n} | A exactamente n veces |
A{n,} | A al menos n veces |
A{n, m} | A al menos n veces, pero no más de m veces |
[abc] | Los caracteres a, b, o c. |
[^abc] | Todos menos los caracteres a, b, o c. |
[a-z] | Todos caracteres entre a y z inclusive. |
\w | Carácter de palabra. Equivalente a: [a−zA−Z0−9_] |
\W | No carácter de palabra. Equivalente a: [^a−zA−Z0−9_] |
\d | Carácter de dígito. Equivalente a: [0−9] |
\D | No carácter de dígito. Equivalente a: [^0−9] |
\s | Carácter de espacio. Equivalente a: [ \t\n\f\r] |
\S | No carácter de espacio. Equivalente a: [^ \t\n\f\r] |
\b | Límite con palabra. |
\B | No límite con palabra. |
. | Cualquier carácter (en ocasiones excluye al fin de línea) |
^ | Inicio de la entrada (o inicio de línea) |
$ | Fin de la entrada (o final de línea) |