Els COMODINS (caràcters que substituiexen altres caràcters o grups de caràcters) són "\w" i ".". El primer representa qualsevol lletra o dígit, mentre que el punt representa tot caràcter, incloent-hi el guionet i el punt volat.
- Es poden cercar totes les paraules de onze lletres, sense guionet ni punt volat, amb el patró ^\w\w\w\w\w\w\w\w\w\w\w$ (ex.: abandonisme); amb el patró ^...........$, el guionet i el punt volat també compten com a "lletres" (exs.: abstenir-se i al·legòrica). (Afortunadament, com veurem en la secció Quantificadors, hi ha una manera molt més fàcil de definir aquestes cerques.) Més exemples:
Patró
| Descripció
| Resultats
|
^c\w\w\w\w\w\w\w\w$
| Cerca paraules amb nou lletres (sense guionet ni punt volat) que comencen en c (1299 ocurrències).
| cabassada, cercavila, clatellot, cuticular, etc.
|
^c........$
| Cerca paraules amb nou caràcters (incloent el guionet i punt volat) que comencen en c (1359 ocurrències).
| calamarsa, cama-roig, capil·lar, companyia, etc.
|
Es denoten les CLASSES DE CARÀCTERS amb els claudàtors ("[]"), que ens permeten seleccionar grups de caràcters. Per exemple, la classe "[aàeéè]" coincideix amb a o à o e o é o è. Observem que els caràcters especials esmentats en la Introducció, $v and $c, són comodins més convenients per a les classes següents:
$v = [aàeéèiíoóòuú]
$c = [bcçdfghjklmnpqrstvwxyz] .
- Heus aquí tres exemples de l'ús de classes de caràcters:
Patró
| Descripció
| Resultats
|
^[bcr]$vt$
| Cerca mots que comencen amb b o c o r seguida de vocal i que terminen en t (8 ocurrències).
| bit, cat, rot, etc.
|
[gst]ió$
| Cerca mots que acaben en gió, sió o tió (268 ocurrències).
| contagió, desaprensió, exhaustió, etc.
|
^....[gst]ió$
| Cerca mots que comencen en quatre caràcters (incloent-hi el guionet i el punt volat) seguits de g o s o t i que terminen en ió (34 ocurrències).
| religió, llantió, incisió, qüestió, etc.
|
- Dins els claudàtors d'una classe de caràcters, el guionet (-) és especial: especifica una extensió o un abast d'una lletra a l'altra. Així el patró [a-j] representa les primeres 10 lletres de l'alfabet. Es pot incloure a la classe el guionet posant-lo primer o últim. Per exemple, el patró [-·l-n] oferirà tots els mots que contenen un guionet, un punt volat o les lletres l, m o n (més de 1500). Més exemples:
Patró
| Descripció
| Resultats
|
^[j-n]$v[j-n]$
| Cerca qualsevol mot que comença en j, k, l, m o n seguida d'una vocal i que termina en j, k, l, m o n (18 ocurrències).
| jan, mel, món, nul, etc.
|
[-c][-i]
| Cerca qualsevol mot que conté dos guionets consecutius (no n'hi haurà cap) o -i o c- o ci (més de 1500 ocurrències).
| caps-i-puntes, catric-catrac, circumval·lació, etc.
|
- Si es vol la negació d'una classe de caràcters és a dir, si es volen cercar paraules que no tenen segons quines lletres, s'afegeix el caràcter ^ just després del primer claudàtor. Exemple:
Patró
| Descripció
| Resultats
|
g[^aeiou]\w[g-l]$
| Cerca mots que contenen una g seguida de qualsevol lletra excepte a, e, i, o o u, seguida de qualsevol lletra (o dígit) i que terminen en g, h, i, j, k o l (7 ocurrències).
| esglai, glei, grog, integral, etc.
|
Nota: Recordem que el caràcter "^" té dos sentits especials: Al principi del patró vol dir "El mot ha de començar amb el caràcter següent", mentre que al principi d'una classe de caràcters (just després del primer claudàtor) invalida tots els caràcters dins els claudàtors.
Principi | Diccionari Regex
|