visca.com | Diccionari Regex

Introducció al Diccionari Regex


Què és el Diccionari Regex?

El Diccionari Regex és una versió en línia del Diccionari de l'Institut d'Estudis Catalans que permet fer cerques de mots basades en patrons (grups de caràcters que defineixen quines propietats ortogràfiques han de tenir els mots buscats) i ordenar els resultats segons la categoria gramatical. Per exemple, si cerquem el patró gos, el programa oferirà 132 ocurrències de mots catalans que contenen aquestes tres lletres consecutives, agrupades opcionalment per la categoria gramatical:

  • Adjectius: agosarat, fastigosa, gosada, etc.
  • Noms feminins: gosadia, llagosta, etc.
  • Noms masculins: agost, enagos, gos, etc.

Si volem cercar mots que terminen en segons quin sufix, podem afegir al patró el caràcter $. Per exemple, una cerca del patró (teca$) oferirà 27 ocurrències de mots catalans que acaben amb aquestes lletres:

  • Adjectius: anteca i utoasteca
  • Noms feminins: biblioteca, hemeroteca, videoteca, etc.
  • Nom masculí: asteca
  • Sufix: -teca

Per a més detalls sobre les possibilitats de cercar, vegeu la Guia pas a pas al Diccionari Regex.

Diccionari Regex | Principi


Com funciona?

El Diccionari Regex fa servir la sintaxi de les «expressions regulars» del llenguatge Perl (vegeu Perl regular expressions quick start).

Diccionari Regex | Principi


Exemples del que es pot fer

El Diccionari Regex pot trobar:

  • tots el mots terminats en qualsevol sufix:
    -dox o -dòxia (5)
    heterodox, heterodòxia, etc.
    -ota (131)
    cairota, dèspota, papissota, etc.
    -egar (151)
    pedregar, empolsegar, ventegar, etc.
  • mots d'estructura coordinada que repeteixen dos cops la mateixa seqüència (49):
    bitllo-bitllo, gara-gara, nyam-nyam, etc.
  • mots que fan rima amb és (38), ès (161), ill (30) o amb qualsevol altra terminació;
  • mots que contenen la figura qüi (13):
    obliqüitat, terraqüi, etc.;
  • mots que contenen cinc consonants consecutives (12):
    menyspreu, nietzschià, àngstrom, etc.;
  • mots que comencen amb tres consonants consecutives (4):
    scherzo, stricto, etc.
  • mots de 14 o més lletres compostes només de consonants i vocals alternants (29):
    metamatemàtica, modificabilitat, semibituminosa, etc.
  • l'única paraula catalana que conté tres consecutives lletres doblades (tallaarrels);
  • la paraula més llarga composta només de les lletres a-m (acidificable);
  • la paraula més llarga composta només de les lletres n-z (protozous);
  • l'única paraula de 7 lletres composta únicament de les lletres a-d (acabada);
  • l'única paraula de 4 lletres composta únicament de les lletres t-z (tutú);

visca.com | Diccionari Regex | Principi

Escriviu-nos