The regular expressions used in searches and segmentation rules are those supported by Java. Če potrebujete bolj konkretno informacijo, si prosimo oglejte http://java.sun.com/j2se/1.4.2/docs/api/java/util/regex/Pattern.html.
Enostavne primere lahko najdete na mreži (recimo http://www.regular-expressions.info/quickstart.htmle.)
Naslednji sestavek: |
ustreza naslednjemu zaporedju: |
Zastavice |
|
(?i) |
Omogoči iskanje brez razlikovanja velikih ali malih črk (privzeto vzorec ločuje velike in male črke). |
Znaki |
|
x | Znak x, razen v primeru... |
\u hhhh |
Znak s heksadecimalno vrednostjo 0x hhhh |
\t |
Tabulator ('\u0009' ) |
\n |
Znak za novo vrstico - line feed -('\u000A' ) |
\r |
Znak za povratek voza - carriage return - ('\u000D' ) |
Citiranje |
|
\ |
Nič, vendar citira naslednji znak. Potrebno, kadar želite enega od metaznakov !$()*+.<>?[\]^{|} navesti dobesedno. |
\\ |
Na primer išče poševnico nazaj. |
\Q |
Nič, citira pa vse znake do \E |
\E |
Nič, vendar konča s citiranjem, ki se je začelo z \Q |
Znakovni nizi |
|
[abc] |
a , b , or c (enostavni razred) |
[^abc] |
Katerikoli znak z izjemo a , b , or c (zanikanje) |
[a-zA-Z] |
a do z ali A do Z , vključno (obseg) |
Vnaprej definirani znakovni razredi |
|
. |
Katerikoli znak (z izjemo konca vrstice) |
\d |
Cifra: [0-9] |
\D |
Ne-cifra: [^0-9] |
\s |
Znak za beli presledek: [ \t\n\x0B\f\r] |
\S |
Znaki, ki so beli presledek: [^\s] |
\w |
Besedni znak: [a-zA-Z_0-9] |
\W |
Nebesedni znak: [^\w] |
Zadetki za meje |
|
^ |
Začetek vrstice |
$ |
Konec vrstice |
\b |
Besedna meja |
\B |
Nebesedna meja |
Požrešni kvantifikatorji |
|
Skušali bodo najti kolikor morejo. Na primer, a+ bo ustrezalo aaa v aaabbb |
|
X? |
X, enkrat ali nikoli |
X* |
X, nič- ali večkrat |
X+ |
X, najmanj enkrat |
Nezahtevni kvantifikatorji (ki niso požrešni) |
|
Našli bodo tako malo, kot se le da. Na primer, a+? bo našel prvi a v aaabbb |
|
X?? |
X, enkrat ali nikoli |
X*? |
X, nič- ali večkrat |
X+? |
X, najmanj enkrat |
Logični operatorji |
|
XY | X, ki mu sledi Y |
X| Y |
Ali X ali Y |
( XY) |
XY kot ena sama skupina |