| java.lang.Object net.sf.regain.crawler.config.UrlPattern
UrlPattern | public class UrlPattern (Code) | | Enthält alle Daten eines URL-Pattern.
Ein URL-Pattern wird beim Durchsuchen von Dokumenten nach URLs dazu verwendet,
URLs eines bestimmten Typs zu identifizieren.
author: Til Schneider, www.murfman.de |
Constructor Summary | |
public | UrlPattern(String regexPattern, int regexUrlGroup, boolean shouldBeParsed, boolean shouldBeIndexed) Erzeugt eine neue UrlPattern-Instanz. |
Method Summary | |
public String | getRegexPattern() Gibt den Reguläre Ausdruck zurück, die eine URL findet. | public int | getRegexUrlGroup() Gibt die Gruppe des Regulären Ausdrucks zurück, die die URL enthält. | public boolean | getShouldBeIndexed() Gibt zurück, ob eine gefundene URL indiziert werden soll. | public boolean | getShouldBeParsed() Gibt zurück, ob eine gefundene URL nach weiteren URLs durchsucht werden soll. |
UrlPattern | public UrlPattern(String regexPattern, int regexUrlGroup, boolean shouldBeParsed, boolean shouldBeIndexed)(Code) | | Erzeugt eine neue UrlPattern-Instanz.
Parameters: regexPattern - Der Reguläre Ausdruck, die eine URL findet. Parameters: regexUrlGroup - Die Gruppe des Regulären Ausdrucks, die die URLenthält. Parameters: shouldBeParsed - Gibt an, ob eine gefundene URL nach weiteren URLsdurchsucht werden soll. Parameters: shouldBeIndexed - Gibt an, ob eine gefundene URL indiziert werden soll. |
getRegexPattern | public String getRegexPattern()(Code) | | Gibt den Reguläre Ausdruck zurück, die eine URL findet.
Der Reguläre Ausdruck, die eine URL findet. |
getRegexUrlGroup | public int getRegexUrlGroup()(Code) | | Gibt die Gruppe des Regulären Ausdrucks zurück, die die URL enthält.
Die Gruppe des Regulären Ausdrucks, die die URL enthält. |
getShouldBeIndexed | public boolean getShouldBeIndexed()(Code) | | Gibt zurück, ob eine gefundene URL indiziert werden soll.
Ob eine gefundene URL indiziert werden soll. |
getShouldBeParsed | public boolean getShouldBeParsed()(Code) | | Gibt zurück, ob eine gefundene URL nach weiteren URLs durchsucht werden soll.
Ob eine gefundene URL nach weiteren URLs durchsucht werden soll. |
|
|