| java.lang.Object ca.ulaval.bibl.lius.index.Indexer ca.ulaval.bibl.lius.index.XML.XmlFileIndexer
All known Subclasses: ca.ulaval.bibl.lius.index.HTML.HtmlIndexer, ca.ulaval.bibl.lius.index.OpenOffice.OOIndexer, ca.ulaval.bibl.lius.index.XML.XmlNodeIndexer,
XmlFileIndexer | public class XmlFileIndexer extends Indexer (Code) | | Classe se basant sur JDOM et XPATH pour indexer des fichiers XML.
Class based on JDOM and XPATH for indexing XML files.
author: Rida Benjelloun (rida.benjelloun@bibl.ulaval.ca) |
Field Summary | |
static Logger | logger |
logger | static Logger logger(Code) | | |
concatOccurance | public String concatOccurance(Object xmlDoc, String xpath, String concatSep)(Code) | | Méthode permettant de concaténer les occurences multiples d'un élément
qui
vont être stockées dans le même document Lucene.
Method that concatenates multiple hist of an element which will be saved
in
the same Lucene document.
|
createLuceneDocument | public org.apache.lucene.document.Document createLuceneDocument(String xmlFile, LiusConfig lc)(Code) | | Méthode retournant un objet de type "Lucene document" à partir du fichier
XML à indexer et du fichier de configuration de Lius exprimé sous forme
d'objet de type "LiusConfig".
Method that returns Lucene Document object from an XML file to index and
the Lius configuration file as a LiusConfig object.
|
getAllDocumentNs | public List getAllDocumentNs(org.jdom.Document doc)(Code) | | |
getLiusFields | public Collection getLiusFields(LiusConfig lc)(Code) | | Permet de récupérer les champs de Lius à partir du fichier de
configuration
pour effectuer l'indexation.
Get Lius fields from the configuration file for indexing.
|
getPopulatedCollection | public Collection getPopulatedCollection(Object xmlFile, Collection liusField)(Code) | | Retourne une collection contenant les champs avec les valeurs à indexer
comme par exemple: le texte integral, titre etc.
Returns a collection containing the fields with the values to index; like :
full text, title, etc.
|
parse | public Object parse(Object file)(Code) | | Permet de parser un fichier XML et de retourner un objet de type JDOM
Document.
Parse an XML file and returns a JDOM object.
|
storeNodeInLuceneDocument | public org.apache.lucene.document.Document storeNodeInLuceneDocument(Object xmlDoc, Collection liusFields)(Code) | | Permet de placer un noeud XML dans un document Lucene. Chaque élément du
noeud est indexé en se basant sur une collection d'objets de type
"LiusField"
qui contient le nom du champs dans lucene, l'expression Xpath pour
séléctionner
le noeud et le séparateur d'occurences si on veut placer les différentes
occurences d'un même élément dans le même champs; dans la cas contraire
chaque
élément sera placé dans son propre champs.
Place an XML node in a Lucene document. Each element of the node is
indexed
based on a collection of type LiusField containing the name of the field
in
Lucene, the XPath expression to select the node and the hits separator if
we want
differents hits of a same element in the same field; in the other case
each
element is placed in is own field.
|
|
|