Différences
Ci-dessous, les différences entre deux révisions de la page.
start:solr [2018/11/05 09:07] domenge créée |
start:solr [2018/11/05 10:45] (Version actuelle) domenge |
||
---|---|---|---|
Ligne 3: | Ligne 3: | ||
Es un logicial per organizar un motor de cèrca. SolR es una basa de donadas textuala e li fa besonh d'una configuracion per foncionar. Dins nòstre cas un adobament especific a la lenga nòstra es indefugible. Mai precisament calriá dins l'absolut far un trabalh per cada dialècte. | Es un logicial per organizar un motor de cèrca. SolR es una basa de donadas textuala e li fa besonh d'una configuracion per foncionar. Dins nòstre cas un adobament especific a la lenga nòstra es indefugible. Mai precisament calriá dins l'absolut far un trabalh per cada dialècte. | ||
- | ===== Escquema ===== | + | ===== Esquema ===== |
Per configurar la basa textuala un esquema pòt èsser necesari pas obligatòri. L'esquema dona las indicacions per lo trachament de certas informacions que se pòdon identifiar. Un numero de comanda, un prètz, un resumit, un títol, eca. Basicament l'esquema es compausat de noms de camps, de tipes de camps segon la lista classica (int, float, double, date, string, ...) mas en revenge per lo tèxte, la classificacion es mai precisa.\\ | Per configurar la basa textuala un esquema pòt èsser necesari pas obligatòri. L'esquema dona las indicacions per lo trachament de certas informacions que se pòdon identifiar. Un numero de comanda, un prètz, un resumit, un títol, eca. Basicament l'esquema es compausat de noms de camps, de tipes de camps segon la lista classica (int, float, double, date, string, ...) mas en revenge per lo tèxte, la classificacion es mai precisa.\\ | ||
Per cada idòm es possible de fargar un tipe de donadas especific amb fòrça trachaments dessus, elision, flexion, correccion, netejament de mots non significatius, lemmatizacion, eca. Aquelas directivas son compresas dins l'esquema.\\ Un fichièr schema.xml es previst per cada colleccion mas un fichièr fargat automaticament per SolR pòt existir managed_schema.xml çai es pas cambiadís e per defaut es el que s'aplica. | Per cada idòm es possible de fargar un tipe de donadas especific amb fòrça trachaments dessus, elision, flexion, correccion, netejament de mots non significatius, lemmatizacion, eca. Aquelas directivas son compresas dins l'esquema.\\ Un fichièr schema.xml es previst per cada colleccion mas un fichièr fargat automaticament per SolR pòt existir managed_schema.xml çai es pas cambiadís e per defaut es el que s'aplica. | ||
Ligne 20: | Ligne 20: | ||
[[https://cwiki.apache.org/confluence/display/solr/Language+Analysis#LanguageAnalysis-Catalan|Analisi de la lenga per SolR Catalan]] | [[https://cwiki.apache.org/confluence/display/solr/Language+Analysis#LanguageAnalysis-Catalan|Analisi de la lenga per SolR Catalan]] | ||
- | ==== Exemple de fichièr stopword_ca.txt ==== | ||
- | <file txt> | ||
- | # Catalan stopwords from http://github.com/vcl/cue.language (Apache 2 Licensed) | ||
- | a | ||
- | abans | ||
- | ací | ||
- | ah | ||
- | així | ||
- | això | ||
- | al | ||
- | als | ||
- | aleshores | ||
- | algun | ||
- | alguna | ||
- | algunes | ||
- | alguns | ||
- | alhora | ||
- | allà | ||
- | allí | ||
- | allò | ||
- | altra | ||
- | altre | ||
- | altres | ||
- | amb | ||
- | ambdós | ||
- | ambdues | ||
- | apa | ||
- | aquell | ||
- | aquella | ||
- | aquelles | ||
- | aquells | ||
- | aquest | ||
- | aquesta | ||
- | aquestes | ||
- | aquests | ||
- | aquí | ||
- | baix | ||
- | cada | ||
- | cadascú | ||
- | cadascuna | ||
- | cadascunes | ||
- | cadascuns | ||
- | com | ||
- | contra | ||
- | d'un | ||
- | d'una | ||
- | d'unes | ||
- | d'uns | ||
- | dalt | ||
- | de | ||
- | del | ||
- | dels | ||
- | ... | ||
- | </file> | ||
{{indexmenu>solr#1}} | {{indexmenu>solr#1}} | ||