Herramientas de usuario

Herramientas del sitio


sistemas:ir:solr

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
sistemas:ir:solr [2011/11/24 17:55]
alfred
sistemas:ir:solr [2020/05/09 09:25] (actual)
Línea 2: Línea 2:
  
 ===== Básicos ===== ===== Básicos =====
 +
 +
  
  
Línea 12: Línea 14:
   * [[http://​lucene.apache.org/​solr/​|Web del proyecto]]   * [[http://​lucene.apache.org/​solr/​|Web del proyecto]]
   * [[http://​lucene.apache.org/​solr/​tutorial.html|Tutorial básico]]   * [[http://​lucene.apache.org/​solr/​tutorial.html|Tutorial básico]]
 +  * [[http://​wiki.apache.org/​solr/​FrontPage|Wiki de Apache sobre Solr]]
 Solr es un sistema de recuperación de información. Se basa en un servidor de búsqueda REST donde se indexan los documentos en formato XML, JSON o HTTP para después realizar consultas sobre estos. \\  Solr es un sistema de recuperación de información. Se basa en un servidor de búsqueda REST donde se indexan los documentos en formato XML, JSON o HTTP para después realizar consultas sobre estos. \\ 
 Podemos descargarlo desde [[http://​www.apache.org/​dyn/​closer.cgi/​lucene/​solr/​|aquí]] o, en una distribución Linux, instalando el paquete ''​solr-common''​. \\  Podemos descargarlo desde [[http://​www.apache.org/​dyn/​closer.cgi/​lucene/​solr/​|aquí]] o, en una distribución Linux, instalando el paquete ''​solr-common''​. \\ 
Línea 19: Línea 22:
 </​code>​ </​code>​
 Y al cual accederíamos a partir de la url: ''<​nowiki>​http://​localhost:​8983/​solr/​admin/</​nowiki>''​ \\  Y al cual accederíamos a partir de la url: ''<​nowiki>​http://​localhost:​8983/​solr/​admin/</​nowiki>''​ \\ 
-Si en cambio lo instalamos en una distribución linux se serviría mediante Tomcat, donde el puerto por defecto es 8080. +Si en cambio lo instalamos en una distribución linux se serviría mediante Tomcat, donde el puerto por defecto es 8080. \\  
- +Podemos configurar solr a partir del fichero ''​solrconfig.xml''​.
  
 ==== Acciones básicas ==== ==== Acciones básicas ====
Línea 48: Línea 50:
   * ''​q=video&​sort=inStock asc, price desc''​   * ''​q=video&​sort=inStock asc, price desc''​
   * ''​q=video&​sort=score desc''​   * ''​q=video&​sort=score desc''​
 +
  
  
Línea 54: Línea 57:
   * [[http://​wiki.apache.org/​solr/​SchemaXml|Página de documentación del schema]]   * [[http://​wiki.apache.org/​solr/​SchemaXml|Página de documentación del schema]]
 Es el elemento que define cómo se trata el indexado y la recuperación de los datos. Podemos acceder a partir de: ''<​url solr>/​admin/​schema.jsp''​. \\  Es el elemento que define cómo se trata el indexado y la recuperación de los datos. Podemos acceder a partir de: ''<​url solr>/​admin/​schema.jsp''​. \\ 
 +En el paquete descargable de Solr encontramos este fichero en la ruta: ''​solr/​conf''​.
 +
 ==== Tipos de datos ==== ==== Tipos de datos ====
 +  * [[http://​wiki.apache.org/​solr/​AnalyzersTokenizersTokenFilters]]
 Los tipos de datos posibles los encontramos dentro de la sección ''<​types>'',​ en la lista ''<​fieldtype>''​. Podemos configurar su comportamiento (si los strings se comprimirán,​ si serán indexados...) a partir de aquí. Los tipos de datos posibles los encontramos dentro de la sección ''<​types>'',​ en la lista ''<​fieldtype>''​. Podemos configurar su comportamiento (si los strings se comprimirán,​ si serán indexados...) a partir de aquí.
 +=== Indicar que se filtren stopwords === 
 +=== Indicar que se tenga en cuenta las mayúsculas y minúsculas ===
  
 ==== Campos ==== ==== Campos ====
Línea 80: Línea 87:
 <​dynamicField name="​*_i" ​ type="​integer" ​ indexed="​true" ​ stored="​true"/>​ <​dynamicField name="​*_i" ​ type="​integer" ​ indexed="​true" ​ stored="​true"/>​
 </​code>​ </​code>​
 +
 +
 +
 +
 +
  
 ==== Otra configuración ==== ==== Otra configuración ====
 +Más configuraciones que aparecen en el schema...
 +  * ''<​uniqueKey>''​ indica que es un campo único, no puede haber otro igual en el índice. Si un documento se añade con el mismo valor en este campo que otro ya existente, el ya existente será eliminado.
 +  * ''<​defaultSearchField>''​ indica que campo es en el que se hará la búsqueda si en la query no se indica.
 +  * ''<​solrQueryParser defaultOperator="​AND|OR"​ />'',​ indica cual de los dos operadores (AND o OR) se utiliza en las queries.
 +  * ''<​copyField>''​
 +  * ''<​similarity>''​
 +===== Carga de documentos =====
 +==== Otros formatos ====
 +=== Archivos .csv ===
 +  * [[http://​wiki.apache.org/​solr/​UpdateCSV]]
 +=== Archivos json ===
 +  * [[http://​wiki.apache.org/​solr/​UpdateJSON]]
  
 ===== Retrieval ===== ===== Retrieval =====
 +
  
 ==== Formato de queries ==== ==== Formato de queries ====
 +  * [[http://​wiki.apache.org/​solr/​SolrQuerySyntax|Sintaxis de queries]]
 +  * [[http://​wiki.apache.org/​solr/​CommonQueryParameters|Parámetros de queries]]
 +
 +==== Queries con relevancia ====
 +  * [[http://​wiki.apache.org/​solr/​SolrRelevancyFAQ]]
 +
 +==== Queries avanzadas ====
 +  * [[http://​wiki.apache.org/​solr/​SolrRelevancyCookbook]]
 +==== Faceted search ====
  
 ===== Uso de Solr desde programación ===== ===== Uso de Solr desde programación =====
 +
 +
  
 ==== SolrPy ==== ==== SolrPy ====
Línea 105: Línea 141:
     print hit['​title'​]     print hit['​title'​]
 </​code>​ </​code>​
 +=== Métodos útiles ===
 +  * ''​delete(id,​ ids, queries)''​
 +  * ''​delete_many(ids)''​
 +  * ''​delete_query(query)''​
 +  * ''​commit()''​
 +  * ''​add(doc)''​
 +  * ''​add_many(docs)''​
 +  * ''​.query(q,​ fields=None,​ highlight=None,​ score=True, sort=None, sort_order="​asc",​ **params)''​
 +
 +===== Notas =====
 +==== Documentos ====
 +  * {{sistemas:​solr:​index-text-html-solr.pdf|Indexar textos y html con Solr}}
sistemas/ir/solr.1322157314.txt.gz · Última modificación: 2020/05/09 09:24 (editor externo)