Domicile > Programmation > Apache Lucene

Apache Lucene

Apache Lucene est une bibliothèque logicielle de recherche d'informations librement disponible qui travaille avec des champs de texte dans des fichiers de documents. Cette entreprise évolutive est également appelée le projet Apache Lucene. Apache est un serveur qui est distribué sous une licence open source.

L'interface de programme d'application (API) Lucene reste la même quel que soit le format du fichier à indexer. À condition que les informations textuelles puissent être récupérées et extraites, Lucene peut indexer pratiquement tout type de document contenant du texte. Lucene est devenu populaire pour son utilisation dans les moteurs de recherche Internet ainsi que pour les opérations de recherche sur un seul site.

Le projet Apache Lucene comprend quatre composants principaux :

  • Lucene Core : indexation, recherche, vérification orthographique, mise en évidence des occurrences et tokenisation.
  • PyLucene : Portage Python pour Lucene Core.
  • Solr : Langage de balisage extensible (XML), protocole de transfert hypertexte (HTTP) et API pour Javascript Object Notation (JSON), Python et Ruby, ainsi que la mise en évidence des occurrences, la recherche à facettes, la mise en cache, la réplication et une interface pour les administrateurs de sites Web.
  • Open Relevance Project : Distribution gratuite de matériel pour les tests de performance et l'évaluation de la pertinence.

Par Mirabella

Modèle de réflexion :: Mandela Effect
Liens utiles