Depuis le début de l’année les sources de Lucene et Solr ont fusionnées. La prochaine version commune aura pour numéro 4.0. Pour ceux qui veulent déjà tester la version en cours de développement, il faut en récupérer les sources et les compiler. En effet, les liens de téléchargement des compilations nocturnes
Lire la suite Obtenir une compilation nocturne de Lucene 4.0 et Solr 4.0
Un des challenges lors du passage de Fast ESP à Solr pour le moteur Hurisearch a été de pouvoir indexer et rechercher des documents dans un très grand nombre de langues. Plus de 60 langues sont répertoriées avec par exemple par ordre décroissant d’importance : Anglais, Espagnol, Français, Allemand, Flamand, Russe, Arabe, Slovène, Hébreux, Persan
Lire la suite Indexation multi-lingues avec Lucene et Solr
Solr 1.4 utilise Lucene 2.9.0 et depuis sa sortie en novembre 2009, des mises à jours de Lucene sont disponibles. La dernière version de ce dernier est la 2.9.3. Afin de bénéficier de ces mises à jours dans Solr, il est possible de patcher le fichier solr.war.
Dans les précédents articles consacrés à Solr, j’en décris les principes (Présentation de Lucene Solr) et comment installer et configurer de façon très basique Solr afin de pouvoir indexer et rechercher dans le jeu de données de test fourni dans la distribution (Solr – Installation et configuration (1)).
Dans ce nouvel article, je vais expliquer plus
Lire la suite Solr – Installation et configuration (2)
Suite au premier article Présentation de Lucene Solr, voici un article sur la mise en oeuvre de ce moteur de recherche. Les différents sujets abordés seront :
L’installation
La configuration
L’indexation
La recherche
Cette première partie a pour but l’installation et la configuration minimum afin de pouvoir rechercher dans les documents d’exemple fournis dans la distribution de Solr.
Dans cet article, je présente une solution afin de générer un nuage de tags (ou nuage de mots clefs) à partir d’un flux de données textuelles. Pour l’exemple, il s’agit de titres d’articles stockés dans un fichier texte.
Le but est d’afficher les mots ou expressions de 2 ou 3 termes les plus fréquents dans les
Lire la suite Créer un nuage de tags avec Lucene
La nouvelle version 1.4.0 de Solr est enfin disponible. Cette sortie est l’occasion de présenter Solr à ceux qui ne le connaissent pas encore.
Solr (on prononce « solar ») est une outil open source permettant de mettre en place des fonctionnalités de recherche dans différents types d’applications et notamment des sites web (mais pas seulement). Solr est
Lire la suite Présentation de Lucene Solr
Lucene est une librairie open source en Java (mais il existe de nombreux portages) permettant d’ajouter des fonctionnalités de recherche plein-texte à vos applications. Le projet Lucene est chapeauté par « The Apache Software Foundation ». D’autres projets très connus et de grande qualité de la fondation sont : Apache HTTP server, Tomcat, Cocoon, Ant, …
Il s’agit
Lire la suite Introduction à Lucene
Pour la plupart des internautes, « moteur de recherche » est synonyme de Google ou Yahoo. En fait, je les appellerais plutôt « sites de recherche ». Un moteur de recherche est en fait un outil ou ensemble d’outils permettant de construire par exemple ces « sites de recherche », mais également d’ajouter des fonctionnalités de recherche à divers types d’applications
Lire la suite Les moteurs de recherche