Le journal des entreprises
Non soumis à l’acquisition de licences, les logiciels libres sont souvent considérés comme la garantie d’une informatique moins chère. C’est vrai à l’usage, mais à condition de ne pas négliger certains investissements.
 |
Suite au premier article Présentation de Lucene Solr, voici un article sur la mise en oeuvre de ce moteur de recherche. Les différents sujets abordés seront :
- L’installation
- La configuration
- L’indexation
- La recherche
|
Cette première partie a pour but l’installation et la configuration minimum afin de pouvoir rechercher dans les documents d’exemple fournis dans la distribution de Solr.
Lire la suite …

Dans cet article, je présente une solution afin de générer un nuage de tags (ou nuage de mots clefs) à partir d’un flux de données textuelles. Pour l’exemple, il s’agit de titres d’articles stockés dans un fichier texte.
Le but est d’afficher les mots ou expressions de 2 ou 3 termes les plus fréquents dans les titres. Tous les termes ou expressions ne sont pas à conserver dans le nuage de tag. Une des étapes consiste en un filtrage selon des règles définies dans fichiers de règles : suppression des mots vides (je, le, pour, …), suppression des expressions commençant ou se terminant par un mot vide (”ne mange”, “termes les”, …), suppression des nombres, …
Lire la suite …

La nouvelle version 1.4.0 de Solr est enfin disponible. Cette sortie est l’occasion de présenter Solr à ceux qui ne le connaissent pas encore.
Solr (on prononce « solar ») est une outil open source permettant de mettre en place des fonctionnalités de recherche dans différents types d’applications et notamment des sites web (mais pas seulement). Solr est basé sur Lucene qui est présenté dans un précédent article. Cette nouvelle version bénéficie des dernières évolutions de Lucene 2.9.
Lire la suite …
Lucene est une librairie open source en Java (mais il existe de nombreux portages) permettant d’ajouter des fonctionnalités de recherche plein-texte à vos applications. Le projet Lucene est chapeauté par « The Apache Software Foundation ». D’autres projets très connus et de grande qualité de la fondation sont : Apache HTTP server, Tomcat, Cocoon, Ant, …
Il s’agit bien d’une librairie avec laquelle il n’est pas fourni d’outils permettant l’indexation de données en quelques clics de souris et quelques paramétrages. Il faut donc en passer par du code Java afin de mettre en place une solution sur mesure de recherche plein-texte.
Lire la suite …
Pour la plupart des internautes, « moteur de recherche » est synonyme de Google ou Yahoo. En fait, je les appellerais plutôt « sites de recherche ». Un moteur de recherche est en fait un outil ou ensemble d’outils permettant de construire par exemple ces « sites de recherche », mais également d’ajouter des fonctionnalités de recherche à divers types d’applications (CRM, messagerie, …).
Avant de pouvoir offrir une page de recherche et des résultats, il est nécessaire de réaliser certaines tâches comme par exemple la création d’un index des données.
Lire la suite …
Le cabinet Saugatuck Technology définit 5 scénarios pour le développement du SaaS dans les 5 années allant d’une situation de niche à l’avènement d’un modèle que l’on connaît dans d’autres domaines regroupés sous l’appellation américaine d’utilities.
mardi 15 septembre 2009
Article d’origine
Le magazine Infoworld vient de publier l’édition 2009 de son palmarès des 40 « meilleurs » logiciels Open Source classés en quatre catégories : outils de développement, logiciels d’entreprise, logiciels de réseau, infrastructure et middleware.
lundi 31 août 2009
Article d’origine
In Washington, DC, yesterday (June 15, 2009), I learned that In-Q-Tel, the investment arm of the US intelligence community, has given a salute to open source. Lucid Imagination, a commercial open source company dedicated to supporting Apache Lucene and SOLR search technologies, received a strategic investment from In-Q-Tel.
Article d’origine