ManifoldCF

Pour construire une solution de recherche, au-delà du moteur de recherche en lui-même, une étape essentielle est celle de la récupération des données. Conceptuellement proche des problématiques des ETL ou du MDM, cette étape doit s'assurer de la récupération des données, de leur transfert au moteur d'indexation, et doit pouvoir gérer la sécurité des accès ainsi que la persistence des données à transférer.


Ce besoin est suffisament fort et récurrent pour que des framework open source apparaissent, soutenus par une communauté d'utilisateurs et de développeurs. Parmi ces frameworks, nous pouvons citer Aperture, Google Connector Framework et Apache ManifoldCF. Datafari utilise MCF pour la récupération des données et la sécurité.

Comme son nom l'indique, Apache ManifoldCF est un projet de la fondation Apache. Initialement créé dans le seul but de fournir un framework de connecteur pour Lucene/Solr, la communauté a décidé de l'en détacher et d'en faire un projet à part entière.

Device

Vous pouvez obtenir plus d'informations sur le site d'Apache ManifoldCF. Apache ManifoldCF s'occupe donc de récuperer les données dans différents types de systèmes d'informations, propose un système de connecteur permettant d'en rajouter de nouveaux, gère la récupération des ACLs et des droits d'accès.
Il est sous licence logiciel libre Apache. France Labs vous propose son expertise pour installer, configurer, étendre et maintenir Apache ManifoldCF sur vos systèmes.

Parmi les connecteurs déjà disponibles, Apache ManifoldCF propose notamment Sharepoint, les bases de données, les partages de fichiers, les emails. Il propose dans une interface graphique la possibilité de configurer les connecteurs, jusqu'à la gestion des temps de traversée, le nombre de documents à récuperer par parcours, ou encore des expressions régulières pour le filtrage des documents.

Dans quels cas utiliser Apache ManifoldCF

Apache ManifoldCF est recommandable dès lors que plusieurs systèmes hétérogènes doivent être indexés, ou que l'on prévoit une évolution de son système d'information dans l'avenir. Ce framework est en effet bien documenté, et permet d'éviter de dépendre de développement spécifique.

Derniers Tweets

Contact

  • Adresse: Résidence du Grand Large - La Goelette, 2 rue de la Foux, 06800 Cagnes-sur-Mer

  • Téléphone: +33 (0)9 72 43 72 85

Suivez nous