Indexer ses documents bureautique avec la suite Elastic et FSCrawler

Indexer ses documents bureautique avec la suite Elastic et FSCrawler

Modifier sur GitHub

Disponible en 🇬🇧 EN et 🇫🇷 FR

Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.

Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.

Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :

Resources

Commentaires