Return to list

Indexation des PDF

avatar provided by gravatar.com sduprey | Sep 28, 2009 1:11:16 PM

Indexation des PDF

Bonjour,

Est-ce que l'indexation du contenu des fichiers PDF est automatique ou y-a-t'il une configuration à mettre en place ?
Je vous remercie

Vote Score 21

Share

Report

Commentaires (16 )

Posted by : sduprey | 28/09/2009 17:49:23
J'ai peut-être trouvé le problème : le plugin document a peut-être été compilé alors qu'il lui manquait le jar de pdfbox, c'est étonnant que la compilation n'ai pas échoué. Je verrai demain si l'indexation fonctionne. Merci beaucoup pour votre aide :)
 
Posted by : TLA | 28/09/2009 16:42:04
Pouvez vous me faire parvenir le fichier pdf ?
 
Posted by : sduprey | 28/09/2009 16:27:45
Bon en fait, il est bien dans la liste des fichiers indexés, mais pas sous le nom du fichier pdf mais sous le titre du document. Mais toujours pas de contenu disponible dans la recherche...
 
Posted by : sduprey | 28/09/2009 16:23:20
Non, pas d'erreur dans ce fichier de log apparemment
 
Posted by : sduprey | 28/09/2009 16:20:03
Il y a eu une autre indexation à 16h06, cette fois il y a énormément de documents listés dans la popup. Il y a des PDF, mais pas celui qui me sert d'exemple; il y a une option à valider pour que son contenu soit indexé ?
 
Posted by : TLA | 28/09/2009 16:15:41
Y a t il un message d'erreur lors du passage de docSearchIndexer daemon ? (le message d'erreur serait dans WEB-INF\logs\error.log)
 
Posted by : sduprey | 28/09/2009 15:56:55
L'indexation a été faite : 28/09/2009 15:53 Par contre, la recherche d'un mot du contenu ne donne toujours rien. La popup de la date de dernière indexation est vide.
 
Posted by : TLA | 28/09/2009 15:25:31
Oui, le démarrer aiderait à l'indexation :) Pour les lancer au démarrage du serveur j2ee, il faut configurer WEB-INF\conf\plugins\document.properties [code] #daemon daemon.docSearchIndexer.interval=600 daemon.docSearchIndexer.onstartup=1 [/code] le daemon d'indexation des documents se lancera (onstartup=1) et il se relancera toutes les 10 minutes (interval=600)
 
Posted by : sduprey | 28/09/2009 15:22:42
y-a t'il un moyen de le forcer à lancer une indexation immédiatement ?
 
Posted by : sduprey | 28/09/2009 15:15:02
ha... je crois que vous avez mis le doigt sur le problème ! docSearchIndexer : croix rouge, date de dernière exécution : vide. J'imagine qu'il faut que je clique sur Démarrer ? Tant qu'on y est, j'ai également Indexer (core) et fetchXmlFiles qui sont arrêtés, à quoi servent-ils ? Merci beaucoup !
 
Posted by : TLA | 28/09/2009 15:14:35
Y a t il un message d'erreur lors du passage de docSearchIndexer daemon (le message d'erreur serait dans WEB-INF\logs\error.log)
 
Posted by : TLA | 28/09/2009 15:07:01
Est ce que le document est indexé ? Pour le voir, il faut aller dans Système>Gestion des Daemons et regarder la popup en surimpression sur la date a laquelle est passé le dernier docSearchIndexer daemon. Cette popup indique si le fichier a été indexé.
 
Posted by : sduprey | 28/09/2009 14:50:41
oui
 
Posted by : TLA | 28/09/2009 14:46:01
Est ce bien un pdf avec du texte dedans ? (et non une image)
 
Posted by : sduprey | 28/09/2009 14:20:46
Merci pour votre réponse. Pourquoi quand je fais une recherche avec des mots contenus dans le PDF, je n'obtiens pas le-dit PDF dans les résultats ?
 
Posted by : TLA | 28/09/2009 14:15:18
Bonjour, oui, ils le sont. t.
 

 Top of the page

Return to list