0

6 La navigation dans le manuel de Kentika est réservée aux utilisateurs identifiés



Recherche Full Text - (ISYS) - OLD

Recherche Full Text - (version ISYS )

Attention : ce qui suit ne concerne que les sites qui ont été installés avant 2015. Depuis, c'est la technologie Lucene qui est exploitée.

Kentika, logiciel de GED, permet de créer une fiche descriptive pour chaque document archivé. Ces fiches permettent ensuite de facilement identifier des documents correspondant à des critères précis. Exemple : "les articles parus après 2004 traitant d'architecture" (Article = type de document ; 2004 = date de parution ; Architecture = descripteur). Cependant, pour certaines recherches on peut avoir besoin de rechercher dans le contenu. Exemple : "les articles dans lesquels la ville de Chicoutimi est citée". Afin d'atteindre cet objectif, il est nécessaire de disposer d'une technologie d'indexation plein texte. Kentika propose, en option, la technologie PERCEPTIVE SEARCH (ISYS).

Recherche

Le texte des documents attachés aux notices est proposé à la recherche comme n'importe quel autre champ indexé de la base de données. Il peut ainsi être avec les autres index. Ceci présente l'énorme avantage de mixer le meilleur des deux mondes (les méta-données et le contenu).NB : la recherche "texte intégral" autorise des opérateurs spécifiques : booléens, proximité... pour insérer un opérateur à l'intérieur d'un critère de recherche : saisissez le premier mot puis l'opérateur (en cliquant sur le point rouge) puis le deuxième mot (ou expression).

Initialisation et mise à jour de l'index

A partir de l'écran de paramétrage, demandez l'opération de maintenance "CREATE REGARDLESS". L'index sera alors créé (ou recréé s'il en existe déjà un). Pour plus de détails sur les opérations de maintenance, reportez-vous à la page 85 (IDB_Function) du manuel.

Formats de fichiers et langages

ISYS supporte plus de 200 formats de fichiers et 60 langues différentes. La liste complète est consultable directement sur le site de l'éditeur ISYS.

PDF optimisé (Pix2pdf)

Cette technologie supporte le format pdf multi-couches issu de l'optimisation par Pix2pdf.

Masque de recherche avec l'option "texte intégral"

Lors de la construction d'une requête, si vous disposez de l'option texte intégral, un champ complémentaire est proposé.

Recherches multi-critères

Cette option est automatiquement proposée dès lors que la technologie est en place et l'index généré.

Interface web

Les outils proposant une recherche dans le texte permettent également la saisie des opérateurs à l'intérieur du critère de recherche.

Présentation des résultats sur le web

Si, lors d'une recherche, un des critères porte sur "Texte intégral", le résultat est automatiquement trié par pertinence. Le niveau de pertinence est affiché sous l'icône du fichier correspondant.

Sur une fiche détaillée, les fichiers dans lesquels l'expression cherchée a été trouvée apparaissent avec un libellé en rouge.

Ici deux fichiers attachés à la notice comportaient l'expression recherchée.

Installation

Préalable : après avoir installé "ISYSIntegrationKit.exe " (munissez-vous du numéro de licence qui vous a été fourni et qui vous sera demandé pour l'installation), assurez-vous que le répertoire de Kentika Server (ou de Kentika mono, aucune installation n'est à prévoir sur les postes client) comporte bien les DLLs comme indiqué ci-dessous. Si ce n'est pas le cas, vous pourrez vous les procurer sur notre site ftp (répertoire "Tools/ISYS_Instal").

Programme

Index

Ils sont générés dans le répertoire ALGEDIM de l'application. La mise à jour est ensuite effectuée conformément au règles définies en paramétrage.

NB : il est conseillé de joindre le répertoire ALGEDIM au processus de sauvegarde intégré, les index Full Text seront également sauvegardés.

A propos du fichier de configuration : ISYS.CFG

Ce fichier contient les directives de génération des index. Il requiert une attention particulière. Si un comportement vous semble anormal, c'est d'abord dans ce fichier qu'il faut en chercher la raison.

Le contenu par défaut établi pour un bon fonctionnement avec Kentika est fourni ci-après.

Version 9

NAME ISYS:Kentika Index

FORMATS ASCII WORDPERFECT RTF WINWORD WINWRITE POWERPOINT HTMLRAW PDF EXCEL

FORMATS MSG EML OPENOFFICE SOURCE JPEG

SIGNIFICANT 0123456789ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ?ÑÒÓÔÕÖØÙÚÛÜ??ßàáâãäåæèéêëçìíîï?ñòóôõöøùúûü??ÿ

INSIGNIFICANT /_

Language InsignifAccents

Concurrent

DateRecognition

SummaryIndexing

EntityRecognition

FileNameIndexing

MetaTitles

SpellingTips

MaxWordLength 20

CacheMetaData

CacheDocuments

UNDER Here

AUTO **\*.*

Pour plus d'informations, reportez vous à la documentation qui a été installée avec l'integration kit .