|
PERTINENCE SUMMARIZER : un outil daide à la rédaction
par la génération de résumés automatiques
Pertinence Summarizer est un outil de traitement automatique du langage
qui lit et condense des textes en Français, Anglais, Allemand,
Espagnol, Italien, Portugais, Arabe, Grec, Néerlandais, Norvégien
et Russe. Dix de ces langues peuvent être testées en
ligne sur Internet. La technologie d'intelligence artificielle intégrée
dans le logiciel s'appuie exclusivement sur des méthodes linguistiques
qui permettent de mieux "comprendre" le contenu d'un document
afin d'en extraire les informations pertinentes. Ce logiciel peut produire
des résumés de textes à partir d'un document, d'une
page Web, d'un hyperlien, d'un message e-mail, d'un fichier ou via le
Presse-papiers.
Cet outil résume automatiquement des textes de différents
formats: DOC (Word), PDF, RTF, HTML (.html, .htm, .asp, .php, etc), ASCII
(.txt), WML, XML mais aussi PPT et XLS. Pour une exploitation optimale
des résumés automatiques, il est conseillé d'utiliser
les navigateurs Internet Explorer 5+ ou Netscape 6+. En temps réel,
le logiciel permet de modifier librement selon les besoins de l'utilisateur
la longueur des résumés générés. La
présentation du résumé est innovante dans la mesure
où elle permet, de manière intelligente, une lecture assistée
à l'utilisateur tout en lui offrant la possibilité d'accéder
aux informations essentielles extraites dans toute leur cohérence.
Pertinence Summarizer permet de résumer automatiquement des textes
tout en tenant compte des besoins propres de l'utilisateur. Ce dernier
peut proposer ses propres termes (mots, groupe de mots ou expressions)
pour appuyer la pertinence du résumé. En temps réel,
ces termes sont pris en compte dans le processus de résumé.
Il est aussi possible de choisir un domaine particulier ; une liste de
termes du domaine choisi est alors présentée avec le résumé.
Chaque terme trouvé dans le texte est accompagné du nombre
de ses occurrences et présenté sous forme de lien hypertexte
qui permet à l'utilisateur de naviguer dans le texte source ou
son résumé en allant de terme à terme au moyen de
la touche de tabulation.
De ce fait, Pertinence Summarizer est non seulement un outil de résumé
automatique avec des fonctionnalités très avancées
mais aussi un logiciel permettant l'exploration intelligente de l'information
textuelle à l'heure à l'heure où nous subissons des
"avalanches" d'informations stockées dans diverses sources
informatiques : réseaux (Intranet, Intranet, Extranet...), ordinateurs
personnels, tous supports confondus : disques durs (internes et externes),
CD, disquettes, etc.
Informatiquement conçu autour des standards XML et J2EE (Java),
Pertinence Summarizer peut être utilisé sous forme d'une
version monoposte et/ou d'une version Serveur. Une API Java existe en
vue d'une intégration spécifique ainsi qu'un Batch ayant
pour particularité de résumer simultanément, à
la volée, une liste d'URL désignant chacune un texte à
résumer. Le nombre de pages du document textuel à résumer
peut être illimité selon les capacités du matériel
informatique de l'utilisateur.
Références bibliographiques :
A. Lehmam , P. Bouvet (2001) Évaluation, rectification et pertinence
du résumé automatique de texte pour une utilisation en réseau
Colloque du Chapitre français de l'ISKO (International Society
of Knowledge Organization) 5-6 juillet 2001 à l'Université
de Paris X "Filtrage et résumé automatique de l'information
sur les réseaux", pp. 111-125, Paris
A. Lehmam (2000) Résumé de texte automatique:des solutions
opérationnelles, La Tribune des Industries de la Langue, de l'Information
Électronique et du Multimédia, pp.50-58,OFIL, Paris.
A. Lehmam (1999) Text structuration leading to an automatic system of
summarization, Information Processing & Management, 35, pp. 181-191,
Elsevier Science Ltd, NJ, USA
A. Lehmam (1997) Automatic summarization on the Web? RAFI: A system for
summarizing using indicating fragments , 5ème Conference RIAO '97
Recherche d'Information Assistée par Ordinateur sur Internet, Université
McGill, Montréal, Québec H3A 2T7, Canada, 25-26-27 Juin
1997, pp. 112-124.
Abderrafif Lehmam travaille pour PERTINENCE
MINING - Paris
|