Vers la page d'accueil

Intervention d’Abderrafih Lehmam

Vers le programme en français
Back to the programme in English

PERTINENCE SUMMARIZER : un outil d’aide à la rédaction par la génération de résumés automatiques

Pertinence Summarizer est un outil de traitement automatique du langage qui lit et condense des textes en Français, Anglais, Allemand, Espagnol, Italien, Portugais, Arabe, Grec, Néerlandais, Norvégien et Russe. Dix de ces langues peuvent être testées en ligne sur Internet. La technologie d'intelligence artificielle intégrée dans le logiciel s'appuie exclusivement sur des méthodes linguistiques qui permettent de mieux "comprendre" le contenu d'un document afin d'en extraire les informations pertinentes. Ce logiciel peut produire des résumés de textes à partir d'un document, d'une page Web, d'un hyperlien, d'un message e-mail, d'un fichier ou via le Presse-papiers.
Cet outil résume automatiquement des textes de différents formats: DOC (Word), PDF, RTF, HTML (.html, .htm, .asp, .php, etc), ASCII (.txt), WML, XML mais aussi PPT et XLS. Pour une exploitation optimale des résumés automatiques, il est conseillé d'utiliser les navigateurs Internet Explorer 5+ ou Netscape 6+. En temps réel, le logiciel permet de modifier librement selon les besoins de l'utilisateur la longueur des résumés générés. La présentation du résumé est innovante dans la mesure où elle permet, de manière intelligente, une lecture assistée à l'utilisateur tout en lui offrant la possibilité d'accéder aux informations essentielles extraites dans toute leur cohérence.
Pertinence Summarizer permet de résumer automatiquement des textes tout en tenant compte des besoins propres de l'utilisateur. Ce dernier peut proposer ses propres termes (mots, groupe de mots ou expressions) pour appuyer la pertinence du résumé. En temps réel, ces termes sont pris en compte dans le processus de résumé. Il est aussi possible de choisir un domaine particulier ; une liste de termes du domaine choisi est alors présentée avec le résumé. Chaque terme trouvé dans le texte est accompagné du nombre de ses occurrences et présenté sous forme de lien hypertexte qui permet à l'utilisateur de naviguer dans le texte source ou son résumé en allant de terme à terme au moyen de la touche de tabulation.
De ce fait, Pertinence Summarizer est non seulement un outil de résumé automatique avec des fonctionnalités très avancées mais aussi un logiciel permettant l'exploration intelligente de l'information textuelle à l'heure à l'heure où nous subissons des "avalanches" d'informations stockées dans diverses sources informatiques : réseaux (Intranet, Intranet, Extranet...), ordinateurs personnels, tous supports confondus : disques durs (internes et externes), CD, disquettes, etc.
Informatiquement conçu autour des standards XML et J2EE (Java), Pertinence Summarizer peut être utilisé sous forme d'une version monoposte et/ou d'une version Serveur. Une API Java existe en vue d'une intégration spécifique ainsi qu'un Batch ayant pour particularité de résumer simultanément, à la volée, une liste d'URL désignant chacune un texte à résumer. Le nombre de pages du document textuel à résumer peut être illimité selon les capacités du matériel informatique de l'utilisateur.

Références bibliographiques :

A. Lehmam , P. Bouvet (2001) Évaluation, rectification et pertinence du résumé automatique de texte pour une utilisation en réseau Colloque du Chapitre français de l'ISKO (International Society of Knowledge Organization) 5-6 juillet 2001 à l'Université de Paris X "Filtrage et résumé automatique de l'information sur les réseaux", pp. 111-125, Paris

A. Lehmam (2000) Résumé de texte automatique:des solutions opérationnelles, La Tribune des Industries de la Langue, de l'Information Électronique et du Multimédia, pp.50-58,OFIL, Paris.

A. Lehmam (1999) Text structuration leading to an automatic system of summarization, Information Processing & Management, 35, pp. 181-191, Elsevier Science Ltd, NJ, USA

A. Lehmam (1997) Automatic summarization on the Web? RAFI: A system for summarizing using indicating fragments , 5ème Conference RIAO '97 Recherche d'Information Assistée par Ordinateur sur Internet, Université McGill, Montréal, Québec H3A 2T7, Canada, 25-26-27 Juin 1997, pp. 112-124.

A propos d’Abderrafih Lehmam

Abderrafif Lehmam travaille pour PERTINENCE MINING - Paris