Entreprises, administrations, laboratoires et services de développement sont aujourd'hui confrontés à un défi : gérer la masse de documents textuels électroniques qu'ils accumulent. Comment faire parvenir l'information à ceux qui sauront l'exploiter ? Comment résumer, extraire ou filtrer une information pertinente parmi toutes celles que contiennent les documents stockés ? Ces tâches sont d'autant plus complexes que la pertinence est liée aux fonctions et aux objectifs des différents agents. Cet ouvrage présente les méthodes fournissant des réponses opérationnelles à ce type de problèmes. La première partie décrit les principes et architectures sur lesquels se fondent les systèmes de résumé automatique en insistant sur les bouleversements que ce domaine a connu ces dernières années. La deuxième partie, consacrée au filtrage et à la fouille sémantique de textes, montre la nécessité d'utiliser la sémantique pour répondre aux objectifs spécifiques d'une tâche d'identification ou de recherche d'information. Des exemples d'applications et d'outils industriels, opérationnels ou en cours de développement, illustrent l'importance des travaux récents pour le traitement de l'information. Introduction. Méthodes de résumé automatique.Les méthodes fondées sur la compréhension. Les méthodes par extraction. Les méthodes par apprentissage. Évaluer les systèmes de résumé automatique. Filtrage et fouille sémantique de textes. Les besoins en filtrage d'informations. Sum UM. Le projet FilText et la plate-forme ContextO. Étude d'outils industriels. Perspectives et applications. Conclusion.
Informations légales : prix de location à la page 0,0442€. Cette information est donnée uniquement à titre indicatif conformément à la législation en vigueur.
Extrait
Filtrage sémantique
REMERCIEMENTS Merci tout d’abord à Jean-Pierre Desclés qui a su, par sa confiance et ses nombreux conseils, guider mes recherches dans le domaine de l’informatique linguistique. Merci à l’équipe LaLICC, laboratoire du CNRS et de l’Université Paris-Sorbonne (Paris IV), notamment à toutes celles et tous ceux qui, depuis mon arrivée en 1993, ont contribué à l’élaboration de cet ouvrage. Merci aux étudiants du DEA « Mathématiques et informatique appliquées aux sciences humaines » et du DESS « Ingénierie de la langue et société de l’information » pour leurs questions, m’obligeant ainsi à mieux préciser certaines notions. Je remercie vivement J.-C. Pomerol qui a accueilli ma proposition d’ouvrage avec enthousiasme et m’a fait confiance pour mener à terme ce projet. Merci enfin aux enseignants-chercheurs du département du Traitement automatique du langage naturel de l’université de la République de Montevideo (Uruguay), Dina Wonsever, Javier Couto, Gustavo Cripino, pour leur accueil chaleureux et attentionné, ainsi qu’à tous les membres de cette université.
Minel, Jean-Luc Filtrage sémantique : du résumé automatique à la fouille de textes Paris : Hermès Science Publications, 2002 ISBN 2-7462-0602-1 RAMEAU : linguistique : informatique DEWEY : 006.6 : Méthodes informatiques spéciales. Autres applications 418 : Linguistique appliquée. Traduction
Le Code de la propriété intellectuelle n'autorisant, aux termes de l'article L. 122-5, d'une part, que les « copies ou reproductions strictement réservées à l'usage privé du copiste et non destinées à une utilisation collective » et, d'autre part, que les analyses et les courtes citations dans un but d'exemple et d'illustration, « toute représentation ou reproduction intégrale, ou partielle, faite sans le consentement de l'auteur ou de ses ayants droit ou ayants cause, est illicite » (article L. 122-4). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles L. 335-2 et suivants du Code de la propriété intellectuelle.
Filtrage sémantique
du résumé automatique à la fouille de textes
Jean-Luc Minel
EXTRAIT DU CATALOGUE GÉNÉRAL
Multilinguisme et traitement de l’information, Frédérique SEGOND(dir.), 2002. Structuration de terminologie, HAMONT., NAZARENKOA. (dir.), 2002. Espaces numériques d’information et de coopération, C. SIMONE, N. MATTA, B. EYNARD(dir.), 2001. IHM et recherche d’information, Céline PAGANELLI(dir.), 2001. Ingénierie des langues, Jean-Marie PIERREL(dir.), 2001. Lexiques sémantiques, BOUILLONP., VIEGASE. (dir.), 2001. Logique pour le traitement de la langue naturelle –application à la langue française, Philippe DELSARTE, André THAYSE, 2001. Réingénierie des données et des documents pour le web, Jacques KOULOUMDJIAN (dir.), 2001. Traitement et contrôle de l’information, Peter STOCKINGER, 2001. L’archivage, Anne-Marie CHABIN(dir.), 2000. L’indexation, Jean-Michel JOLION(dir.), 2000. La recherche d’informations –du texte intégral au thésaurus, Philippe LEFÈVRE, 2000. Le management de l’archive, Anne-Marie CHABIN, 2000. Traitement automatique des langues pour la recherche d’information, Christian JACQUEMIN, 2000. Traitement automatique des noms propres, Denis MAUREL, Frantz GEUTHNER(dir.), 2000. Gestion des documents et gestion des connaissances, Gérard DUPOIRIER, Jean-Louis ERMINE(dir.), 1999.