Catégorisation automatique de propositions textuelles en types de discours

Détails

Ressource 1Télécharger: BIB_EAE5999425AF.P001.pdf (1596.90 [Ko])
Etat: Public
Version: de l'auteur⸱e
ID Serval
serval:BIB_EAE5999425AF
Type
Actes de conférence (partie): contribution originale à la littérature scientifique, publiée à l'occasion de conférences scientifiques, dans un ouvrage de compte-rendu (proceedings), ou dans l'édition spéciale d'un journal reconnu (conference proceedings).
Collection
Publications
Institution
Titre
Catégorisation automatique de propositions textuelles en types de discours
Titre de la conférence
Lire demain : des manuscrits antiques à l'ère digitale = Reading tomorrow : from ancient manuscripts to the digital era
Auteur⸱e⸱s
Cocco C.
Editeur
Presses polytechniques et universitaires romandes
Adresse
Lausanne
ISBN
9782880749583
Statut éditorial
Publié
Date de publication
2012
Editeur⸱rice scientifique
Clivaz C., Meizoz J., Vallotton F., Verheyden J.
Pages
689-707
Langue
français
Notes
Livre papier, eBook
Résumé
De nombreuses méthodes de classification automatique de textes (supervisée ou non) existent. Elles se sont particulièrement développées depuis la création du web en vue d'améliorer les moteurs de recherche. Au delà de ce champs d'application, elles peuvent aussi être utiles pour « découvrir » ou « redécou­vrir » ce qui caractérise une classe de textes aussi simplement que possible. Dans l'approche statistique développée ici, il s'agira de partitionner des parties de textes en types de discours tels que narratif, explicatif, argumentatif etc. en utilisant un minimum d'information, à savoir les catégories morphosyn­taxiques (CMS). Les premiers résultats obtenus mettent en évidence des liens significatifs entre les CMS, les types de discours et des textes annotés par un expert humain ; ces relations sont toutefois encore incomplètes et difficiles à interpréter d'un point de vue linguistique.
Création de la notice
22/08/2012 14:35
Dernière modification de la notice
20/08/2019 17:13
Données d'usage