05h35 24 août 2015

Notre approche du Textmining

Les données web constituent un univers sans limites et un formidable terrain d’études & recherches. Aujourd’hui, les données textuelles font partie intégrante de ce que d’aucuns appellent le « Big Data ». Des avancées dans la visualisation des statistiques lexicales sont notables associant fréquence et co-occurrence.

PCW-Etudes suit l’évolution de la recherche en textmining, notamment en participant aux séminaires des universités (Centre d’étude des discours, images, textes, écrits, communication Créteil Val de Marne) et en contribuant au programme de recherches IMAGIWEB (Laboratoire ERIC Lyon 2 http://mediamining.univ-lyon2.fr/people/velcin//imagiweb/).

La mutualisation de la fonctionnalité des outils

Cette veille en matière de recherche ainsi que notre expérience auprès de nos clients nous a permis de développer une méthode d’analyse fine qui allie l’utilisation conjointe de plusieurs logiciels de fouille de texte et l’expertise sémio-linguistique.

Capture Ecran du logiciel TreeCloud sur la base d’un corpus de commentaires Deezer

Le logiciel TreeCloud permet de générer des nuages arborés à partir d'un texte, autrement dit des nuages de mots par fréquence et disposés autour de branches qui indiquent leur proximité dans le texte (co-occurrence). Cet outil de visualisation a été conçu par Philippe Gambette (Laboratoire d’informatique LIGM Marne la Vallée UMR 8049) à partir du concept de visualisation proposé par Jean Véronis.

Capture Ecran d’un résultat d’analyse factorielle générée par Lexico3 sur la base d’un corpus de Blogs

Le logiciel Lexico 3 permet de repérer le vocabulaire utilisé en restituant la fréquence du lexique et son contexte immédiat. L’intérêt du logiciel est d’identifier les spécificités lexicales d’un corpus par rapport à un autre via un calcul de probabilité (coefficient de spécificité ou non spécificité). Lexico 3 est un logiciel conçu pour le traitement lexicométrique de textes volumineux. Il est développé par le laboratoire CLA²T SYLED de l’Université de la Sorbonne Nouvelle

Visualisation avec Tropes des proximités des Références (classe d’équivalents) autour de l’occurrence « aide sociale » dans les titres d’un corpus de blogs- avant (en bleu) et après (en vert) l’occurrence «aide sociale ».

En complémentarité de ces deux logiciels, Tropes utilise des techniques de classification sémantique (classe d’équivalents / désambigüisation) et de génération de thesaurus. Ce logiciel permet notamment de classifier le corpus étudié sur la base d’ontologies et de catégoriser grammaticalement les occurrences. Tropes est un logiciel développé par Pierre Molette et Agnès Landré sur la base des travaux de Rodolphe Ghiglione.

à Ces différents outils permettent de construire des sous échantillons pertinents pour l’analyse. L’approche sémio-linguistique appréhende ensuite ces échantillons dans leur linéarité discursive en analysant plus finement les représentations à l’œuvre dans les discours et en mettant en évidence les thèmes, opinions exprimées et modalités d’énonciation.

[1] http://www.cavi.univ-paris3.fr/ilpga/ilpga/tal/lexicoWWW

Lien permanent Catégories : b. NOTRE APPROCHE DU TEXTMINING Tags : textmining ; fouille de texte

À propos

Dirigeant : Patrick Couton-Wyporek Siret n°... Lire la suite

Albums photos

Présentation en quelques slides

Derniers blogs mis à jour

Juillet 2026

Calendrier des notes en Juillet 2026
D	L	M	M	J	V	S
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Carte

Notes récentes

12h14 01 nov. 2017
Nouvelle adresse

Retrouvez-nous désormais dans un design plus lumineux...
11h30 31 août 2015
Du sens pour appuyer vos décisions

Flyer ...
07h53 30 août 2015
L'analyse sémiologique, pour quoi faire ?

Dans une économie où la communication crée de la...
07h51 28 août 2015
Panorama de nos expériences multi-sectorielles

Contribution au programme de recherche...
20h13 27 août 2015
Vos projets

Réaliser un état des lieux du sens de votre...
03h45 25 août 2015
Votre contact

Convenons ensemble d’un rendez-vous, je pourrai vous...
05h35 24 août 2015
Notre approche du Textmining

Les données web constituent un univers sans limites et...
12h14 21 août 2015
Regard sémio sur le design d'un logo

Comment moderniser une marque sans la renier ? En amont...
11h52 03 avril 2013
Textmining & Blogs : un exemple d'approche

Pour consulter l'article :...
07h53 02 avril 2013
Le textmining : outil d'écoute clients

L'analyse des contacts spontanés : messages sur le...

Sémiologie et textmining

Analyses sémiologiques sur mesure pour le marketing et la communication

Notre approche du Textmining

Nouvelle adresse

Du sens pour appuyer vos décisions

L'analyse sémiologique, pour quoi faire ?

Panorama de nos expériences multi-sectorielles

Vos projets

Votre contact

Notre approche du Textmining

Regard sémio sur le design d'un logo

Textmining & Blogs : un exemple d'approche

Le textmining : outil d'écoute clients