Analyse quantitative
L'objectif est de rendre le corpus exploitable pour : une analyse ethnographique, une analyse littéraire, une analyse de métadonnées, en particulier une analyse diachronique, une analyse de réseaux sociaux. L'idée est que le traitement informatique de la "threaded conversation" en tant que corpus est à la fois unique pour :
une analyse ethnographique des débats, tensions et controverses : autant les "flame wars" et le personnage du "troll" (ref coleman) sont destructeurs du point de vue d'une communauté, autant ils sont fructueux pour l'historien et le traitement informatique peut aider à définir efficacement ce qui fait opérationnellement un fil intéressant en fonction de paramètres comme le nombre et l'enchevêtrement des réponses ou la catégorisation des interlocuteurs. À quels moments, dans quels sujets apparaissent les tensions, qui les provoque et qui les clôt ?
une analyse littéraire à base de fouille de texte (text mining) faisant intervenir la structure en fils pour catégoriser les sujets, mais aussi faisant intervenir une composante diachronique. Quels sont les sujets qui apparaissent et qui disparaissent au cours du temps ?
une analyse de réseaux sociaux différente de celle d'analyse de correspondances traditionnelles : en plus d'analyse de réseaux entre contributeurs épistolaires classique, la structure en fils permet l'analyse de réseaux bipartites impliquant des projections de réseaux de sujets entre eux ou de contributeurs entre eux (réf hansen). Quels sujets sont abordés par qui ? quels sujets sont reliés entre eux par des communautés de contributeurs ?