Hello Marcel !

@LeoGourven, le 15 mars 2010 à 16:00

Je travaille depuis un petit mois sur un drôle de projet. Je me remettais doucement de la lecture de A La Recherche Du Temps Perdu de Marcel Proust et parallèlement, je travaillais dans le cadre de mes études autour d’un projet lié aux visualisation graphiques. Alors je me suis dit (innocemment)  : Pourquoi le petit Marcel n’aurait pas droit à sa data visualization ?

Et au fur et à mesure je me suis rendu compte que l’œuvre de Proust justifiait tout particulièrement cette approche scientifique barbare :

  • Le roman est immense ! 1,5 millions de mots !
  • C’est un roman fleuve, il va l’enfance à la mort.
  • L’écriture de Marcel Proust est quasi scientifique. Il suit une sorte de recette, on avance par étape.
  • Tout le monde connait Proust ! (Et personne ne l’a lu). Et tout le monde se demande depuis ses 4 ans si ses phrases sont si longues que ce l’on raconte ?
  • Libre de droit et numérisé.

marcelDes statistiques hum hum, intéressant.

J’ai (re)découvert que dans les années 80 (quand je n’étais même pas né quoi), un certain Brunet Étienne avait déjà travailler sur le sujet, mais en se concentrant sur l’aspect statistique (Les occurrences les plus répétés, nombre de mots, de phrases etc). Ce n’est pas énorme (ça l’était pour l’époque), mais c’est déjà extrêmement intéressant.

Dans mon cas,  une des premières chose à faire, c’est transformer l’information en donnée  structurée (J’avais l’habitude de faire le contraire mais bon. ). C’est à dire mettre la Recherche dans une base de données, séparer chaque phrase, l’identifier et – dans un second temps- l’enrichir  (De quelle tome vient elle ? Où se déroule l’action de cette phrase ? Que temps est utilisé ?).

A partir de là je pourrai opérer quelques traitements statistiques, à priori je débuterai par une étude du nombre de mot par phrase. Mais l’intérêt de cet outil prendra tout son sens une fois que l’on pourra superposer le nombre de mots par phrase avec les lieux, les éléments clés de l’action etc (Ce qui permettra de répondre à des questions du type : De quelle manière évolue la longueur des phrases en fonction face à la mort de sa grand mère ?).

Mais pour cela il faut que je trouve un outil d’analyse linguistique qui puisse me séparer mes phrases (Pas si simple qu’il n’y parait). Si quelqu’un maitrisant ce domaine arrive sur ce blog, j’ai besoin d’aide ! Envoyez moi un mail !

En bref, je vous raconterai sur ce blog comment mon projet avance,je causerai technique, je diffuserai mon code, je vous appellerai à l’aide mais je ne vous dirai pas que je suis fatigué !



Partager ce billet :
|


3 commentaires sur “Hello Marcel !”

  1. vourc'h dit :

    j’ai des cours de science du langage,je peux peut-être en parler à un de mes prof? ciao

  2. Léo Gourven dit :

    Oui je veux bien, même si ce que je recherche est une infime partie de la linguistique, peut être qu’il pourrait avoir quelques pistes.

  3. denys dit :

    peu importe le lieu du point de vue, c’est d’observer qui transforme !

Laisser une réponse

XHTML : Vous pouvez utiliser ces balises : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>