*** En construction ***

Approches informatisées à une oeuvre littéraire: l'exemple de Michel Tournier
Condensé du mémoire de DEA de András Tóth

0. Introduction
1. L'oeuvre de Michel Tournier
2. Genèse du projet, méthode de travail
3. Approches
3.1. Approches scientifiques
3.1.1. Approche encyclopédique
3.1.2. Approche multimédia
3.1.2.1. L'approche adoptée par la critique génétique
3.1.3. Approche statistique
3.1.4. Approche pédagogique
3.2. Approches artistiques
3.2.1. Fiction interactive
3.2.2. Génération de texte
3.2.3. Intelligence artificielle: dialogue avec un personnage
3.2.4. Procédés transformationnels

Introduction
L'informatique semble prendre un certain retard par rapport aux prognostiques utopiques des décennies précédantes quant au traitement du langage naturel, que ce soit au niveau scientifique ou artististique. (réf: article de Jason Hutchins sur MegaHal et TAH 19) La barrière de la langue à l'air d'être infranchissable, car intimement liée à l'intelligence humaine. Mais ce retard peut être aussi expliqué par la réticence des chercheurs en sciences humaines à utiliser les nouvelles technologies dans un domaine apparemment aussi éloigné que la littérature.
Mon travail propose de réconcilier ces oppositions en montrant, à travers l'exemple d'une oeuvre concrète, que même à l'état actuel de nos connaissances, il existe une variété extrêment riche de méthodes qui peuvent apporter des résultats tout à fait intéressant à la recherche et à la création littéraire.

L'oeuvre de Michel Tournier
Description du corpus de l'oeuvre et biographie de l'écrivain pour ceux qui ne le connaissent pas.
Le choix de Michel Tournier a une explication qui remonte à un temps où mon intérêt principal était l'auteur même et non l'informatique textuelle.
Il y a à peu près 7 ans que j'ai rencontré les livres de Michel Tournier, et depuis je suis devenu un adepte de son oeuvre. J'ai créé une bibliographie des études sur lui, dont j'ai recherché, photocopié et lu tout ce qui était disponible en Hongrie (une quarantaine). Lors de son passage à Budapest en 1993, j'ai fait une interview avec lui, qui a paru dans l'hebdomadaire hongrois Magyar Narancs. Nous avons gardé le contact ces quatre dernières années. Au fur et à mesure que j'avançais dans la lecture de ses livres et des études qui lui ont été consacrées, je m'efforçais en vain à trouver un fil conducteur, un dénominateur commun parmi les systèmes philosophiques très divers et très originaux présentés dans chacun de ses romans, nouvelles, ou même essais. Nos conversations personnelles m'ont renforcé dans la conviction que l'oeuvre de Michel Tournier n'est pas descriptible dans sa totalité par un seul schéma, si tentante une telle analyse soit-elle; mais c'est plutôt un amas, un kaléidoscope d'idées plus ou moins indépendantes. S'il y a quelque chose en commun dans ses idées, c'est la nouveauté du regard qu'elles jettent sur le monde. Il semble que tout ce que Tournier touche (que ce soit la chose la plus anodine, quotidienne) gagne une nouvelle signification dans ses livres, même si parfois à la manière d'un documentaliste il nous présente longuement divers aspects de la réalité qui nous entoure, comme si la fiction devenait un texte scientifique. Voilà pourquoi j'ai pensé à un certain moment que la seule approche compréhensive de son oeuvre ne peut être qu'encyclopédique, idée que j'ai formulée dans un article portant un titre semblable à celui de ma communication. D'une part, l'auteur insiste lui-même sur le fait que l'important, c'est ce qu'il écrit, et non comment il l'écrit. Ses idées souffrent donc moins quand on les sort de leur contexte narratif. D'autre part, même ses romans regorgent de passages théoriques qu'on pourrait très bien transférer sans aucun changement dans une encyclopédie. Cette encyclopédie, je l'imaginais au départ sous forme de livre, les idées de Michel Tournier en ordre alphabétique, comme dans un dictionnaire. Que l'univers de l'auteur s'offre particulièrement bien à ce type de dissection, je n'étais pas le premier à le remarquer. Tournier lui-même m'a montré un livre allemand intitulé Von Abel bis Zwilling: Ein Lexikon des Lebens (De Abel à Jumeaux: une encyclopédie de la vie), qui regroupe alphabétiquement quelques-unes de ses idées sous formes de citations puisées dans sa fiction et dans ses essais. Ne parlons pas de ses ouvrages plus récents (Le Vagabond immobile, Au pied de la lettre, Petites proses, Le Miroir des idées), qu'il tente lui-même d'organiser d'une façon plus ou moins encyclopédique dans le sens que ses écrits sont groupés suivant une certaine thématique. Si Le Vagabond immobile n'est qu'un amas incohérent d'idées semblable à un journal, Au pied de la lettre suit déjà l'organisation alphabétique des dictionnaires, où Tournier reprend certains mots de la langue française pour expliquer leurs particularités, ou tout simplement pour attirer l'attention à des mots peu connus mais intéressants. Dans Petites Proses, il nous propose un thesaurus primitif dans la structuration même du livre en chapitres et sous-chapitres. Quant aux chapitres du Miroir des idées, ils vont du particulier au général en opposant des notions antithétiques: ce livre effectue une gigantesque ouverture sur la condition humaine et sur le monde tout en restant dans les cadres d'une énumération encyclopédique.
Malgré tout leur intérêt et toute leur ingéniosité, je n'ai pu m'empêcher de remarquer les inconvénients de la méthode utilisée dans ces livres: la non-exhaustivité de leur encyclopédisme due aux contraintes matérielles (surtout dans le cas de l'anthologie allemande), la mobilité fortement restreinte du lecteur parmi les notions, et le manque du groupement multicritère des mots-clés. Il ne m'a pas fallu longtemps pour que je me rende compte qu'avec l'informatique, des projets plus ambitieux deviennent réalisables. La modélisation du réseau sémantique de l'oeuvre de Michel Tournier sur ordinateur est devenue mon but principal.
Après toutes les préparations (j'avais même fait un prototype de l'encyclopédie basée sur quelques textes), j'ai dû de me rendre compte que l'idée n'était pas réalisable pour des raisons de droits d'auteur. J'ai donc décidé de rester sur un plan purement théorique, et d'élargir le champs de ma recherche aux autres approches informatiques à une oeuvre littéraire.
A part le caractère encyclopédique de l'oeuvre, nous retiendrons les caractéristiques suivants pour la suite de ce mémoire. L'auteur s'appuie abondamment sur des sources littéraires et scientifiques, créant un riche réseau d'intertextualité dans lequel l'ordinateur peut nous proposer des itinéraires non prévus originalement. Certains thèmes reviennent obstinément dans les différentes périodes de l'oeuvre, parfois repris presque mot-à-mot: par exemple la notion de "suradaptation" apparaît dans le Roi des Aulnes, les Météores, dans le Vagabond Immobile et dans un entretien avec René Zazzo. C'est que Tournier se considère comme un conteur (approfondir cette affirmation), et n'hésite pas à redire (réécrire) ces histoires et ces théories dès que l'occasion s'y présente. Traitement avec Vendredi ou les limbes du Pacifique et Vendredi ou la vie sauvage.

Genèse du projet, méthode de travail
Extraire de la section précédente la partie racontant comment je suis arrivé à ce point dans mon travail.

Approches scientifiques:

Approche encyclopédique:
Indexation documentaliste d'une oeuvre littéraire, création de thésaurus (indexe hiérarchique à la manière d'un dictionnaire thématique)
c'est ce qui se rapproche le plus de mon projet original
recherche préexistante: Michel Bernard: De quoi parle ce livre? thésaurus pour une oeuvre littéraire, aussi les indexes hiérarchisés des corpus de textes littéraires déjà publiés
l'intérêt du thésaurus Tournier démontré plus haut.
Insérer ici la partie traitant de l'hiérarchisation des occurences dans mon prototype

Approche multimédia:
CD-ROMs présentant l'univers d'un écrivain, projet Balzac, Chateaubriand tout ce qu'on a vu jusqu'ici: données biographiques, témoignages, interviews, documents source, copies de correspondance, études contemporaines, recherche plein-texte dans l'oeuvre entière avec possibilité d'annotation etc.
Enumération des procédés après l'étude de quelques-unes de ces publications.
Sous-catégorie: l'approche adoptée par la critique génétique.
Dans le cas de Tournier, les manuscrits ne marchent pas, car il détruit toutes les versions précédantes des manuscrits. La genèse de l'oeuvre n'est donc pas retraçable. Voir quand-même textes ou interviews sur la méthode de travail de T. Par contre, l'abondance des sources permet de rassembler et de comparer une multitude de documents.
Sous forme de livre, Arlette Bouloumié a déjà réalisé un ouvrage sembable sur les divers aspects de Vendredi ou les limbes du pacifique, quasiment sous format multimédia, ou bien il exist aussi un livre sur les aspects philosophiques dans Vendredi ou la vie sauvage.

Approche statistique:
L'apport le plus considérable de l'informatique à la recherche littéraire est certainement l'analyse statistique des corpus littéraires. (citer des exemples)
Préparation du corpus: texte tel quel, lemmatisation, n-grammes
Indexation du corpus: les mots liés à leurs occurrences dans les textes
Travail sur le corpus: statistiques des fréquences de mots (richesse du vocabulaire, évolution du vocabulaire dans le temps, comparaison des textes par écart), cartographie sémantique (permet de dégager les thèmes du corpus et les documents qui y sont associés)
Le corpus de Tournier (pour l'instant, les Météores et Vendredi ou les limbes du Pacifique) sera traité dans Hyperbase d'Etienne Brunet et Neuronav d'Alain Lelu. Hyperbase: texte tel quel, indexation, statistiques des fréquences. Neuronav: lemmatisation, indexation, cartographie sémantique. Les résultats de ce traitement influenceront beaucoup le contenu de ce chapitre.
Néanmoins, ce qui serait intéressant à voir, ce que l'on peut formuler comme hypothèse:
comparaison lexicale des deux Vendredi, des deux Rois Mages: vocabulaire simplifié ou non dans les deuxièmes versions, qui selon l'auteur ne s'adressent pas aux enfants, mais plutôt sont tellement bien réussis qu'ils sont lisibles par les enfants.
richesse du vocabulaire de Tournier: l'auteur aime les mots rares et il invente souvent des mots en se basant sur leur étymologie. Confirmation par la statistique.
évolution du vocabulaire de Tournier: selon l'auteur même, il est en train de se "déssécher" (réf), il écrit de moins en moins. Y-a-t-il une trace de ceci au niveau du vocabulaire?
Utilisation des moyens statistiques pour retrouver les tournures dans le style de Tournier (parce qu'il a un style assez rigide). Voir si le même style se retrouve dans ses fictions et dans ses essais (hypothèse: oui, car il ne fait pas beaucoup d'effort pour doter ses personnages d'un style original).
Avec l'analyse factorielle des écarts entre les éléments du corpus, voir quels sont les textes qui se ressemblent le plus, et examiner s'il y a un rapport entre cette ressemblance et les genres chez Tournier (roman original, réécriture de roman, nouvelles, essais personnels et philosophiques, essais critiques).
Avec la cartographie sémantique, voir les si les grands thèmes de l'oeuvre correspondent à ce que les critiques évoquent à son égard.
Problème grave: comment structurer une oeuvre littéraire comme un roman en segments pertinents pour la cartographie sémantique?

Approche pédagogique:
Analyse collective de textes en classe à l'aide d'ordinateurs: le projet de Robert Caron
voir les applications possible à Tournier
dans le domaine de Tournier, il existe déjà une réalisation
Le site de Stéphanie Posthumus

Approches artistiques:

fiction interactive:
Il s'agit de la transposition en hypertexte narratif, et non de l'exploration de l'oeuvre suivant des critères non-narratives.
Manque total de tentatives précédantes (?).
Pour cause: l'impossibilité et l'inintérêt de l'hypertextualisation d'une oeuvre originalement linéaire. Si on accepte d'explorer les parties des bifurcations non "visitées" par l'auteur, comment créer ces parties non-écrites de l'histoire? Le texte original est quand-même une construction du début à la fin, dont il est difficile de rompre l'unité. En plus, on ne peut pas prétendre à remplacer l'auteur dans l'écriture.
L'échec présumé d'une telle entreprise ne nous empêche pas de relever des traits qui se rapprochent des hypertextes dans la narration.
Dans un roman comme les Météores ou Gaspard, Melchior Balthazar, les fils de l'histoire sont presque totalement indépendants et leur ordre et renversable (surtout dans les Météores). Voir l'adaptation de Partie de Chasse pour l'offre de choix dans le parcours d'un texte semblable.
Point de vue subjectif et objectif: le changement - pourquoi?
l'hypertextualité du parcours de Paul et de Jean dans les Météores: rapproche l'idée de la géographie comme grille de déchiffrement hypertextuel. L'exemple de l'étape islandaise, les repères donnés à Venice etc. - c'est un peu comme un jeu interactif du genre Myst. Les jardins japonais, les espaces canadiens
Mais la question se pose: qu'est-ce qui se serait passé si Paul ne s'était pas arrêté en Islande? Puisqu'il cherche son jumeau, il sert de rappel; d'indice vivante au gens qui avait connu son frère.
Les personnages lisent leur sort (leur parcours réalisé dans leur vie jusqu'ici) comme un indicateur de ce qu'il doivent faire par la suite, des décisions à prendre.
Tiffauges qui n'accepte pas l'offre d'une jeune femme qui le cache quand les prisonniers de guerre sont acheminés vers l'Allemagne, mais poursuit sa destinée, sa vocation qui le pousse vers l'Est.
Lecture hypertextuelle: les prédictions du capitaine au tarot pour Robinson - un niveau de lecture qui résume toute l'histoire, comme un menu de navigation qui contient les différentes étapes de la transformation de Robinson, affiché constamment dans la mémoire du lecteur et par ailleurs facilement retrouvable, puisque placé au début du livre.
Enfin, l'archéologie textuelle est aussi une forme de réorganisation et de libre choix dans l'ordre de lecture.
Description du procédé de lecture que j'ai inventée. Plus longue que celle des autres, car c'est le seul endroit où il est décrit. Mais on se demande si les textes de Tournier s'adaptent bien à ce type de lecture. C'est plutôt pour des textes simples qui se limitent à raconter une histoire dont la fin réserve une surprise (pour motiver le lecteur), donc ce serait les nouvelles du type La mère-noël ou La légende du pain etc. Les investigations d'ordre philosophiques comme dans les Météores ou Vendredi ou les limbes... ne seraient que complètement embrouillées. En appendice: transcription d'une séance de lecture archéologique d'une nouvelle de Tournier.

Génération de texte
La plupart des générateurs de texte fonctionnent sur le principe des moules. Courte description du principe.
malgré le fait qu'il déclare que la forme n'est pas tellement importante pour lui, il est assez facile de créer un générateur de texte qui écrit à la façon de Tournier, comme Jean-Pierre Balpe l'a fait pour Tardieu et Maurice Regnaut. Ou hybridation de Rimbaud et Baudelaire par l'Alamo.
Recenser ici quelques tournures habituelles de Tournier.
outils scientifiques pour déterminer les éléments du style de l'auteur: à part l'analyse statistique décrite plus haut, référence au travaux des Finnois
Décrire le plan du générateur d'étymologies personnelles à la façon de Tournier

Intelligence artificielle: dialogue avec un personnage
(système d'interrogation perfectionné pour le texte des romans)
Idée de base: la machine matérialise un des personnages de Tournier et répond aux questions des utilisateurs en son nom, en utilisant la base de connaissance accumulée dans la nouvelle.
deux facteurs IA intimement liés:
la reconnaissance et la génération de langage naturel
la représentation des connaissances pour l'IA - un simple thésaurus ne suffirait pas, il faudrait modéliser le réseau d'associations du cerveau humain pour avoir des réactions originales (pas le texte du roman) et crédibles à la fois.
deux bases de connaissances distinctes:
celle du roman
celle des stratégies de communication de la machine: comment mener la réponse vers le sujet, comment garder le style du personnage.
Dans une forme plus primitive, mais envisageable dès aujourd'hui, le programme se contenterait de citer les textes du roman avec des introductions et des conclusions dans le style d'Alexandre. L'analyse de la question et le choix du texte à citer se ferait grâce à un dictionnaire de synonimie qui permettrait de trouver des correspondances dans le texte du roman aux mots-clés de la question. Cela ressemblerait plutôt à un monologue engendré par nos questions qu'à un vrai dialogue.
Le texte de cette section sera alimentée aussi par des références à l'état actuel des travaux en matière d'intelligence artificielle.

Procédés transformations de l'Oulipo et de l'Alamo à l'aide de l'ordinateur
Voir les éventuels réalisations de l'Alamo ou d'autres travaux sur ordinateur
hybridation de rimbaud et baudelaire
ou la méthode S+7
voir si éventuellement l'un des procédés à un intérêt particulier pour Tournier