Projects

Projet d’Hypertexte de l’Œuvre de Balzac reposant sur l’Utilisation de Similarités (Hypertextual Project of Balzac’s works based on the use of similarities) – PHŒBUS

Le projet consiste à mettre en résonance l’ensemble de l’œuvre balzacienne (La Comédie humaine, les romans de jeunesse, les contes drolatiques, le théâtre et les œuvres diverses) avec un vaste corpus d’écrits contemporains, à aires culturelles multiples et de nature variée, qui ont pu la nourrir : œuvres romanesques d’autres auteurs de l’époque ; recueils collectifs de littérature panoramique (auxquels Balzac apporta des contributions) ; ouvrages scientifiques susceptibles d’avoir influencé la création balzacienne, notamment dans les domaines de la médecine, de la physiologie et des sciences naturelles. Son objectif est de permettre des recherches et des comparaisons intertextuelles élaborées, à l’intérieur de l’œuvre de Balzac, et dans le corpus plus vaste de textes littéraires et scientifiques de l’époque, entre 1800 et 1850, afin de faire émerger des correspondances, de repérer des emprunts, des citations, des reprises, des plagiats éventuels, et de constituer ainsi une cartographie de l’univers intellectuel de Balzac à partir des traces que d’autres textes ont laissées dans l’œuvre.

Le projet, qui relève de ce qu’on appelle les « humanités numériques », vise à fournir aux chercheurs en littérature et sciences humaines de nouveaux outils d’interrogation de vastes corpus textuels, susceptibles de permettre une connaissance approfondie de phénomènes génétiques, poétiques, stylistiques, ainsi que leurs implications en termes idéologiques. Du point de vue de la méthodologie littéraire, il se situe dans le domaine de l’intertextualité, de l’interdiscursivité et de la génétique, auquel le corpus balzacien offre un champ d’application particulièrement fécond : Balzac a la spécificité de multiplier les supports d’écriture (livres, volumes collectifs, feuilletons, articles de journal), en réutilisant ses textes antérieurs ; en même temps, son œuvre, qui définit par son ampleur l’état socio-historique contemporain, se nourrit de l’apport d’autres textes (notamment ceux de la littérature panoramique), et intègre diverses formes de savoir qui dépassent le champ littéraire. Au terme de ce projet, on sera en mesure de cartographier les sources que Balzac a utilisées au cours de l’écriture des différents romans de La Comédie humaine.

Au niveau de l’informatique, dans le cadre d’une recherche sur les méthodes d’exploitation de vastes corpus textuels qui se pose aujourd’hui comme une nécessité, notre projet vise à mettre à profit les techniques algorithmiques contemporaines pour explorer systématiquement les réseaux de réutilisations textuelles. L’étude porte donc sur la mise en évidence automatique de réseaux de segments textuels présents à l'intérieur d’une œuvre d’un auteur et provenant de l’ensemble de l’œuvre de cet auteur et d'un corpus contemporain plus large. Nous souhaitons, dans ce projet, utiliser ces techniques pour fabriquer un prototype informatique de repérage de réemplois pour l’analyse intertextuelle, qui fournira aux chercheurs une méthode originale d’interrogation de très vastes corpus textuels.

La finalité du projet est donc de réaliser un objet scientifique nouveau en termes de méthode et de corpus : une édition hypertextuelle de Balzac, que personne n’a encore procurée à ce jour, comprenant une bibliothèque virtuelle constituée d’ouvrages qui appartenaient à son univers intellectuel. Cette édition sera accessible dans un site dédié, présentant trois manières d’utilisation : une visualisation générale sur le mode d’une cartographie, donnant des informations d’ordre statistique et quantitatif ; un déroulement linéaire permettant d’accéder à la comparaison entre les textes sources et les textes cibles par un système de double fenestrage ; la lecture intégrale d’une œuvre de Balzac, en « feuilletant » un texte dont les parties qui présentent des homologies avec d’autres textes seraient signalées.

Il va sans dire qu’une fois testée sur Balzac, cette approche pourra être généralisée à bien d’autres auteurs du patrimoine.


This project will place Honoré de Balzac’s entire oeuvre (The Human Comedy, earlier novels, comic tales, theater, and other diverse texts) in conversation with a vast corpus of contemporary writings that may have inspired the former. This body of contemporary texts varies in terms of both cultural orientation and genre and includes: fictional novels from other authors of the period; collaborative collections of panoramic literature (to which Balzac contributed); scientific studies inclined to have influenced Balzac’s writing, notably those from the fields of medicine, physiology, and natural sciences. The objective is to enable more advanced research and intertextual comparisons within Balzac’s corpus and among the broader literary and scientific pieces dating from 1800-1850 in order to detect correspondences, borrowings, quotations, repetitions, and possibly plagiarism. To this end, this endeavor also includes the creation of a digital cartography of the Balzacian universe based on the traces other authors left on his work.

This project, which falls under the realm of “Digital Humanities”, aims to provide literary and social science scholars with new tools for examining large corpora of texts. These new technical instruments have the potential to deepen our knowledge of genetic, stylistic, and poetic phenomena as well as their ideological implications. Moreover, this literary methodology directly engages the genesis of printed documents, an area in which the Balzacian oeuvre proves to be particularly fertile ground for investigation: Balzac is well known for his use of multiple media (books, collective volumes, serials, journal articles) by recycling formerly published material. Likewise, his body of work, which through its extensive scope details the contemporary socio-historic landscape, draws heavily on the contributions of other texts (especially those of panoramic literature) and incorporates different orders of knowledge beyond the literary field. After completing this research, we will be able to map out the sources Balzac used as he wrote the range of novels that constitute The Human Comedy.

As part of an examination of techniques for mobilizing vast corpora of texts, a necessity in our day, our project seeks to build on current technological methods for systematically exploring systems of textual repetition and reuse. The study focuses thus on the automatic illustration of networks of passages of text present in an author’s oeuvre that arise from both the ensemble of this author’s work as well as a larger, contemporary corpus. We intend to use such techniques to create a digital prototype for tracking literary reemployment for intertextual analysis, which will offer scholars an innovative method for investigating massive bodies of literature.

Therefore, the ultimate objective of this project is to carry out an original scientific task with regards to both the method and the body of work: a hypertextual edition of Balzac, including a virtual library comprised of works belonging to his intellectual universe—an unprecedented undertaking yet to be accomplished. This edition will be accessible on a website dedicated to the enterprise, which will propose three forms of use: a general visualization by means of a cartography that provides statistical and quantitative information; a linear roll-out facilitating the comparison of source texts and target texts by means of a double-window interface; the integral reading of Balzac’s texts in which passages presenting homologies with other texts are indicated.

It goes without saying that, once this approach has been tested on Balzac, scholars will be able to adapt it to other authors of heritage.

Source of description: Information from the provider

Fields of research

French literature, Literature of the 19th century
Honoré de Balzac

Links

Contact

Andrea Del Lungo

Institutions

Université Lille 3 (UL3)
Analyses Littéraires et Histoire de la Langue (Laboratoire public)
Date of publication: 13.05.2019
Last edited: 13.05.2019