Émilien a lancé cet été une réflexion sur la gestion de la documentation, en partant de sa situation de fin de thèse et spécifiquement d’un incident qui l’amenait à revoir ses pratiques de sauvegarde. J’aimerais revenir sur ces questions – dans un premier billet avec quelques possibilités informatiques existantes pour gérer l’information nécessaires à la rédaction d’un travail conséquent de recherche, puis dans un deuxième où j’ouvrirai en quelque sorte les placards pour montrer mes choix personnels pour ma thèse.
La documentation – quels types de document, quels formats ?
Quand on parle de documentation pour une thèse, et ici spécifiquement en histoire, cela comprend une multitude de documents divers dans beaucoup de formats différents :
Les archives génèrent de la documentation de travail, que ce soit sous la forme de photos prises directement aux archives (nous en avons déjà parlé) ou téléchargées à partir d’archives numériques, de photocopies faites sur place, de transcriptions sur papier ou sur ordinateur ou de notes de lecture.
La lecture de travaux secondaires fait de même : exemplaires physiques et/ou numériques de livres et articles, listes de réferences bibliographiques, notes de lecture, citations extraites d’ouvrages
Au cours du travail on accumule les ecrits : brouillons d’idées, textes exploratoires discutés avec le directeur, papiers présentés en colloque (éventuellement accompagnés de diapositives), articles pour publication
Métaphores et choix
Il existe différents logiciels et stratégies pour gérer ce type de documentation abondante (il existe même un laboratoire qui les étudie). Pour simplifier et en même temps reprendre un débat vif dans les blogs sur la question, nous allons les regrouper en deux grands groupes.
Les premiers sont ce que l’on appelle en anglais des « everything buckets », des « seaux-fourre-tout », si on veut: Il s’agit de logiciels conçus pour capter des informations venus de différents horizons et dans des formats différent (fichier text, pdf, image, vidéo, son…) pour les regrouper, sans se préoccuper beaucoup du classement. Les interfaces se ressemblent. Dans les grands noms dans le domaine, vous pouvez croiser Evernote, voici la présentation du logiciel sous forme vidéo :
D’autres outils fonctionnant sur un principe similaire sont DevonThink et Yojimbo (tous deux OS Mac uniquement) ainsi que Microsoft OneNote (Windows et iOS).
L’autre groupe concerne d’avantage des stratégies de gestion que des logiciels. Pour dire vite, ils s’appuient sur la structure du système d’opération pour classer et organiser les différents éléments de documentation. C’est ce que vous faites si vous prenez des notes d’archives dans un traitement de texte par carton ou dossier pour ensuite les classer dans des dossiers par fonds d’archive, par exemple. Ensuite, il faut utiliser les capacités d’indexation du système d’exploitation pour retrouver les documents (ce qui marche beaucoup mieux sous MacOS avec Spotlight qu’ailleurs).
On serait tenté de dire que le choix entre l’une ou l’autre des méthodes relève de la préférence personnelle, mais il est néanmoins utile de connaître les débats vifs qui opposent les défenseurs. Tout a commencé avec un billet d’Alex Payne, à ce moment-là dans l’équipe de développement de Twitter, ou il explique pourquoi il déconseille fortement l’usage des « everything buckets ». Pour lui, le gain de temps au moment de l’enregistrement est un facteur de risque pour plusieurs raisons : les données sont peu structurées et donc peu exploitables après, il y a un risque de perte de l’information en cas de corruption de la base du logiciel, et surtout cela amène à utiliser pour tout un logiciel peu adapté alors qu’il existe des logiciels spécialisés qui accomplissent mieux les tâches individuelles. Adam Pash the Lifehacker a suivi cette ligne argumentaire dans un billet exposant son aversion pour les « everything buckets » (lisez aussi les commentaires – en cliquant sur « all » pour tous les voir, illustrant bien la diversité des usages possibles).
Le contre-argument a été pris par David Karger dans un long billet très intéressant, que je vous conseille de lire en entier parce qu’il renvoie aussi vers beaucoup d’autres logiciels, en expliquant les nuances le leur fonctionnement. Pour lui les « everything buckets » sont inévitables, il s’agit de les rendre vraiment opérant pour les besoins des utilisateurs.
Vous noterez que les auteurs des billets cités ne sont pas chercheurs en SHS, ce qui nuance leurs besoins par rapport aux nôtres. Cela concerne en particulier la bibliographie pour lequel il faudrait de toute façon un logiciel spécialisé, même si on utilise un « everything bucket » (à moins, bien sûr de considérer son logiciel de bibliographie comme un « everything bucket » structuré, mais je vous en parlerai plus en détail la semaine prochaine en expliquant comment je travaille.
L’exemple du Zettelkasten
J’ajoute un dernier élément parce qu’il me fascine et que je compte en reparler la semaine prochaine en exposant mes méthodes de travail. Le classement de la documentation a bien sûr existé avant les outils informatiques. Le sociologue allemand Nikolas Luhmann (1927-1998) a développé une méthode qui lui est propre, en utilisant de façon extensive des fiches en papier. La meilleure description que j’ai pu trouver en anglais se trouve ici, mais si cela vous intéresse et que vous lisez l’allemand, je vous encourage à lire le chapitre ou Luhmann lui-même explique son système : Luhmann Niklas, « Kommunikation mit Zettelkästen: Ein Erfahrungsbericht », in André Kieserling (éd.), Universität als Milieu, Bielefeld, Haux, 1992, pp. 53-61.
Luhmann notait toutes les idées qui lui venaient de ses lectures ou d’ailleurs et il les reliait aux notes préexistantes par un système de numérotation extensible et sous-divisible à l’infini. Ils ne prenait pas des notes pour un projet spécifique, mais alimentait en quelque sorte en permanence sa base, le « Zettelkasten ». Dans l’analyse citée ci-dessus il explique qu’il se faisait souvent surprendre par les liens entre idées qui deviennent apparents par son système de classement et lui inspirent de nouveaux travaux. Pour Luhmann, sa « boîte à fiches » est son « Zweitgedächtnis », une sorte de cerveau secondaire ou deuxième cerveau qui fait apparaître ses idées sous d’autres angles. Après la mort de Luhmann un long combat a commencé entre les ayant-droit et les chercheurs intéressés par ce fond énorme que représente la « boite à fiches ». Il est aujourd’hui résolu et des chercheurs essaient maintenant de comprendre et exploiter cet objet insolite.
Voici une vidéo où Luhmann lui-même explique le fonctionnement de son « Zettelkasten »:
Merci Franziska! J’ai regardé la vidéo sur Luhmann et son Zettelkasten, cela me parait vraiment fou! Quel travail, et comment s’y retrouver? J’ai hate de lire la suite…