Comment retrouver la dimension visuelle à partir de fragments ?

Introduction

Les stock images sont partout et depuis le “archival turn” (Leeuw 2012), les archives audiovisuelles sont massivement réutilisées par les médias numériques. La circulation de ces séquences contribue à la constitution de mémoires visuelles collectives. Retracer et comprendre la circulation du patrimoine audiovisuel qui raconte la construction de l’Union européenne sur les médias français et italiens est l’objectif du projet Crossing Borders Archives (CROBORA)¹. Afin de définir une cartographie de la mémoire visuelle européenne, CROBORA entend donc savoir quelles images du passé sont médiatisées pour parler de l’intégration européenne. Or la collecte de données, sous forme de séquences audiovisuelles, est dépendante de la recherche textuelle dans le dépôt légal de la télévision française et italienne. Si les objets audiovisuels sont au cœur de notre projet, la documentation qui les accompagne est omniprésente, des notices produites par les documentalistes de l’Institut national de l’audiovisuel (INA) et des archives de la Radiotelevisione Italiana (RAI), à l’indexation créée au sein de l’équipe CROBORA. Dans cet article, nous présenterons ce que l’on peut définir comme des pratiques d’écriture collective, en précisant plusieurs étapes qui constituent la réappropriation d’objets numériques à partir d’une documentation institutionnelle. En nous appuyant sur la notion de fragment, l’écriture du projet CROBORA a pour objectif de faire émerger des éléments visuels à partir d’une médiation faite par la documentation originaire (les métadonnées des archives source).

Plus précisément, cet article va se développer en cinq sections : 1) Une définition des objets numériques constituant notre corpus : les archives audiovisuelles ; 2) Les types de données collectées ; 3) Une présentation de la documentation de l’INA, en comparaison avec celle de la Rai ; 4) La nécessité d’une nouvelle médiation documentaire et 5) Une présentation détaillée de la redocumentarisation de CROBORA.

Périmètre du corpus

En France, l’expression « image d’archives » est définie par l’arrêté du 24 janvier 1983 comme l’équivalent de l’anglais stock shot. Il s’agit d’« images d’actualité de cinéma ou de télévision empruntées à des documents d’archives et insérées dans une œuvre postérieure de reportage ou de fiction ». Le terme est ensuite maintenu sans modification dans le « Répertoire terminologique » publié au Journal officiel du 22 septembre 2000 et dans les éditions successives par la Commission générale de terminologie du vocabulaire de l’audiovisuel et de la communication, en 2006 et 2010 (Marcilloux, Maeck, et Steinle 2016, 53‑64).

C’est à partir de ce terme « image d’archives » que nous nous sommes engagés dans la collecte de données. Pour délimiter notre périmètre de recherche, nous nous sommes concentrés sur le genre des JT, de 2001 à 2021, sur cinq chaînes nationales : TF1, France 2, et ARTE en France et Rai Uno, Rai Due en Italie². Les requêtes de recherche étaient basées sur les mots « archiv » et « europ » en France et « repertorio » et « europ* » en Italie : nous avons ainsi voulu rassembler la plupart des images d’archives réutilisées dans des discours d’actualité concernant l’UE. Au sein des institutions/services archivistiques, les notices documentaires des JT, à l’INA en France comme à Rai Teche en Italie, sont les plus détaillées par rapport aux notices des autres émissions télévisuelles. En fait, l’observation du nombre de notices d’un programme est le premier indicateur de sa place d’importance dans les fonds. Si chaque reportage a sa propre notice, c’est qu’il s’agit du genre le plus réutilisé. « Il l’est autant par lui-même que par d’autres programmes ayant besoin d’images d’actualités » (Carnel 2012, 95‑96). Le choix des actualités constitue un biais important de la recherche. Cependant on peut supposer que les images qui circulent dans les actualités sont parmi les plus réutilisées et les plus fréquentes, l’idée étant de cartographier ce qui constitue des souvenirs visuels collectifs - et donc très répandus - de l’Europe. Jusqu’à présent ont été collectées environ 20 000 images d’archives provenant d’environ 6 000 sujets de JT en France et en Italie.

Le pourcentage de reportages contenant des images d’archives dans l’ensemble de reportages sur l’UE de la période 2001-2020 sur les chaînes TF1, France 2 et ARTE

Pendant la collecte de données, nous avons constaté une présence en augmentation des images d’archives au sein des JT. Par exemple, en dessus, il s’agit de l’occupation des images d’archives dans les JT français de la période de 2001 à 2020. Pour l’année 2018, le pourcentage a même atteint 42,50%. Pour les années 2009, 2010 et 2011, il faudrait un examen plus profond sur le pourcentage d’images d’archives qui est en bas. Une hypothèse pourrait être que le principal événement en Europe, la crise de la dette dans la zone euro, a été représenté par une immense majorité d’images graphiques ainsi que d’images actuelles abondantes comme les interviews, les réunions des chefs d’État européens incessantes ou les manifestations du peuple dans la rue.

Le nombre de reportages sur l’UE contenant des images d’archives de la période 2001 - 2020 sur les chaînes Rai 1 et Rai 2

Pour le terrain italien, le nombre de reportages contenant des images d’archives restait relativement stable durant ces 20 dernières années. Depuis l’année 2017, l’utilisation d’images d’archives dans les JT a connu un même essor sur les deux chaînes publiques jusqu’à la dernière année de notre collecte.

En général, l’utilisation d’images d’archives a connu une croissance pendant les 20 dernières années. Ce n’est pas parce que l’on parle de l’actualité dans les JT que les images actuelles seront convoquées automatiquement. Au contraire, avec le développement des technologies numériques, en considération des coûts, de l’efficacité, et de toute autre question liée à la production, les journalistes ont tendance à réutiliser les images d’archives en tant que sources visuelles pour illustrer leurs propos, que ce soit pour évoquer un événement historique (la chute du mur de Berlin), ou illustrer une situation actuelle (les euros en production pour signifier la situation économique), ou encore, indiquer un événement à venir (un sommet européen pour la semaine prochaine). Ainsi, nous considérons les images d’archives comme un élément critique pour analyser les représentations de l’intégration européenne, ces images qui jouent un rôle essentiel dans la construction non seulement de l’histoire, mais aussi du présent et du futur de l’Europe.

Dans la section suivante, nous détaillerons les types de données que nous avons collectées dans cette première étape.

Types de données collectées

Le corpus est constitué de différents types de données et de métadonnées associées, énumérées ci-dessous.

Vidéos

Les artefacts audiovisuels constituent l’axe de recherche de notre projet. L’un des principaux défis de la recherche est de savoir comment extraire les images d’archives à partir des sujets de JT sachant que les institutions documentent un sujet dans son intégralité et non les images qui y sont réutilisées.

Métadonnées originales des vidéos

Les métadonnées originales sont les éléments documentaires accompagnant les vidéos que nous avons collectées, plus spécifiquement, les notices produites par les documentalistes de l’INA et de la RAI. Le processus par lequel les métadonnées sont initialement saisies par les institutions qui gèrent les collections impose des catégories culturelles aux données elles-mêmes. En outre, en tant que forme importante de documentation des artefacts numériques/numérisés, ces métadonnées constituent des éléments d’analyse textuelle dans le but de comprendre le contexte et la signification des objets audiovisuels collectés. Le langage écrit fournit un outil puissant pour l’analyse des corpus visuels. Des méthodes statistiques telles que la fréquence des termes ou leurs cooccurrences peuvent être ainsi utilisées (Arnold et Tilton 2019, 3). De la sorte, les métadonnées ne seront plus seulement des documents ayant une valeur dépendante des sujets de JT qu’elles décrivent, mais elles deviendront des documents singuliers à part entière (Bachimont 1998, 17).

Documentation CROBORA des images d’archives

Les métadonnées produites par les différentes institutions archivistiques se manifestent hétérogènes. Du côté de l’INA, le contenu précis d’un stock shot - une image d’archives - réutilisée dans un sujet de JT, n’est pas forcément évoqué. De la part de Rai Teche, la dimension visuelle des images d’archives est documentée d’une manière détaillée, mais arbitraire. C’est-à-dire que les documentalistes décrivent souvent le contenu visuel en utilisant de petites phrases subjectives, non systématiquement. Une comparaison plus détaillée entre la documentation des deux institutions sera présentée dans la section suivante. Ainsi nous avons, au cours du projet, documenté soigneusement chaque image d’archives pour combler la description sur la dimension visuelle d’une manière standardisée et structurée. Deux procédés documentaires ont été pris en compte : une documentation écrite et une documentation visuelle (des captures d’écran). Nous avons pu constater que les images d’archives sont généralement utilisées pour montrer un événement, une/des célébrité(s) politique(s) ou un lieu. Ces trois éléments constituent donc les typologies qui structurent les métadonnées CROBORA : événement, personnalité, et lieu. Une quatrième catégorie permet d’identifier les éléments illustratifs souvent manifestés à travers des incrustations d’archives (un bombardement de la Seconde Guerre mondiale, des pièces d’Euro, une manifestation, etc.).

Captures d’écran de chaque image d’archives

Le deuxième élément documentaire utilisé pour décrire les images d’archives est une capture d’écran qui a été prise pour chacune d’entre elles. Ces captures d’écran agissent comme des signes, des indices qui renvoient à l’intégralité de la séquence vidéo d’archives incrustée dans le sujet de JT. Les captures d’écran sont un substitut manipulable par lequel nous opérationnalisons la tâche de travailler avec des séquences vidéo (Moretti 2013). Comme l’écrit également Lev Manovich (Manovich 2020, 215), pour visualiser une collection de vidéos, il est généralement plus pratique de sélectionner quelques images qui capturent les propriétés et les modèles de chaque vidéo et de travailler avec elles. Dans notre cas, cette sélection a été faite manuellement en s’adaptant aux spécificités du contenu et du contexte : une image claire et représentative pour chaque séquence d’archives.

Les documentations de l’INA et de Rai Teche comparées

Pour notre projet, un examen des pratiques et des normes professionnelles des documentalistes des institutions patrimoniales qui effectuent la documentarisation des archives audiovisuelles a été considéré comme indispensable. Tout comme d’autres spécialistes de la collecte et de la conservation, les documentalistes audiovisuels exercent une forme particulière de pouvoir sur la survie, l’accessibilité et l’interprétation de la mémoire culturelle (Edmondson 2004, 8). En effet, les pratiques professionnelles constituent un facteur important au cours de la consultation, la réutilisation et la circulation des images d’archives. Par exemple, un accès facile à certaines images pourrait faciliter la réutilisation de ces images par les journalistes, tandis qu’un droit d’auteur strict pourrait limiter les occurrences de certaines images sur les médias. Ainsi, ce processus lié aux pratiques des professionnels contribue largement à la construction des patrimoines et des mémoires.

Pour l’INA, chaque reportage de JT est documenté. Chaque sujet est lié à une notice documentaire unique. En général, l’INA utilise les champs suivants pour l’indexation : un identifiant de notice, un titre propre, le titre du programme, la chaîne de diffusion, la date de diffusion, l’heure de diffusion, la durée, la thématique, le genre d’émission, des descripteurs, un chapeau (c’est-à-dire un résumé par les documentalistes), la date d’enregistrement et ainsi de suite.

Comme le dit Pierre Bourdieu (Bourdieu 1996, 17), à la télévision, le monde des images est régi par des mots. Au niveau du monde des métadonnées des images, nous avons fait le même constat. En effet, ce ne sont pas les images qui sont au cœur de la notice documentaire, mais plutôt les propos des journalistes qui ont été indexés par les documentalistes à l’INA. Cela signifie que l’indexation d’un sujet ne correspond pas à chaque plan/séquence, mais à une sorte d’abstraction de ce qu’a dit un journaliste durant ce sujet, la notice documentaire étant basée sur le discours du journaliste. En l’occurrence, la dimension visuelle d’un objet audiovisuel cède la place au verbal pendant l’indexation. Prenons l’exemple d’un sujet intitulé « La charte des droits fondamentaux » sur TF1 diffusé à 20 heures le 08/05/2005 (ID Notice : 2828705.001.014), dont les descripteurs ainsi que le chapeau sont les suivants :

L’extrait de la notice documentaire du sujet 2828705.001.014 dans le dépôt légal de l’INA³

Ici, nous pouvons constater que ces deux champs qui sont censés décrire le contenu du sujet racontent le discours en voix off du journaliste. Concernant les images, les termes « images d’archives, factuelles et d’illustration » indiquent l’utilisation des séquences audiovisuelles de différentes natures, sans préciser en revanche les éléments visuels présents. Sachant que notre recherche consiste à étudier les représentations visuelles des séquences d’archives, le fait que cette matière ne soit pas explicitée par l’écriture documentaire constitue un défi majeur.

Du côté de Rai Teche, l’écriture documentaire est différente. En effet, Rai Teche documente le contenu à partir de deux dimensions séparément : la voix off et les images. Contrairement à l’INA, les images d’archives incrustées dans un reportage sont décrites visuellement d’une manière détaillée. Par exemple, dans la notice documentaire pour un reportage intitulé « Tempi celeri per approvazione della legge stabilita » (Approbation accélérée de la loi sur la stabilité), diffusé sur Rai 2 le 09/11/2011, le documentaliste a décrit le contenu vidéo de la façon suivante :

Ministro economia tremonti cammina in interni, tiene audizione durante seduta commissione bilancio senato per illustrare maxi emendamento del governo alla legge stabilita contenente misure richieste dall unione europea per superamento della crisi economica. 2011, esterni interni palazzo montecitorio, seduta camera. Esterni palazzo madama. Repertorio, fasi conteggio manuale banconote. Interni ufficio, impiegati lavorano al computer. Sonoro speaker.

(Le ministre de l’économie Tremonti marche à l’intérieur, tient une audition lors de la séance de la commission du budget du sénat pour illustrer le maxi amendement du gouvernement à la loi de stabilité contenant les mesures demandées par l’Union Européenne pour surmonter la crise économique. 2011, extérieur intérieur palais montecitorio, session de la chambre. A l’extérieur du Palazzo Madama. Repertorio, phases de comptage manuel des billets. Intérieur de bureau, employés de bureau travaillant sur un ordinateur. Son du haut-parleur.)

Dans ce cas, à part un résumé de la voix off journalistique, les images d’archives (repertorio) réutilisées dans le reportage sont explicitement indiquées, avec une précision des éléments visuels à l’intérieur des images : phases de comptage manuel des billets. Intérieur de bureau, employés de bureau travaillant sur un ordinateur. Ici, la dimension visuelle constitue effectivement une partie nécessaire pour la documentation effectuée par les documentalistes à la RAI.

La raison de ces deux formes d’écriture différentes résiderait dans le fait que les deux organisations ont pris des positions différentes. L’INA adopte une posture que l’on peut appeler généalogique, selon la définition proposée par Bruno Bachimont (Bachimont 2007b, 22). L’enjeu de la production documentaire est la mise en valeur des ressources dans leur contexte original. La documentarisation se fait dans le but de rendre « la ressource réutilisée, consultée et reçue en connaissance de cause ». Or, du côté de Rai Teche, il s’agit d’une structure de la RAI qui s’occupe de la préservation et de la valorisation du matériel audiovisuel produit et diffusé par la société. À côté de sa posture généalogique, Rai Teche sert de département des archives de la RAI dans le but de proposer les images d’archives pour de nouveaux usages aux professionnels qui produisent de nouveaux programmes télévisuels sur les chaînes relevant du groupe RAI. En l’occurrence, une documentarisation de la dimension visuelle du contenu s’avère essentielle d’un point de vue pragmatique, car cette pratique facilite largement la recherche d’images pour les documentalistes. Par exemple, si un journaliste demande de toute urgence au service d’archives des images dans lesquelles on voit Berlaymont, le siège de la commission européenne, avoir une documentation des éléments figuratifs est certainement plus efficace qu’un résumé général du contexte.

Ainsi, avec différents objectifs, les deux institutions publiques ont adopté leur propre position correspondant au mieux à leurs missions à réaliser. Pour ces deux positions, il y a des fonctions similaires, ce qui conduit à des pratiques similaires pendant l’écriture : quelques mots-clés, ainsi qu’un résumé général pour l’ensemble de reportage en respectant la voix off originale. Dans le même temps, différentes pratiques professionnelles sont également introduites durant ce processus : une perspective différente au niveau de la dimension visuelle du contenu audiovisuel.

Une nouvelle écriture CROBORA

Si l’écriture institutionnelle documente les matériaux audiovisuels différemment en suivant leurs usages spécifiques à une étape ultérieure, notre but est d’établir une forme de redocumentarisation (Pédauque 2007) qui se concentre sur la dimension visuelle de ces matériaux. Le document est « un objet d’appropriation et de transformations constantes » (Pédauque 2006, 15). Le défi du projet manifeste une posture et des intentions différentes de celles des institutions. Les ressources doivent donc être appropriées d’une autre manière. Étant donné que notre objectif est de retrouver les séquences audiovisuelles qui ont maintes fois circulé sur les médias, il s’agit d’identifier ces images dans chaque sujet de JT et les documenter. Cette question apparemment triviale pourrait s’apparenter à première vue à la simple nécessité d’une documentation accrue, qui décrit chaque image d’un document, alors que pour d’évidentes exigences de temps et d’efficacité, l’institution comme l’INA ne prend en compte qu’un résumé général. Nous avons pu démontrer que la textualisation des documents audiovisuels se concentre largement sur la partie verbale, la voix off du journaliste.

Comment faire émerger la dimension visuelle et récupérer ainsi les images d’archive réutilisées dans les JT ? La réponse réside dans un processus que l’on pourrait appeler un processus de fragmentation. Le domaine de l’audiovisuel est historiquement un domaine de la fragmentation : les coûts de production étant élevés, la réutilisation de fragments est un moyen efficace pour valoriser des images existantes. Il s’agit pour les productions audiovisuelles de produire du nouveau à partir d’éléments préexistants. Graduellement, en utilisant les outils de gestion audiovisuelle, on peut non seulement trouver du contenu et le visionner dans son intégralité, mais aussi sélectionner des parties pour y avoir recours pour de nouvelles productions.

Dans notre cas, nous tentons de valoriser les archives audiovisuelles à travers la découverte des structures cachées par une masse de petits éléments. Il s’agit de rendre visibles certains traits liés à l’ensemble du corpus (fréquence, répétition, redondance, etc.) (Compagno et Treleani 2019, 8). Nous devons dès lors établir une écriture qui consiste à mettre en valeur les fragments visuels qui portent une valeur significative mais qui sont cachés dans leur contexte original.

Document CROBORA en action : la redécouverte de la dimension visuelle à partir de fragments

L’opération de redocumentarisation au sein du projet CROBORA comporte plusieurs étapes :

Une déconstruction des données originales : découpage et sélection de segments pertinents qui serviront à de nouveaux usages

Que ce soit dans un fichier vidéo ou dans une notice documentaire, les images d’archives que nous essayons de chercher sont prises en compte comme un composant qui fait partie de l’ensemble d’un sujet. Le premier travail consiste donc à identifier ces images d’archives incrustées dans chaque reportage, et ensuite, à prendre une capture d’écran pour chaque image d’archives. Un identifiant unique est attribué à chacune des séquences extraites. Ainsi, pour retrouver une image d’archives dans le corpus CROBORA ou se référer à une séquence spécifique auprès des autres membres du projet, il suffit d’en saisir son identifiant. « L’identifiant détient un pouvoir opérationnel sur l’objet, de telle façon qu’il devient lui-même l’objet » (Vitali-Rosati 2016, 15). C’est à l’aide de ce pouvoir opérationnel que nous avons réussi à fragmenter les sujets et séparer les séquences de leur contexte original. Toutes les images d’archives extraites sont ensuite stockées dans un espace partagé. Il s’agit d’une première étape durant le processus de redocumentarisation, où nous avons sélectionné des images audiovisuelles spécifiques pour les rendre ensuite en documents numériques d’une manière séparée. Une image d’archives a été initialement considérée par l’institution comme du contenu faisant partie intégrante d’un sujet de reportage, au lieu d’un document en tant que tel.

Les captures d’écran des séquences d’archives collectées sur TF1

Une transcription des fragments : réindexation

La réindexation constitue le travail principal du projet CROBORA pendant la collecte de données, considérant qu’un fragment d’image d’archives n’a pas de sens sans être connecté aux autres fragments. En d’autres termes, il ne suffit pas d’extraire une image spécifique et la mettre dans un même espace avec d’autres images collectées. Une fois documentarisé dans un environnement numérique (attribution d’un identifiant unique, stockage dans un espace en ligne, etc.), un fragment aura besoin d’être « doté d’attributs spécifiques permettant sa liaison explicite » avec les autres fragments (Zacklad 2004, 22). Dans notre cas, cette liaison se réalise via une ré-indexation pour chaque image d’archives d’une manière sémantique, ce qui permettra une ré-exploitation des fragments dans le cadre d’une activité collective. Comme indiqué précédemment, nous avons choisi quatre aspects pour décrire les séquences d’archives : personnalité, événement, lieu et illustration. Cette opération est considérée comme une étape essentielle, car les futurs usages de ces fragments vont dépendre de cette nouvelle indexation des images. Si la première fonction de l’indexation consiste à associer à un document des descripteurs qui permettront de le retrouver (Pédauque 2007, 91), selon Bruno Bachimont (Bachimont 1992, 219), une indexation est également « la paraphrase d’un contenu en une forme sémiotique interprétable permettant de rendre exploitable le contenu indexé dans le cadre d’une pratique donnée, c’est-à-dire à des usages qui gouvernent l’exploitation qui doit être faite des documents indexés ». En effet, l’indexation est toujours liée à une pratique donnée. À part la facilitation d’une recherche ultérieure des images, afin de mener une analyse informatique d’un grand corpus numérisé d’éléments visuels, il est nécessaire de développer un code spécifique pour textualiser les éléments visuels. Une description des éléments constituant l’image doit être ajoutée comme une nouvelle couche de sens aux pixels bruts, car 1) La capture d’écran n’est pas capable de résumer toutes les informations d’une séquence qui se compose normalement de plusieurs plans et 2) L’ajout de nouvelles métadonnées aux images peut aider l’exploration du corpus (par clusterisation par exemple). Ces éléments textuels constituent ainsi une première médiation interprétative.

Nouvelle indexation des séquences d’archives collectées sur France 2

Pour démontrer notre nouvelle indexation sur les images d’archives collectées, nous pouvons prendre cette séquence comme exemple.

La capture d’écran de la séquence d’archives sur la descente de l’Union Jack devant la commission européenne dans le sujet « Brexit : l’Europe montre la sortie » (ID Notice : 5770037001013) — La capture d’écran de la séquence d’archives sur la descente de l’*Union Jack* devant la commission européenne dans le sujet « Brexit : l’Europe montre la sortie » (ID Notice : 5770037001013)

Il s’agit d’une séquence d’archives extraite depuis un reportage intitulé « Brexit : l’Europe montre la sortie » diffusé sur TF1 à 20 heures le 25/06/2016. Le sujet se focalise sur les négociations entre Jean-Claude Juncker et David Cameron sur la sortie de la Grande-Bretagne de l’Union européenne, dans lequel nous sommes parvenus à retrouver une image d’archives réutilisée – une scène montrant la descente de drapeau du Royaume-Uni. La personne chargée de la visualisation de la vidéo dans le dépôt légal de l’INA et de la collecte de cette image spécifique a dû entamer ensuite une nouvelle indexation dans les quatre champs « Personnalité », « Événement », « Lieu » et « Illustration » :

Le champ « Personnalité » porte à décrire les célébrités politiques qui font leur apparition dans une séquence collectée (Ex. Angela Merkel, Robert Schuman, Federica Mogherini, etc.). Dans ce cas précis, rien n’a été noté puisqu’il n’y avait pas de personnalités reconnaissables à nos yeux ;
Pour le champ « Lieu », on note l’endroit précis où la séquence a été filmée, si cela reste reconnaissable sur les images. Dans la plupart des cas, le nom d’une ville a été indiqué. Néanmoins, il existe également des situations où nous n’avons pas pu identifier la ville exacte. C’est là où le nom d’une région plus large a été noté (Ex. Bretagne, Mer Méditerranée, Europe, etc.). Pour notre exemple précédent, la ville est bien reconnaissable grâce à la représentation du bâtiment Berlaymont sur le fond qui sert d’indice pour qu’on puisse marquer « Bruxelles » en tant que lieu ;
Dans le champ « Illustration », quatre éléments restent à remplir, qui sont respectivement l’endroit, les acteurs humains, les acteurs non-humains/objets, et enfin, l’action. Tout d’abord, l’endroit réfère à une unité plus petite que la ville, qui pourrait être soit un nom propre (Ex. Parlement européen, Palais de l’Élysée, Airbus, etc.), soit un nom générique (Ex. Usine, Mer, Port, etc.). Ensuite, les acteurs humains indiquent les individus qui ne sont pas des personnalités politiques, en étant souvent un nom générique pour un groupe de personnes (Ex. Population, Travailleurs, Migrants, etc.). Au niveau des acteurs non-humains, il s’agit des objets représentés visuellement (Ex. Bâtiment, Drapeau, Fil barbelé). À la fin, l’action réfère à ce qui est en train de se passer dans la séquence audiovisuelle. Comme « Célébration », « Discours », « Réunion », etc. Ainsi, pour la séquence de Brexit, nous avons noté « Commission européenne » pour signifier l’endroit, « Agent » et « Caméraman » en tant qu’acteurs humains, « Drapeau européen » et « Union Jack » en tant qu’objets, et « Descente de drapeau » en tant qu’action ;
Si les trois dimensions précédentes sont plutôt liées aux caractéristiques iconiques dans une séquence, pour le champ « Événement », l’accent reste mis sur la voix off du journaliste. Effectivement, pour « Personnalité », « Lieu » et « Illustration », on a essayé de transcrire textuellement les figures présentes à l’image. En revanche, pour « Événement », il s’agit plutôt d’un indice pour le contexte dans lequel une séquence spécifique est incrustée. Ici, « Événement » pourrait être pris en compte comme thème ou sujet d’une image d’archives, car il n’y a pas toujours un événement précis pour une image utilisée dans un reportage (Ex. le drapeau européen qui flotte dans l’air), mais il y a toujours un thème/frame qui encadre cette image dans les JT. Dans ce cas-là, le thème d’une image se construit principalement par le discours journalistique, soit la voix off dans un reportage. Pour notre nouvelle écriture, les métadonnées associées à « Événement » sont considérées comme particulièrement importantes, cela consistant à rajouter une couche interprétative supplémentaire à la dimension visuelle. Dans le cas du Brexit ci-dessus, le descripteur « Brexit référendum » a été marqué par le chercheur, car il s’agit bien de cet événement mentionné par le journaliste quand il utilise la séquence. De cette manière, nous sommes parvenus à ré-indexer toutes les séquences d’archives collectées.

Le processus de codage de l’image en texte est à la fois réducteur et interprétatif. De nombreux éléments de l’image sont perdus dans la description et aucun mot ne pourrait jamais capturer pleinement l’intégralité de l’image originale. Cette différence est déjà reconnue comme « l’écart sémantique » dans le domaine de la recherche d’information (Arnold et Tilton 2019, 5). Si l’on reprend notre exemple, on se rend compte qu’il y a un nombre infini d’éléments visuels qui ne sont pas pris en compte dans l’indexation, comme la hampe, le sol, le barrage, etc. Il s’agira donc de sélectionner les éléments pertinents dans les objectifs de la recherche. Par ailleurs, puisqu’il y a plusieurs chercheurs impliqués dans ce processus de réindexation, la reconnaissance des indices dans l’image dépend de la culture de chacun. Enfin, repérer les indices nécessite également un œil habitué à les décrypter (Carnel 2012, 102‑3). D’après Michel Melot :

On peut consacrer un livre entier à la description d’une seule image et, si l’on ne sait pas ce que l’on cherche, l’opération sera vraisemblablement inutile. La description ou l’analyse de l’image n’ont donc de sens que dans la mesure où elles répondent à une recherche déterminée. (Collard, Giannattasio, et Melot 1995)

Ainsi, avant d’engager les participants dans ce processus, une formation ainsi que l’établissement d’une communication efficace entre les membres du projet est nécessaire. La documentation du projet devient ainsi véritablement collective.

Communication textuelle tout au long de la redocumentarisation : Workflow et Thésaurus

Un workflow a donc été établi afin d’encadrer les opérations étape par étape et proposer de bonnes pratiques. Dans le workflow, on a essayé de préciser les pratiques d’écriture d’une manière détaillée : les règles de nommage, l’organisation des dossiers, etc. La rédaction de ce document est dynamique et concerne tous les membres impliqués dans la collecte de données : les participants posent des questions dans la marge de la page quand une nouvelle situation émerge durant la collecte ; les autres membres répondent et peuvent également apporter des améliorations directement dans le fichier. Ici, il s’agit aussi des fragments, issus d’un processus d’annotation sur un fichier technique.

Le document de workflow avec des interactions entre les membres du projet

En revanche, le workflow se focalisant surtout sur des règles communes n’est pas suffisant pour encadrer la redocumentarisation de CROBORA d’une manière stricte. Afin de structurer au mieux des métadonnées héterogènes, la construction d’un thésaurus a été entamée. Un thésaurus est un vocabulaire contrôlé et structuré dont les concepts sont représentés par des étiquettes avec une structure hiérarchique de termes plus larges et plus étroits. Par exemple, le drapeau européen est un terme plus étroit qui appartient à un terme plus large : le drapeau. Le thésaurus joue un rôle important lors de l’indexation et la recherche vis-à-vis d’un document (Pédauque 2007, 134). Au niveau des institutions européennes, il existe EuroVoc⁴ géré par l’Office des publications de l’Union européenne, qui est un thésaurus multilingue et multidisciplinaire couvrant les activités de l’UE. En revanche, il ne s’agit pas d’un vocabulaire directement lié aux matières audiovisuelles. La construction d’un thésaurus CROBORA a pour objectif de contenir tous les descripteurs utilisés par les différents chercheurs du projet pour réindexer les séquences vidéo. Si un workflow est un travail à priori qui dessine les axes avant qu’on procède à la réindexation, la construction d’un thésaurus s’appuie sur une partie de la réindexation déjà réalisée par les membres. Comme le workflow, tous les membres du projet sont au courant du thésaurus en construction et doivent le renouveler tout au long de la collecte de données. Il y a trois colonnes en général : 1) le descripteur exact qu’on utilise, 2) les synonymes de ce descripteur spécifique et 3) la définition de ce descripteur. Des membres du projet qui connaissent au mieux l’écriture CROBORA doivent se charger de la validation finale de l’ajout d’un nouveau descripteur. Voici un exemple du vocabulaire contrôlé sur les événements indexés.

L’indexation des événements dans le document de thésaurus

Construction d’un nouveau contexte : réorganisation des fragments selon la nouvelle écriture

C’est en contexte que les fragments prennent sens (Pédauque 2007, 81). Sur la base des nouvelles métadonnées attribuées aux images d’archives collectées, une plateforme de visualisation est en train d’être construite, ce qui va nous permettre de visualiser des groupements selon différentes recombinaisons (Crozat 2012) de descripteurs. Par exemple, nous pourrons saisir les mots-clés “Changeover to the euro” et “Celebration” pour retrouver toutes les images d’archives indexées avec ces deux descripteurs dans le corpus CROBORA.

Un groupement composé d’images d’archives indexées avec les descripteurs “Changeover to the euro” et “Celebration”

De cette façon, de nouvelles dimensions sémantiques des données seront établies (Bachimont 2014, 73). Ces séquences audiovisuelles seront séparées de leur ancien contexte et de nouveaux liens entre ces fragments pourront être établis. Il s’agit dans ce cas d’un travail de décontextualisation des fragments audiovisuels afin de les faire interagir entre eux en dehors du contexte original. Cette plateforme de visualisation doit permettre la navigation et l’accès à l’ensemble de la collecte de documents hautement structurés et interreliés. Ces documents deviennent ainsi des données que l’on peut lire et voir d’une nouvelle perspective, indépendamment des documents originaux auxquels ils sont associés. Les fragments audiovisuels suite à ce processus de documentarisation deviennent ainsi des documents à part entière. Jusqu’à cette dernière étape, le processus de redocumentarisation se complète. Il s’agit d’établir un nouveau système de navigation et de classement permettant d’organiser les fragments de production audiovisuelle selon les usages (Zacklad 2004, 12) des chercheurs à venir au sein du projet CROBORA.

Conclusion

C’est à partir d’une série d’opérations de fragmentation que le projet CROBORA vise à retrouver les images d’archives réutilisées dans les médias pour raconter l’histoire de l’UE. Contrairement à la documentarisation des institutions patrimoniales, l’objectif du projet est la redocumentarisation des archives audiovisuelles dans une perspective visuelle, afin de faire émerger des formes visuelles constituant des représentations culturelles de personnalités, d’évènements, de lieux ou d’objets liés à la mémoire de l’UE.

Avec l’abondance et la vivacité des images médiatiques que nous rencontrons au cours de notre quotidien, nous reconnaissons la centralité des images dans les processus de création de sens, alors que nous continuons à nous émerveiller de leur prolifération et de leur omniprésence sans précédent (Aiello et Parry 2019). Pour le projet CROBORA, notre objectif est de déballer les affirmations généralisées et d’examiner comment les images communiquent à travers le temps dans différents espaces médiatiques par le biais des images d’archives. Pour ce faire, il nous faut tout simplement voir les images. Néanmoins, c’est durant le processus de traitement de données visuelles que nous avons réalisé que la documentarisation réalisée au sein des institutions qui gèrent les collections avait déjà imposé des catégories culturelles sur les artéfacts, que ce soit via l’écriture documentaire, l’organisation du classement des documents, la numérisation des archives, etc. Ces opérations constituent elles-mêmes le contexte des objets numériques d’étude, ce qui nous demande un regard profond sur les pratiques professionnelles effectuées par les documentalistes, et en particulier pour ce texte sur les notices documentaires. En parallèle, pour analyser un corpus visuel, il nous semble également indispensable d’écarter les catégories existantes construites par l’institution et de prendre des distances afin d’adopter une nouvelle perspective sur les données visuelles. Surtout avec l’essor des outils numériques et des algorithmes pour examiner un large corpus d’images, la dimension plastique des images pourrait être remise en avant. Par conséquent, une redocumentarisation servant à redécouvrir la dimension visuelle des images est considérée critique pour l’originalité du projet CROBORA, ce processus se complétant par une série d’opérations liées à l’extraction des fragments, la création de nouvelles métadonnées, la construction d’un workflow et d’un thésaurus, la décontextualisation-recontextualisation des fragments impliqués. L’ensemble de ces processus porte finalement à la création de nouveaux documents : les images d’archives, indépendantes de leur contexte, signifient ainsi dans le cadre d’un réseau de sens constitué par d’autres images du même type.

Aiello, Giorgia, et Katy Parry. 2019. Visual Communication: Understanding Images in Media Culture. First edition. Thousand Oaks, CA: SAGE Publications Ltd.

Arnold, Taylor, et Lauren Tilton. 2019. « Distant viewing: analyzing large visual corpora ». Digital Scholarship in the Humanities 34 (Supplement_1):i3‑16. https://doi.org/10.1093/llc/fqz013.

Bachimont, Bruno. 1992. Le contrôle dans les systèmes à base de connaissances - contribution à l’épistémologie de l’intelligence artificielle. 0 edition. Paris: HERMES SCIENCE.

Bachimont, Bruno. 1998. « Bibliothèques numériques audiovisuelles Des enjeux scientifiques et techniques », 23.

Bachimont, Bruno. 2007a. Ingénierie des connaissances et des contenus: le numérique entre ontologies et documents. Hermès Science Publ.

Bachimont, Bruno. 2007b. « Nouvelles tendances applicatives : de l’indexation à l’éditorialisation ». In L’indexation multimédia, Hermès. Paris.

Bachimont, Bruno. 2014. « Le nominalisme et la culture : questions posées par les enjeux du numérique ». In Digital Studies. Organologie des Savoirs et Technologie, 1st edition. Limoges: FYP.

Bourdieu, Pierre. 1996. Sur la télévision. Paris: RAISONS D AGIR.

Carnel, Jean-Stéphane. 2012. Utilisation des images d’archives dans l’Audiovisuel. Édité par Hermes Science. Systèmes d’information et organisations documentaires. Lavoisier. https://hal.archives-ouvertes.fr/hal-00979781.

Collard, Claude, Isabelle Giannattasio, et Michel Melot. 1995. Les images dans les bibliothèques. Cercle de la librairie.

Compagno, Dario, et Matteo Treleani. 2019. « Introduction to Meaningful data/Données signifiantes ». Semiotica 2019 (230):1‑17. https://doi.org/10.1515/sem-2018-0141.

Crozat, Stéphane. 2012. « Chaînes éditoriales et rééditorialisation de contenus numériques ». In Le document numérique à l’heure du web, édité par Lisette Calderan, Pascale Laurent, Hélène Lowinger, et Jacques Millet, 179‑220. Sciences et techniques de l’information. ADBS. https://hal.inria.fr/hal-00740268.

Edmondson, Ray. 2004. Philosophie et principes de l’archivistique audiovisuelle.

Leeuw, Sonja de. 2012. « European Television History Online: History and Challenges ». VIEW Journal of European Television History and Culture 1 (1):3‑11. https://doi.org/10.18146/2213-0969.2012.jethc002.

Manovich, Lev. 2020. Cultural Analytics. Cambridge, MA, USA: MIT Press.

Marcilloux, Patrice, Julie Maeck, et Matthias Steinle. 2016. « Images archivées, images d’archives : fortunes terminologiques ». In L’image d’archives. Une image en devenir, 53‑64. Archives, histoire et société. Presses universitaires de Rennes. https://hal.archives-ouvertes.fr/hal-01927530.

Moretti, Franco. 2013. « “Operationalizing” ». New Left Review, nᵒ 84 (décembre):103‑19.

Pédauque, Roger T. 2006. « Document et modernités », mars. https://archivesic.ccsd.cnrs.fr/sic_00001741.

Pédauque, Roger T. 2007. La redocumentarisation du monde. https://www.librairie-gallimard.com/livre/9782854287288-la-redocumentarisation-du-monde-roger-t-pedauque/.

Vitali-Rosati, Marcello. 2016. « Qu’est-ce que l’éditorialisation ? ». Sens public, mars. https://hal.archives-ouvertes.fr/hal-01599208.

Zacklad, Manuel. 2004. « Processus de documentarisation dans les Documents pour l’Action (DopA) : statut des annotations et technologies de la coopération associées (nouvelle version corrigée) », octobre.

Projet financé par l’Agence Nationale de la Recherche (2020-2024).↩︎
Le terrain de collecte du projet ANR CROBORA inclut également la chaîne privée italienne de Mediaset, Canale 5, et une sélection d’usagers des plateformes vidéos web en France et en Italie. Aux fins du présent article les données issues des terrains de l’INA et de la Rai étaient les seules complètes et exploitables d’un point de vue documentaire.↩︎
http://inatheque.ina.fr/doc/TV-RADIO/TV_2828705.001.014/la-charte-des-droits-fondamentaux?rang=53↩︎
https://op.europa.eu/en/web/eu-vocabularies↩︎