Infrastructure de production, diffusion et appropriation des contenus en SHS
Marcello Vitali-Rosati
Vincent Larivière

Constat

Les chercheurs en Sciences Humaines et Sociales sont plus que jamais en demande de solutions qui leur permettent d’adapter leurs pratiques de production, diffusion et appropriation des contenus de recherche à l’époque du numérique. Les canaux de production et diffusion qui se sont institutionnalisés depuis trois siècles pour ces domaines disciplinaires sont l’article de revue et la monographie. Or ces deux solutions, qui restent au centre des la recherche, ne sont plus suffisantes, toutes seules, à répondre aux besoins des chercheurs. Les outils numériques offrent des possibilités d’organisation des contenus (organisation non linéaire, multimédia, indexation fine, balisage sémantique), d’accessibilité (plus rapide, internationale, à moindre coût) et d’appropriation (restructuration des contenus, analyse de grands corpus, création de collections) auxquelles il est impossible de renoncer.

Les chercheurs en SHS sont pleinement conscients de ces possibilités et leurs pratiques ont désormais évolué dans cette direction. Cependant il n’y a au Canada aucune infrastructure qui leur permette d’avoir une offre adéquate à leur demande. En France ce besoin est partiellement pris en compte par la Très Grande Infrastructure Huma-Num. Au Canada, si une infrastructure comme Érudit peut répondre au besoin de diffusion et accessibilité des articles de revues, il n’y a, à l’état actuel, aucune infrastrcture pouvant proposer une gamme de services qui prenne en compte la totalités des besoins de production et d’appropriation des contenus de recherche.

Il est impératif et urgent pour le Canada de développer une telle infrastructure.

Description de l’infrastructure

L’infrastructure se basera sur le succès de la Cyberinfrastructure COSHS dirigée par Vincent Larivière et développera certains aspets ebauché dans ce premier projet.

Nous entenons développer:

  1. Des outils et des plateformes de production et organisation de contenus de recherche en SHS
  2. Des outils de diffusion et circulation
  3. Des outils d’appropriation

Voici le détail des trois volets:

  1. Production.
    • Il s’agit d’abord de mettre en place de chaînes de production qui permettent ensuite des sorties multiples. Un document structuré par un chercheur ou une équipe doit pouvoir avoir plusieurs sorties: une imprimée - destinée à un éditeur traditionnel, par exemple - une pour diffusion en formats homothétique numérique - pdf epub etc. - et plusieurs destinées à différents environnements numériques - HTML structuré, XML etc. Cela permettra d’avoir un seul travail de structuration du document et de profiter ensuite de toute la complexité des contenus. Le balisage sémantique des contenus devient fondamental à ce titre. Un document balisé sémantiquement peut ensuite être structuré automatiquement de plusieurs manières en permettant une diffusion simultanée dans plusieurs canaux ainsi qu’une meilleure exploitation des informations contenues dans le document
    • Il s’agit ensuite de mettre en place des plateformes prêtes à l’emploi. Les chercheurs auront ainsi des solutions faciles à utiliser qui leur permettent de publier et ensuite utiliser leurs contenus. Ces plateformes doivent être de trois types:
      • Plateformes dédiées aux formes courtes (type articles). La demande pour la création de sites de revue adaptés aux besoins particuliers de chaque publication est en hausse et les chercheurs manquent de solution à ce problème. Il n’est pas envisageable d’avoir une solution unique, car les besoins sont très hétérogènes. Notre infrastructure mettra à disposition plusieurs solutions différentes pour couvrir l’ensemble des besoins possibles.
      • Plateformes dédiées aux formats longs (type monographie). Les publications papier ne suffisant pas à répondre à tous les besoins, nous allons mettre à dispositions des plateformes permettant la publication de monographies augmentées (avec des contenus complémentaires, vidéos annotés, images, données structurées) et d’édition critiques.
  2. Diffusion. Notre infrastructure permettra aux chercheurs de publier des contenus structurés, immédiatement accessibles pour l’ensemble de la communauté scientifique. Cette accessibilité sera garantie par deux facteurs.
    1. L’accès libre. Notre infrastructure vise à proposer des solutions gratuites et fortement adaptées aux besoins des chercheurs. Cela permettra abattre considérablement les prix de production et consentira donc une publication en accès libre dès le début.
    2. La structuration des contenus. Le balisage permettra une indexation fine et un excellent référencement, ce qui implique une majeure visibilité des contenus qui seront très faciles à trouver.
  3. Appropriation. Notre infrastructure proposera une série d’outils pour les chercheurs qui utiliseront les contenus. En particulier nous allons développer des outils d’annotation, de collecte et de réorganisation des contenus. Les chercheurs sont de plus en plus désorientés devant la masse des données disponible dans les environnements numériques. Un des principaux besoins pour rendre possible une recherche de qualité est la possibilité de créer des collections de contenus pertinents - articles, fragments d’articles, données, monographies, références, annotations etc. - et de pouvoir les organiser selon les besoins spécifiques des recherches en cours. Les outils d’annotations et de collecte d’informations et de documents seront un véritable atout de notre infrastructure.

Chercheurs impliqués

Porteurs du projets:

D’autres chercheurs potentiellement impliqués:

Partenaires

Le partenaire principal sera Érudit. En effet, cette infrastructure nécessite d’être pilotée et maintenue par une institution déjà active dans le domaine de la diffusion des contenus scientifiques, et qui puisse assurer la pérennité et la stabilité d’un tel projet.

D’autres partenaires possibles:

Réalisabilité

Ce projet doit être compris dans la continuité de plusieurs travaux de recherche et projets financés. En particulier:

Budget

La quasi-totalité du budget sera destinée au développement informatique.

Un budget prévisionnel prévoit:

Fonction Salaire annuel Salaire + avantages sociaux (27%) ETP Année Coût
Chef de projet 85 000 $ 107 950 $ 1,5 7 1 133 475 $
Architecte- systèmes d’information 75 000 $ 95 250 $ 1 7 666 750 $
Architecte - données 75 000 $ 95 250 $ 2 7 1 333 500 $
Administrateur de système 75 000 $ 95 250 $ 1 7 666 750 $
Développeur backend 65 000 $ 82 550 $ 3 7 1 733 550 $
Développeur frontend 65 000 $ 82 550 $ 3 7 1 733 550 $
Analyste en gestion de l’information 60 000 $ 76 200 $ 2 7 1 066 800 $
Graphiste 55 000 $ 69 850 $ 1 5 349 250 $
Rédacteur 55 000 $ 69 850 $ 1 7 488 950 $
Matériel informatique 200 000 $ 1 200 000 $
610 000 $ 774 700 $ 15,5 9 172 575 $

Coût total estimé: 9.172.575 $