Digicoord

Constatant, suite à une enquête menée en 2006, un manque de coordination des projets de numérisation menés dans les bibliothèques suisses, la BNS a créé en collaboration avec RERO le portail Digicoord, plateforme d’information sur les projets de numérisation suisses, qu'ils soient au stade d'une intention, en cours ou réalisés.
On y trouve les descriptions des projets, mais aussi des best practices et des références d'outils et prestataires de services.
Seuls les initiatives des bibliothèques y sont recensées actuellement, mais une responsable de la BNS m'a indiqué en aparté qu'il n'était pas exclu d'étendre ce portail à d'autres institutions culturelles. Comme un tel portail n'existe pas aujourd'hui pour les archives suisses, pourquoi l'AAS ne se profiterait-elle pas de collaborer avec celui-ci?

Helveticarchives

Helveticat, le catalogue de la BNS, ne référence pas l'intégralité des fonds conservés par l'institution. D'autres instruments de recherche existent, comme les inventaires des Archives littéraires suisses.
Actuellement, la BNS met la touche finale à une nouvelle base, Helveticarchives, qui recensera, vous vous en doutez, ses fonds d'archives. Cette base, encodée en EAD, devrait être disponible en ligne avant le début de l'été.

La numérisation du Journal de Genève

Une enquête menée en 2007 auprès des usagers de la BNS a établi que la presse devait être la cible prioritaire des programmes de numérisation. Ca tombe bien: la BNS a entrepris la numérisation de l'intégralité du Journal de Genève (édité de 1826 à 1998), en partenariat avec la Bibliothèque de Genève et le Temps[1].
La numérisation devrait être achevée cet été, et la collection devrait être accessible gratuitement en ligne.

Quelques caractéristiques du projet:

  • 600'000 pages, 30 mètres linéaires
  • les volumes numérisés ont été sélectionnés dans les trois collections disponibles (BNS, BdG, Le Temps) pour disposer de la meilleure source possible
  • la numérisation est effectuée en niveaux de gris, avec une résolution de 300 dpi, sans interpolation
  • produits de la numérisation: des fichiers TIFF (6.0, monopage, non compressé), PDF et TXT (résultant d'un OCR réalisé à la volée); 13 To de données brutes
  • résultats de l'OCR affiné, avec structuration des pages: fichiers XML, 6 To de données
  • usage du schéma METS ALTO
  • le logiciel d'accès aux données retenu est produit par Olive Software

Sur le même modèle, la BNS développe d'autres projets de numérisation de la presse suisse en partenariat public-privé: la Gazette de Lausanne, l'Express, l'Impartial et les Schaffhauser Nachrichten.

Notes

[1] Issu de la fusion du Journal de Genève et Gazette de Lausanne et du Nouveau Quotidien.