title	tags
crCRIHN2019-02-15	crihn, Jason Camlot, Tomasz Neugebauer, Jared Wiercinski, metadata, archives

Conf CRIHN 15 février 2019, SpokenWeb : Metadata Scheme and Cataloguing Process

Jason Camlot, Tomasz Neugebauer, Jared Wiercinski

SpokenWeb partenariat dirigé par Calmot, Jared bibliothécaire, Tomasz responsable des projets numériques à la bibliothèque de Concordia.

Présentation du programme de recherche puis se focaliseront plus particulièrement sur la gestion des métadonnées.

The SpokenWeb Research Program

https://spokenweb.ca

Les étudiants au cœur du développement des projets, 60% du projet va au financement d’étudiants qui sont impliqués à tous les degrés du projet. Par exemple le logo pour le projet. Toutes les réalisations envisagées comme une opportunité pour le travail avec les étudiants.

Projet qui a débuté avec boite d’enregistrement sur bandes comme objets matériels. Heures d’enregistrements nord-américains conservés des années 70 et 80.

Partenariat financement qui n’appartient pas directement au chercheur mais chercheurs qui sont en charge du fonctionnement.

Plusieurs établissements disposant d’enregistrements dans ses archives, mais inutilisables. Question de savoir comment rendre ces enregistrements utiles pour l’enseignement et la recherche. Implique d’écouter ces enregistrements et de faire une indexation temporelle avec des timestamps. Utilisation de logiciels pour faciliter la transcription. Initialement pensait définir un catalogue imprimé.

Fichier qui en réalité constituait des données et qui pouvait faire l’objet d’une présentation numérique. Parallèlement travail sur l’histoire de la récitation orale. D’abord financement pour un développement partenariat focalisé sur la récitation et utilisation de logiciels pour analyser la prosodie, par exemple Praat http://www.fon.hum.uva.nl/praat/ utilisé par des linguistes et développement de visualisations.

Au fur et à mesure du développement de ces projets, rejoint par diverses expertises dans le cadre de la recherche et identification de nouvelles collections (plus de 700 archives au Canada, le plus souvent pas numérisées ni documentées). Dès lors qu’un matériel patrimonial important construire un projet.

Numérisation qui introduit nouvelles questions sur les méthodologies à utiliser. Question du sens de la communauté en action à travers la lecture, etc. Comprendre ce que signifiait ces documents audios pour ceux qui avaient participé à leur production. Pour le faire, besoin de conduire mener une histoire orale pour déterminer le contexte de production de ces archives.

Outre les étudiants, parvenir à fonder historiquement le projet pour lui fournir du contexte. Ici que les métadonnées très importantes. Équipe qui associe importante équipe de libraires à des chercheurs en littératures.

Collections Fraser, UBC, Calgary, Alberta, Toronto, etc.

Cherche à développer un processus pour les nouveaux candidats. Première année du projet en cours. 25 étudiants à travers les institutions.

Structure de gestion

Governement board
Board
Team
Network

Plusieurs objectifs

inventorier et index les collections existantes au Canada. Préserver ces collections par la numérisation et agréger ces collections, définir un modèle de métadonnées
étudier les enregistrements littéraires à l’aide de théories et de méthodes de critique « audio-textuelle »
développer et évaluer des méthodes computationnelles pour l’analyse des enregistrements sonores littéraires
réer des modules en ligne et des expositions murales, et nouvelles œuvres d’art à partir de ces archives numérisée pour l’emploi en recherche et enseignement ou présentation au public

Méthodes

histoire de la performance littéraire et pratique enregistrement sonore
effect culturel circulation analogue versus digital (artefacts intéressants jouant sur enregistrement)
comment engagement avec enregistrements sonores peut avoir effet sur modifications des pratiques et méthodo disciplinaire en littérature.

introduire nouvelles approches méthodologiques.

Activities

Researchers pursue projects via collaborative Task forces. Ces équipes mobilisent 2 à 15 personnes chacune.

Plusieurs groupes mis sur pied la première année. Chaque Task force doit produire un document qui établit son identité, ses objectifs à court, moyen et long terme.

Immédiatement structuré Metadata Task Force pour structurer les métadonnées, une des plus importantes. Autres pour Systems, Rights Management, Analog/Digitazation, Audio Signal Analysis, Oral history, Podcasting, Pedagagogy, Research Création, Archival Events, Community Collections, RDM.

cf. https://en.wikipedia.org/wiki/Task_force

Pour les droits sur le site mention : "SpokenWeb is a SSHRC-funded partnership grant. All material that appears on this website is used for the purposes of academic research and critical study." https://spokenweb.ca

Methodology for the Scheme Development

Besoin de contextualiser enregistrement et favoriser le signalement.

Priorisation des métadonnées et de cette task force au cours du Litterary audio symposium 2015. Rapidement identifier que réalisation du partenariat reposait largement sur l’utilisation d’un modèle de données commun.

Principes :

utiliser notre propre modèle de données plutôt que de choisir un système d’accès. Développer notre propre système plutôt que Islandora, Avalon.
agile : rapidement disposer du modèle pour tests est essais pour des révisions basées sur le feedback
iterative : schema de métadonnées, processus de révision, ingestion itérative du system. Tous les changement devant pouvoir être effectués dans le système dès lors que décidés.
distribuée : créée avec les apports de tous les partenaires. Tous représentés dans le groupe
simplified standards : débuté avec des standards comme IASA, AACR2, MODS, Library of Congress pour faciliter interopérabilité LC genre, et simplification pour les rendre utiles par nos étudiants catalogueurs.
https://www.iasa-web.org cf. https://www.iasa-web.org/tc04/audio-preservation et https://www.iasa-web.org/tc04-fr/la-production-et-la-conservation-des-objets-audionumeriques
http://www.aacr2.org
http://www.loc.gov/standards/mods/
http://id.loc.gov/authorities/genreForms

Si avait dû travailler avec ces modèles de catalogage aurait dû travailler avec des professionnels, mais en pratique n’aurait pas pu parvenir à réaliser le projet en 7 ans. Donc, choix de travailler avec étudiants.

Sélection d’éléments de base des règles IASA, exprimés en règles simples d’après des principes d’interopérabilité, etc.

Ex. pour les titres passe de 10 pages à 1 page.

Scheme de métadonnées et système de gestion (Swallow)

Catégories de métadonnées

Avalon utilise un format XML pour le Time Stamping, suggéré de passer à un format XML pour permettre compatibilité et parce qu’autorise l’emploi de hiérarchie.

Transcriva outil pour transcription du son.

Archive audio précédemment placée sur Soundcloud. Avantage d’avoir un beau player, mais accessibilité de la plateforme problématique et craintes sur la durabilité de la plateforme.

Quid FRBR

Depuis 2013, à l’initiative de la Bibliothèque du Congrès, les États-Unis suivis d’un certain nombre de pays ont adopté un nouveau code de catalogage intitulé RDA (**Resource Description and Access / Ressources : Description et Accès) , qui met en application les Principes internationaux de catalogage et dont l’argument majeur repose sur la compatibilité avec les modèles FRBR et FRAD. http://www.bnf.fr/fr/professionnels/rda/s.rda_objectifs.html

Functional Requirements for Bibliographic Records (FRBR)
Functional Requirements for Authority Data (FRAD)
Functional Requirements for Subject Authority Data (FRSAD)

De mon point de vue catalogue un objet et la relation avec œuvre plutôt impliquée. Savoir dans quelle mesure devrait changer le système de catalogage. Un modèle et le modèle pas le territoire.

Pense que FRBR fonctionne mieux lorsque dispose des autorités. Fonctionne sans doute mieux lorsque choses claires.

Apprécie comment anticipe l’archive et son utilisation. Cf. anthologie. Pour les métadonnées, 10 pages. Comment se segmente le travail de documentation.

Pour récupérer le feed-back sur le catalogage. Champ par champ, laisse les questions venir pour identifier les problèmes. Utilisation du logiciel TeamWork https://www.teamwork.com/project-management-software

Références

Recommandations pour la production et la conservation des objets audionumériques. IASA-TC04 (deuxième édition, septembre 2009). https://www.iasa-web.org/tc04-fr/la-production-et-la-conservation-des-objets-audionumeriques
Joint Steering Committee for Development of RDA. http://www.rda-jsc.org/archivedsite/rda.html
AACR2 in RDA Toolkit https://www.rdatoolkit.org/AACR2
Logiciels images & sons (INA) https://institut.ina.fr/offres-services/logiciels-images-sons
http://fiatifta.org

Utilisation d’un tableau, pb champs répétés, valeurs multiples, etc.

Pas trouvé d’outils permettant le catalogage comme souhaité. Alors choix de produire un outil avec interface web et qui puisse être déployer rapidement. Lena et construit avec des bibliothèques largement disponibles. Surtout suffisamment flexible pour prendre en charge des changements dans le modèles et travail du catalogage.

PHP, MySQL, Bootstrap. API pour export et import en JSON et CSV.

Choisi d’adapter une approche no-sql. Une approche relativement nouvelle qui permet de simplifier le design du modèle relationnel. Au lieu de créer des tables multiples, simplification des contenus. Possible car stockage et exécution des requêtes sur JSON.

Définition des exigence du système. Gestion des utiliateurs, gestion des collections, gestion du catalogage et import et export. Wireframes pour définir interface. Essaye le plus possible d’utiliser JSON pour les listes de contrôle de vocabulaires, etc.

Pas traité image des artefacts pour le moment.

Webbackend, JSON Storage, pour l’accès Elastic Search, mapping nécessaires avec Avalon ou Islandora.

Mapping avec match, category n’existant pas dans Avalon et catégorie n’existant pas dans Spoken web.

Discussion

Zumthor commentaire sur la littérature dans le future qui serait plus web. Quid de l’hégémonie du livre imprimé, dans quelle mesure cas d’étude.

Autorise grande diversité de résultats d’abord considérer le poème de manière très différente. Signification de la performance littéraire change au cours du temps.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

crCRIHN2019-02-15.md

crCRIHN2019-02-15.md

Conf CRIHN 15 février 2019, SpokenWeb : Metadata Scheme and Cataloguing Process

The SpokenWeb Research Program

Structure de gestion

Plusieurs objectifs

Méthodes

Activities

Methodology for the Scheme Development

Scheme de métadonnées et système de gestion (Swallow)

Références

Discussion

Files

crCRIHN2019-02-15.md

Latest commit

History

crCRIHN2019-02-15.md

File metadata and controls

Conf CRIHN 15 février 2019, SpokenWeb : Metadata Scheme and Cataloguing Process

The SpokenWeb Research Program

Structure de gestion

Plusieurs objectifs

Méthodes

Activities

Methodology for the Scheme Development

Scheme de métadonnées et système de gestion (Swallow)

Références

Discussion