Skip to content

Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor.

License

Notifications You must be signed in to change notification settings

Kungbib/SOUhack

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

(Summary in english below)

SOUhack

Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor. Dataset: https://data.kb.se/datasets/2015/02/sou/

Semniariedelen

Seminariet genomfördes 20 oktober på Kungl. biblioteket i Stockholm. På förmiddagen hölls öppna föreläsningar av forskare som arbetat med SOU-materialet.

  1. Kort info om dagen av Peter Krantz, CIO på Kungl. biblioteket

  2. Pelle Snickars, Umeå universitet

  3. Gustav Holmberg: Expertis och intervention: Statens offentliga utredningar och 1900-talets vetenskapshistoria

  4. Christopher Kullenberg: Statens röst digitaliserad (PDF)

  5. Anders Fåk, Linköpings universitetsbibliotek: Fritextsökning för historiskt SOU-material

  6. Hillevi Hägglöf, Textual Relations: Kvantitativ samhällsanalys med språkteknologiska metoder

Open space

På eftermiddagen genomfördes en open space-övning runt tre teman:

  1. Topic modeling / begrepp
  2. Temporal analys av teman
  3. Möjligheter att sammankoppla materialet med annat material

Ett 40-tal deltagare samarbetade runt olika analyser av Statens offentliga utredningar som text.

Datamängder och kod som uppstod runt #SOUhack

  1. Samtliga SOU:er (även de moderna) som textdumpar

https://www.dropbox.com/sh/fxtle6ie0zpd5x7/AAAeHOrPMRYqACoBpinoPIx4a?dl=0 http://scientometrics.flov.gu.se/files/SOU19222015.zip

  1. Ordmoln över tid av Oivvio Polite/Liberationtech och ordvektorer per år

  2. Topic modeling: http://github.com/michiexile/sou-hack-word2vec

  3. Ordvektorer

Summary in english

The National Library of Sweden hosted the event #souhack to explore a specific document collection. Around 40 practitioners gathered to analyze bureaucratic texts through visualization and text analytics. The type of document - Statens offentliga utredningar - is a report published by government inquiry committees. The dataset used: https://data.kb.se/datasets/2015/02/sou/

About

Kod och material relaterat till seminariet #SOUhack i KB:s serie Kulturarvet som ettor och nollor.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published