Teksti ja kuvat • Jaska Järvilehto
Intervalli • 2/2021
www.intervalli.fi
Marraskuussa 2021 avautunut Musiikinluettelointi.fi-sivusto sisältää yhtenäistettyjen musiikkinimekkeiden ohjeluetteloiden tietokannan, joka perustuu Heikki Poroilan kokoamiin PDF-muotoisiin ohjeluetteloihin.
Säveltäjien teosten tiedoista voi tehdä hakuja sanahaulla joko kokotekstihakuna tai pelkästään yhtenäistettyihin nimekkeisiin kohdistettuna kenttähakuna. Hakutulokset ovat rajattavissa musiikinlajin, soitinnuksen, sävellysajan, esityskielen, sävellajin ja mahdollisten säveltäjäkohtaisten teoskategorioiden perusteella.
Julkaisuhetkellä tietokanta sisältää seitsemän säveltäjän (Armas Järnefelt, Yrjö Kilpinen, Uuno Klami, Joonas Kokkonen, Otto Kotilainen, Toivo Kuula ja Ernest Pingoud) ohjeluettelot. Vielä on lisäämättä 63 säveltäjää.
Tietokantamuotoiset ohjeluettelot julkaistaan tekijänoikeuksista vapaana Creative Commons CC0 1.0 -lisenssillä.
Ohjeluetteloiden tietokanta on tarpeellinen
Yhtenäistettyjen nimekkeiden ohjeluetteloilla helpotetaan musiikinkuvailijoiden työtä. Aikana ennen ohjeluetteloita kuvailijan piti muodostaa jokaiselle vastaantulevalle teokselle yhtenäistetty nimeke erikseen omaan asiantuntemukseensa nojautuen. Ohjeluetteloiden maailmassa ohjeluettelon laatija on muodostanut teokselle valmiiksi yhtenäistetyn nimekkeen. Kuvailijan tehtäväksi jää käsillä olevan teoksen tunnistaminen ja sen yhdistäminen käytettävään nimekkeeseen. Ohjeluettelot ovat keskeinen taidemusiikin kuvailun työväline, etenkin jos kirjastojärjestelmässä ei ole käytössä teosauktoriteettijärjestelmää.
Ohjeluetteloiden laadinnasta ja päivittämisestä on ollut lähes yksinomaan vastuussa musiikkikirjastonhoitaja emeritus Heikki Poroila. Ammattikunnan kannalta on ollut kätevää, että yksittäinen aktiivinen ja asiantunteva henkilö on ottanut hoitaakseen työlään urakan. Muutamia vuosia sitten suomalaista musiikkikirjastomaailmaa kuitenkin ravisutti kaksi tapahtumaa: Heikki Poroila jäi eläkkeelle 2014 ja suomalaiset luettelointisäännöt korvattiin RDA-kuvailusäännöillä Kansalliskirjastossa ja Melinda-yhteisluettelossa 2016. Poroilalle ei ole ilmestynyt seuraajaa, joka olisi valmis ottamaan hoitaakseen ohjeluetteloiden päivittämisen, niiden muokkaamisesta RDA:n mukaiseksi puhumattakaan.
Kaikkien kuvailijoiden käytettävissä olevan kansallisen teosauktoriteettirekisterin puuttuessa ohjeluettelot toimittavat teosauktoriteettien virkaa. Musiikin metatiedon asiantuntijaryhmä Muusa on linjannut, että ohjeluetteloiden yhtenäistetyt nimekkeet ovat ohjeellisia muotoja myös RDA-aikakaudella. Tosin sillä varauksella, että jokaisen kuvailijan on muutettava ohjeluettelon tarjoama nimeke RDA:n mukaiseksi. Vaatimus ei ole realistinen käytännön kuvailutyön arjessa. Muusa-ryhmässä onkin vuosien mittaan keskusteltu useampaan otteeseen siitä, että ohjeluettelot tulee päivittää RDA-aikaan, jotta ne ovat käyttökelpoisia nykyaikaisessa musiikinkuvailussa. Ongelmaksi on muodostunut, että kenelläkään ei ole ollut halua ryhtyä käymään luetteloita läpi. Ei ole myöskään ollut mitään keskitettyä tietokantaa, johon yhtenäistettyjen nimekkeiden päivitetyt muodot voitaisiin tallentaa.
Kesäloman 2020 ratoksi pohdiskelin, että ohjeluetteloiden päivittämiseen tarvittavan teknisen alustan puuttuminen on pienellä vaivalla ratkaistavissa oleva ongelma. PDF-muotoiset ohjeluettelot voidaan muuntaa koneellisesti sellaiseen muotoon, joka mahdollistaa niiden viemisen tietokantaan muokattavaksi ja edelleen julkaistavaksi. Lopulta minulla kului tietokantajärjestelmän rakentamiseen iltaisin ja viikonloppuisin liki puolitoista vuotta.
Haasteellinen tietorakenne
Ensimmäinen haaste järjestelmän toteuttamisessa oli ohjeluetteloiden tietosisällön kuvaaminen tietokoneen ymmärtämällä tavalla. Yrityksen ja erehdyksen kautta päädyin tietorakenteeseen, jossa teosten keskeinen tieto tiivistetään neljään pääelementtiin: teokset, osat, sovitukset ja käännökset.
Teoksen elementit ovat tietokannassa erillisinä, toisistaan riippumattomina dokumentteina, jotka on linkitetty toisiinsa. Teoksella voi olla osia, sovituksia ja käännöksiä. Osalla voi olla osia, sovituksia ja käännöksiä. Sovituksella voi olla käännöksiä. Käännöksen alla ei voi olla mitään. Teokseen sisältyvien elementtien lukumäärää ei ole rajoitettu: teoriassa teoksella voi olla ääretön määrä osia, joilla voi olla ääretön määrä osia ja niin edelleen.
Ohjeluettelon tuominen tietokantaan
Prosessin aluksi Python-kielellä kirjoitettu ohjelma tutkii PDF-ohjeluetteloa ja poimii tekstistä tietoelementtejä sille kerrottujen sääntöjen perusteella. Näitä tunnistettavia tietoelementtejä ovat yhtenäistetty nimeke, opusnumero, sävellysaika, soitinnus ja kantaesityksen ajankohta. Tietoelementtien tunnistamissääntöjä on tarpeen hienosäätää ohjeluettelokohtaisesti vastaamaan kulloisenkin ohjeluettelon taittoa ja typografiaa. Tekstistä tunnistetut tietoelementit ohjelma tallentaa CSV-taulukkotiedostoksi.
Ohjelman tuottama taulukkotiedosto tarkistetaan ihmissilmin ja tuodaan tietokantaan. Tuonnin yhteydessä teoksiin lisätään viittaukset tietojen lähteenä olevaan ohjeluetteloon.
Tuonnin yhteydessä teokset voidaan lisäksi liittää säveltäjäkohtaisiin teoskategorioihin Boolen logiikkaan perustuvilla säännöillä. Esimerkiksi Pingoudin teokset saavat automaattisesti kategoriakseen “opusnumerolliset teokset” tai “opusnumerottomat teokset” sen mukaan, onko teoksella opusnumero vai ei.
Yhtenäistettyjen nimekkeiden muokkaaminen
Tietokantaan tuotuja teoksia muokataan järjestelmän omalla kuvailutyökalulla. Jokainen teoksen tietoihin tehty muutos tallentuu järjestelmän sisäiseen versionhallintaan. Muutokset ovat tarvittaessa peruttavissa ja aiempi tieto palautettavissa.
Yhtenäistetyn nimekkeen muokkaaminen siirtää yhtenäistetyn nimekkeen aiemman muodon automaattisesti viittausmuodoksi “vaihtoehtoiset nimekkeet” -kenttään. Yhtenäistetyn nimekkeen muutoshistoria on näkyvissä myös julkisesti.
Yhtenäistetyn nimekkeen yhteyteen voidaan tallentaa tieto aakkostuksessa ohitettavien merkkien määrästä, mikäli nimeke alkaa artikkelilla. Nimekkeelle voidaan määritellä kieli, aakkosto ja käytetty translitterointi esimerkiksi silloin, kun venäjänkielinen nimeke on translitteroitu latinalaisille aakkosille. Olen tehnyt testejä automaattisella kielentunnistuksella, mutta tulokset ovat olleet sen verran satunnaisia, että vielä toistaiseksi nämä tiedot on parempi lisätä käsityönä.
Tulevaisuuden näkymiä
Ohjeluetteloita on tarkoitus viedä tietokantaan ripeään tahtiin. Tietokantaan tallennettujen yhtenäistettyjen nimekkeiden päivittäminen RDA:n mukaisiksi tulee jossakin vaiheessa musiikin metatiedon asiantuntijaryhmä Muusan asialistalle. Järjestelmä tarjoaa mahdollisuuden myös aivan uusien ohjeluetteloiden laatimiseen vaikka ryhmätyönä, mikäli siihen on innostusta. Jos Kansalliskirjasto tulevaisuudessa toteuttaa kansallisen teosauktoriteettirekisterin, ovat ohjeluetteloiden yhtenäistetyt nimekkeet tarvittaessa siirettävissä tietokannasta koneluettavassa muodossa.