Siirry pääsisältöön. Siirry hakuun.

Yksityiskokoelmien digitointi: Miksi ja miten?

Hannu Saarenmaa

Alustava versio (päivitetty 04.01.2011 /Mikko Heikkinen), kommentit tervetulleita osoitteeseen tai palautelomakkeella.

Suomessa on luonnontieteellisten museoiden kokoelmissa noin 20 miljoonaa näytettä. Näiden tiedoista vain noin 10% on erilaisissa tietokannoissa ja siten edes periaatteessa Internetin kautta saatavilla. Verkkosaatavuus on kuitenkin tärkeää, sillä julkisia kokoelmia käytetään hyvin moniin tarkoituksiin ja maailmanlaajuisesti.

Digitoinnilla tarkoitetaan tässä kokoelman näytteiden etikettitietojen tallentamista. Suomessa on satoja yksityiskokoelmia, joissa on yhteensä miljoonia näytteitä. Valtaosa näistä päätyy jossakin vaiheessa julkisiin kokoelmiin. Niiden vastaanotto on lisääntyvä ongelma, mitä helpottaa jos kokoelma on jo valmiiksi digitoitu. Museokokoelmien digitoinnin kansallinen strategia on luettavissa sivuilta http://www.gbif.fi/projects/diko/

Paras henkilö digitoimaan yksityiskokoelman on tietysti sen kerääjä itse. Kuinka tämä tapahtuu, kuvataan seuraavassa.

Kuinka digitoin kokoelmani?

Näytteistä tallennetaan periaatteessa kaikki etikettiin kirjoitetut tiedot, kuten maa, maakunta, kunta, tarkka paikka, koordinaatit, keruuaika ja kerääjä. Sen lisäksi tallennetaan lajimääritys ja määrityksen peruste, kuten erilaiset preparointitiedot.

Digitointi on myös oiva tilaisuus lisätä ja tarkentaa koordinaattitietoja. Luonnontieteellisen keskusmuseon suositus on, että koordinaatit annettaisiin vähintään sadan metrin tarkkuudella. Ei ole mitään syytä tyytyä enää kymppiruutuihin, koska esim. Hatikka/Fieldjournal tarjoaa karttaliittymän jossa keruualue voidaan tarkkaan rajata.

Tärkeä uusi asia, jota ei ole useimmissa kokoelmissa, on näytteiden identifiointi. Näytteille annetaan juokseva numero kokoelman sisällä. Jotta eri kokoelmien numerot eivät menisi sekaisin, mukaan on otettava myös kokoelmaa koskeva tunniste. Tällaiset neljästä merkistä koostuvat tunnisteet luotiin jo 1980-luvulla yhteispohjoismaisessa RUBIN-hankkeessa ja on saatavissa sivulta http://www.luomus.fi/elaintiede/rubin.htm

Näytteen koko tunniste on muotoa http://id.luomus.fi/RUBIN-XXXX.1234, jossa XXXX on siis kokoelman tunniste ja viimeisenä juokseva numero tai muu näytteestä käytetty tunniste. Alkuosa on vakio ja siitä näkee että tunniste on ns. HTTP URI -tunniste. Tunnisteen osaa tulkita eli näytetietoja hallitsee internetin domain luomus.fi, eli Luonnontieteellinen keskusmuseo.

Jokainen näyteyksilö varustetaan lapulla jossa on tällainen tunniste!

Tunniste ja etikettitiedot tallennetaan esimerkiksi taulukkolaskimella yksi rivi näytettä kohti, jokainen kenttä omaan sarakkeeseensa.

Tiedosto viedään johonkin palvelimeen, kuten Virtalan hyönteistietokanta, keskusmuseon Hatikka/Fieldjournal -tietokanta, tai jokin GBIF-palvelin. Näistä kaksi jälkimmäistä sopii myös ulkomailla tehdyille havainnoille.

Virtalan hyönteistietokanta

Virtalan tietokannassa osa RUBIN-XXXX.1234 laitetaan ensimmäiseen kenttään "havID" ja tiedosto tallennetaan "Standard Update" menetelmällä, jonka syöttötiedoston rivi on muotoa:

havID; Suku laji; lkm(koiras); lkm(naaras); lkm(total); kehitysAste; maakunta; kunta; paikka; pKoord:iKoord; alkuPv; alkuKk; loppuPv; loppuKk; vuosi; habitaatti; menetelma; keraaja; maarittaja; maarVuosi; kokoelma; huomautus; piilotaTarkatTiedot; piilotaKoord; piilotaKeraaja

Esimerkki tällaisesta tietueesta on alla:

RUBIN-SEMF.78881;Agriphila tristella;;; 1;aikuinen;Kb;Ilomantsi;Möhkö; 695612:372017;07;08;14;08;2009;Rehevä entinen pelto jokivarressa, keski-ikäistä kuusta ja koivua;Jalas-model light trap with 125W Hg matt lamp;Hannu Saarenmaa;Hannu Saarenmaa;2010;Kenttämääritys;;;;

Hatikka ja Päiväperhosseuranta

Hatikka-järjestelmässä tunnisteet laitetaan kunkin havainnon lisätietoihin, mistä järjestelmä ne löytää. Alla on esimerkki valtakunnallisen päiväperhosseurannan kaksi lajia sisältävästä havaintoerästä, jonka voi syöttää tiedostona.

NAM;#saarenmaa
PRO;Kb
COM;Ilomantsi
LOC;Pappilanvaara
GRI;69579:37008
KEY;#nafi;1
DAT;20080531
NAM;Saarenmaa, Hannu
KEY;dwc:CollectingMethod = Certain sighting
OBS;Gonepteryx rhamni;1;http://id.luomus.fi/RUBIN-SEMF.63262
OBS;Pieris napi;1;http://id.luomus.fi/RUBIN-SEMF.63207

Havaintopaikka tallentuu automaattisesti omien havaintopaikkojen luetteloon. Näitä voi uudelleenkäyttää muissa havainnoissa ja kokoelmayksilöissä, eli kaikkia tietoja ei tarvitse syöttää uudestaan joka yksilölle.

GBIF IPT

Museon GBIF-palvelimessa http://data1.gbif.fi:8080/ipt/ kukin kokoelma voi saada oman alueen, jossa sen tietoja ylläpidetään. Tämä voi olla kiinnostava vaihtoehto sen vuoksi, että GBIF-palvelimessa kukin kokoelma voidaan säilyttää kokonaisuutena, johon liittyvät siiihen kuuluvat kuvailutiedot.

GBIF-palvelimessa tunniste laitetaan kenttään GlobalUniqueIdentifier. Taulukossa voi olla esim. seuraavan mallin mukaiset kentät. Ensimmäisellä rivillä on kenttien otsakkeet. Lisää kenttiä voi valikoida Darwin Core -standardista http://www.tdwg.org/standards/450/.

CatalogNumber GlobalUniqueIdentifier ScientificName Collector Country County Locality DecimalLatitude DecimalLongitude EarliestDateCollected
78197 http://id.luomus.fi/RUBIN-SEMF.78197 Colias croceus Hannu Saarenmaa France Hérault Viols-en-Laval 43,7584 3,7491 6.11.2009
78198 http://id.luomus.fi/RUBIN-SEMF.78198 Amphipyra lidia Hannu Saarenmaa France Hérault Viols-en-Laval 43,7584 3,7491 7.11.2009

Lisätietoja ja neuvoja digitointiin voi kysyä Suomen GBIF-solmulta Luonnontieteellisestä keskusmuseosta osoittesta .