Automaattinen sisällönkuvailu osaksi Finton palveluja

Finto laajenee automaattisen sisällönkuvailun palveluihin Finto AI -työkalun ja sen rajapintapalvelun myötä. Palvelu tukee suomen-, ruotsin- ja englanninkielisen tekstin automaattista sisällönkuvailua.

Finto AI on saatavilla osoitteessa ai.finto.fi, josta löytyvän lomakkeen avulla palvelua voi kokeilla ja käyttää. Automaattinen sisällönkuvailu toimii parhaiten opinnäytetyö- ja tietokirja-aineistoissa.

Finto on suomalainen sanasto- ja ontologiapalvelu, joka on jo yli kuuden vuoden ajan tukenut sisällönkuvailutyötä tarjoamalla pääsyn keskeisiin sanastoihin ja ontologioihin. Finto AI tuo koneoppimisen ja kieliteknologian tarjoamia mahdollisuuksia työkaluiksi perinteiseen sisällönkuvailutyöhön. Palvelun taustalla on Kansalliskirjastossa kehitetty työkalu Annif, jota on useiden vuosien ajan kehitetty kokeellisena palveluna. 

Annif on jo käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaista käyttöä pilotoidaan tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa. 

Myös Kirjavälitys Oy käyttää rajapintapalvelua vielä julkaisemattomien kirjojen asiasanoitukseen kustantajan esittelytekstin pohjalta. “Annif on tuttavuutemme aikana kehittynyt selvästi, ja sen seuraaminen on ollut todella mielenkiintoista. Erityisesti tietokirjojen esittelyteksteihin perustuvaan asiasanoitukseen se pystyy usein tarjoamaan YSO-termejä tarkasti, melko usein myös kattavasti”, kertoo Anna Tuominen Kirjavälityksen tuotetietopalveluista. Yleinen suomalainen ontologia YSO on kolmikielinen (suomi, ruotsi, englanti) ontologia, eli käsitehierarkiaa, joka kuvaa jonkin aihealueen käsitteet ja niiden väliset suhteet koneymmärrettävässä muodossa. Se koostuu pääasiassa yleiskäsitteistä mutta sisältää runsaasti myös eri alojen erikoiskäsitteistöä, on rakennettu suomalaisen kulttuuripiirin sisällönkuvailutarpeiden ja käsitteistön pohjalta, ja on tarkoitettu käytettäväksi kuvailuun erityisesti silloin, kun kuvailtavien aineistojen aihealueet ovat monipuolisia.

Automaattista sisällönkuvailua erilaisilla sanasto- ja kieliyhdistelmillä ja monentyyppisillä aineistoilla on jo pitkään kokeiltu Annifin kehityksen osana. Tällä hetkellä käytössä oleva toiminnallisuus perustuu useiden algoritmien yhdistelmään, jolla on saatu hyviä tuloksia. Koneoppimisalgoritmeja on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty näiden algoritmien ehdotusten hienosäätöön. 

Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.

Katso esittelyvideo: https://youtu.be/ZKN22mXKMm8

Lisää aiheesta:

Lehtinen M, Inkinen J & Suominen O (2019). Aaveita koneessa: Automaattisen sisällönkuvailun arviointia Kirjastoverkkopäivillä 2019.Tietolinja, 2019(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2019120445612

Finto-palvelu http://finto.fi/fi/

Lisätietoja:

Mona Lehtinen, tietoasiantuntija, Automaattinen kuvailu

Juho Inkinen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

Osma Suominen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

etunimi.sukunimi@helsinki.fi