Sanakirja ilmaiseksi – kyllä vai ei


Sanakirja ilmaiseksi – kyllä vai ei

Kaikki on nykyään netissä, ja odotusarvo monella meistä on, että jos se on netissä niin se on ilmaista. Tai jos se on kustannettu julkisin varoin, se tulisi saada ilmaiseksi. Tämä näkyy hyvin tänä päivänä myös sanakirjoissa. Painetut isot suursanakirjat ovat lähes kokonaan kadonneet markkinoilta. Hyvällä onnella sellaisen löytää vielä jostain kirjakaupasta tai antikvariaatista, mutta monessa tapauksessa kyseessä on yli kymmenen vuotta vanha painos. Tämä pätee varsinkin yleisimpiin kieliin, englantiin, ruotsiin, saksaan ja ranskaan. Näiden kieliparien painettujen suursanakirjojen tuottaminen on hiipunut Suomessa.

Tarvitaanko sanakirjoja? Ei välttämättä, mutta kaikki varmaan ovat yhtä mieltä että edelleen tarvitsemme luotettavia työvälineitä palvelemaan meitä vieraskielisten (ja miksei äidinkielemmekin) sanojen käytössä ja ymmärtämisessä. Mielikuva netissä olevasta ilmaisesta sanakirjasta on tietenkin siinä mielessä harhaa, että joku netissä olevan sanakirjan aina maksaa, ja maksaa myös siitä että se on jatkuvasti netissä käytettävissä. Ja tämä näkyy tämän päivän nettisanakirjojen tarjonnassa. Ilmaisen sanakirjapalvelujen ongelma on sisältöjen laadun epätasaisuus; monet niistä kun on haalittu erilaisista kokoelmista. Yhdistämällä eri sisältöjä on pyritty luomaan palveluja, jotka vaikuttavat laajoilta ja monipuolisilta.

Hyvä sanakirja ei kuitenkaan synny ilman kielen ammattilaisia. Toisinaan nettisanakirjat ovat vain sanaluetteloita, jotka eivät avusta käyttäjää valitsemaan oikean käännöstä kun sanoilla on monia merkityksiä ja käännöksiä. Vaikka hakusanalle olisikin annettu useampi käännös, niin se ei vielä takaa sitä, että hakutuloksesta olisi hyötyä. Otetaanpa kuvitteellinen esimerkki sanasta aine:

1) substance 2) matter 3) subject 4) topic 5) stuff

Kaikki ihan oikeita käännöksiä sanalle aine, mutta palveleeko tämä käyttäjää? Jos sanakirjan käyttäjä haluaisi aine-sanaa merkityksessä “kirjoittaa aine koulussa”, niin ei tällainen sanalista vielä auta valitsemaan oikeaa merkitystä. Hyvään sanakirjaan tarvitaan käyttöalatieto, kielioppitietoa, tarkentavaa tietoa sanan ja käännöksen käytöstä ja myös hyviä esimerkkejä. Esimerkiksi Sanakirja.fi antaa hyvin kattavasti tietoa sanan aine käytöstä.

Kun sanakirja pyritään tekemään minimaalisin kustannuksin, ja silti saamaan siihen mahdollisimman paljon sisältöä, herää tietenkin ajatus parantaa sanalistojen laatua yhdistämällä niihin automaattisesti käyttöesimerkkejä. Mutta onko oikotietä poimia käyttöesimerkkejä sanakirjaan luotettavasti ilman ammattilaisia? Esimerkiksi Euroopan parlamentin asetuksia on käännetty monille kielille. Näitä hyödyntämällä sanakirjaan saattaisi päätyä käyttöesimerkiksi vaikkapa seuraava lausepari:

Nykyisillä ohjelmistomenetelmillä on helppo yhdistää eri kielille käännetyistä teksteistä toisiaan vastaavat lauseet. Yllä oleva esimerkki on sinänsä oikea, mutta virallisissa asetuksissa käytettävä kieli ja sanonnat sekä lauseen monimutkaisuus vaikeuttavat sanakirjan käyttäjää hahmottamaan miten sanaa aine tässä oikein on käytetty. Näin ei siis saada hyviä käyttöesimerkkejä sanakirjaan. Näyttää siltä, että määrä korvaa laadun. Pyritään luomaan kuva hyvästä, monipuolisesta ja laadukkaasta sanakirjapalvelusta, joka aikaansaadaan yhdistämällä erilaisia vapaasti netistä saatavia kielen resursseja. Sanakirjatyön ammattilainen olisi varmaan valinnut käyttöesimerkiksi vaikkapa:

Kun sanakirjan laatimisessa tukeudutaan ilmaiseksi saataviin aineistoihin, seurauksena on sanakirjan laadun kannalta isojakin ongelmia. Moni sisältö on laadittu talkootyönä, eikä ole välttämättä edes tarkoitettu sanakirjan aineistoksi. Pahimmassa tapauksessa sanakirjaan päätyy käännöksiä, jotka ovat väärällä kielellä. Sisällön päivittäminen ja ajan tasalla pitäminen on myös oma haasteensa. Kieli kehittyy koko ajan, ja sanakirjat vaativat jatkuvaa päivittämistä palvellakseen käyttäjiä. Parhaimmillaan ammattilaisten tuottamat sanakirjapalvelut kuten esimerkiksi Sanakirja.fi tarjoavat jopa mahdollisuuden jättää käännöspyyntöjä sanoista, joita ei löydy ja jotka sitten lisätään pikaisestikin sanakirjaan.

Kun sanakirja on käyttäjille ilmainen, niin tosiasiassa sen pitäminen yleisön saatavilla netissä maksaa aina jotakin. Monien palveluiden kustannukset on katettu mainonnalla, mistä aiheutuu lieveilmiöitä. Mainosten seasta on vaikea hahmottaa todellista sanakirjasisältöä, sillä osa hakusana-artikkelista jää monestikin piiloon sivun alareunaan kun mainokset vievät leijonanosan tilasta. Toinen iso mainonnan mukanaan tuoma epäkohta on se, että sivulle pitää saada liikennettä, jotta mainoksia näytettäisiin. Niinpä jotkut nettisanakirjat indeksoivat kaikki sanakirjan hakusanat (ja monesti myös sanat joita ei sanakirjassa edes ole) Google-hakuun saadakseen käyttäjiä sivuilleen. Melkein minkä tahansa suomenkielisen sanan hakeminen tuo ensimmäisenä ison kasan linkkejä eri sanakirjapalveluiden hakusana-artikkeleihin.

Kun ei voi kilpailla sisällön laadulla, niin sitten kilpaillaan sanojen määrällä. Kuinka paljon sanakirjassa voi olla sanoja? Tämä on hyvä kysymys, koska potentiaalinen sanojen määrä on todella suuri. Esimerkiksi suomenkielisessä Wikisanakirjassa on noin 385 000 artikkelia. Kyseessä siis näennäisesti hyvinkin laaja sanakirja, mutta artikkelien määrä ei ole sama kuin suomenkielisten hakusanojen määrä, sillä mainittu summa on Wikisanakirjan kaikkien kielten hakusana-artikkelien määrä yhteensä. Palvelun ilmoittamaan sanamäärään on siis aina syytä suhtautua varauksella. Lisäksi Wikisanakirja ei edes ole varsinaisesti sanakirja vaan hakuteos, joka sisältää mm. paikannimiä, sukunimiä ja etunimiä. Todellinen sanakirjasisältö ei siis ole merkittävä. Sama pätee muiden kielten wikisanakirjoihin. Kuitenkin näistä eri kieleten wikisanakirjoista on koostettu sanakirjapaveluja aineistoja yhdistämällä. Sen sijaan laajin markkinoilla oleva toimitettuun sisältöön pohjautuva suomi–englanti-sanakirja sisältää yli 400 000 suomenkielistä hakusanaa.

Sama, mikä pätee moneen muuhunkin asiaan, pätee myös sanakirjaan: moni kakku päältä kaunis tai eurolla saa euron tavaran. Ammattilaisten tekemä sanakirja on ihan toista maata, ja siihen voi luottaa.