Mistä on hyvä hakusana-artikkeli tehty?


Mistä on hyvä hakusana-artikkeli tehty?

Joskus saamme asiakkailtamme palautetta, että sanakirjojemme hakutulokset ovat liian raskaslukuisia. Käyttäjä on yksinkertaisesti halunnut vain yhden käännöksen - thank you very much - ja sen sijaan lukuläksyksi pamahtaa yhdeksäntoista merkitysryhmän hakusana-artikkeli, joka sisältää viisikymmentä esimerkkilausetta. Eikö vähempikin riittäisi?

Jotta voisimme pureutua tähän kysymykseen, meidän täytyy hieman tarkastella hakusana-artikkelien anatomiaa. Millaista tietoa niissä voi olla?

Hakusana-artikkelit sisältävät sanan tai sanaliiton kielellisen kuvauksen yhdellä, kahdella tai useammalla kielellä. Lähes kaikki Kielikoneen sanakirjat ovat kaksikielisiä, joten keskitytään tässä bloggauksessa niihin.

Ensimmäinen elementti hakutuloksessa on pääsana, jonka alta hakusana-artikkelin muut tiedot löytyvät. Pääsanan seurana saattaa olla vain sanaluokka, mutta usein Sanakirja.fi:n artikkeleissa pääsanaan liittyy myös kaikenlaista muuta tärkeää kuten sanan suku, foneettisin aakkosin kirjoitetut lausuntaohjeet, taivutustiedot sekä erinäisiä kielellisiä huomautuksia ja täsmennyksiä. Useimpien pääsanojen vierestä löytyy myös kaiutinnappula, jota painamalla saa kuulla miten robottiääni lausuu sanan, ja taivutustaulukkonappula, jonka takaa avautuu joskus suurikin kokoelma taivutusmuotoja. Kannattaa vilkaista miten kattavasti esimerkiksi ranskan verbien taivutukset on listattu!

Pääsanan alta löytyy artikkelin muu vartalo: käännösvastineet, esimerkkilauseet ja niiden käännökset, usein jaoteltuina useampaan merkitysryhmään. Näiden ryhmien jaotteluun liittyvät synonymian ja polysemian käsitteet. Synonyymit eli samamerkityksiset sanat sopivat samaan ryhmään kun taas polyseemisten sanojen merkitykset eroavat toisistaan enemmän. Hyvä esimerkki monimerkityksisestä sanasta on kieli. Suussamme on kieli, puhumme kieliä, monella soittimella on kieliä. Nämä merkitykset selvästi liittyvät toisiinsa, ja niillä on sama etymologinen pohja, mutta kaikki ne pitäisi selkeässä hakusana-artikkelissa erotella toisistaan, jottei sanakirjan käyttäjällä mene tonguet, languaget ja stringit sekaisin.

Merkitysryhmien jaottelu onkin yksi sanakirjaeditorin haastavimmista hommista, ja siihen tarvitaan lähteiden lisäksi myös roppakaupalla kielellistä intuitiota. Polysemian käsite on nimittäin häilyvä, eikä ole olemassa mitään matemaattista kaavaa, joka kertoisi mihin synonymia loppuu ja mistä polysemia alkaa.

Oma juttunsa on myös käännösten ja merkitysryhmien järjestys. Niiden lajittelussa täytyy pitää mielessä yksi tärkeä sääntö: tarjoa oleellisin tieto ensin. Vaikka hakusana-artikkeli olisikin erittäin laaja, ensimmäisten ryhmien tulisi kuitenkin pitää sisällään yleisimmät käännökset. Yhdeksäntoista merkitysryhmän hakusana-artikkelia make ei siis tarvitse selailla loppuun asti, jos vastaus käyttötarpeeseen löytyy jo alusta.

Oikean käännösvastineen valinnassa auttavat myös hyvin valitut käyttöesimerkit, jotka esittävät sanan sen tyypillisissä käyttöyhteyksissä. Pelkkä lista käännöksistä voi johtaa sanakirjan käyttäjän harhateille, mutta esimerkkilauseet kuten “vesi kihahti kielelleni”, “viulussa on neljä kieltä” ja “puhuttu kieli” antavat jo enemmän vihjeitä. Esimerkit konkretisoivat sanan moninaisuuden ja ilmaisuvoiman sekä auttavat kielioppipulmissa kuten oikean preposition valinnassa. Pitikö tekstit nyt kääntää to johonkin vai into johonkin? Esimerkit paljastavat tämänkin!

Pääsanojen lisäksi myös merkitysryhmillä ja yksittäisillä käännöksillä voi olla huomautuksia ja täsmennyksiä, jotka nekin rytmittävät ja selkeyttävät hakusana-artikkelia. Kielioppihuomautukset tunnistaa Sanakirja.fi:ssä hakasuluista kun taas yleisluontoisemmat selitykset löytyvät tavallisten sulkujen sisältä tai merkitysryhmätasolla ilman sulkuja vaaleammalla fontilla kirjoitettuna. Kannattaa vilkaista vaikkapa sanaa selvitä suomi–ruotsi-sanakirjastamme. Huomautukset varmistavat, ettei tule lipsautettua juttukaverille taivaasta tulleen nykter kun haluaa sanoa, että siitä on tullut molnfri.

Huomautusten lisäksi Sanakirja.fi:n sanakirjat sisältävät huiman määrän informaatiota sanojen erikoisalasta, tyylirekisteristä sekä kielivariantista. Erikoisaloja riittää lääketieteestä eläintieteeseen ja elektroniikkaan, kirjanpidosta politiikkaan ja ruoka-alaan – yhteensä aloja on 153 kappaletta, ja ne voi paikantaa tummapohjaisten laatikkojen sisällä olevista teksteistä. Samanlaisista laatikoista löytyy myös tyylirekisterit, jotka kertovat onko sana esimerkiksi arkikielinen, vanhahtava, runollinen taikka ironinen. Kolmas mainitsemani informaation laji, kielivariantit, kertoo millä alueella ilmausta käytetään ja missä merkityksessä. Tämä on erittäin tärkeää, sillä emmehän halua, että Sanakirja.fi:n käyttäjä tilaa Briteissä vahingossa chipsejä kun haluaa crispejä tai huudahtaa erehdyksessä “tabernacle!” vieraillessaan quebeciläisessä kirkossa.

Palataanpa vielä hetkeksi makrotasolle ja sivistyssanojen pariin. Synonyymien ja polyseemien lisäksi sanakirjaeditorit pyörittelevät nimittäin myös homonyymejä. Homonyymit ovat sanoja, joilla on eri alkuperä mutta sama muoto. Sanapari kuusi (puu) ja kuusi (numero) on tuttu esimerkki homonymiasta. Sanakirja.fi:ssä homonyymit tunnistaa pienestä pääsanan yläindeksissä olevasta numerosta, joka kertoo, että samalla tavalla kirjoitetun sanan alta löytyy useampi hakusana-artikkeli.

Myös eri sanaluokkien sanoja, joilla on sama kirjoitusmuoto, käsitellään kuten homonyymejä. Tällaisia tapauksia on varsinkin englannin kielessä valtava määrä; mainitaanpa vaikka fly (verbi: lentää, substantiivi: kärpänen), watch (verbi: katsoa, substantiivi: rannekello), dry (adjektiivi: kuiva, verbi: kuivata) – tätä listaa voisi jatkaa loputtomiin! Näissäkin tapauksissa merkitysten tarkka lajittelu tekee hakusana-artikkeleiden rakenteesta selkeämmän ja auttaa käyttäjää valitsemaan oikean käännösvastineen.

Vastaus alun kysymykseen on siis: joskus vähempi ei riitä, sillä emme pääse käyttäjän pään sisälle katsomaan onko haussa kissan kieli, suomen kieli vai viulunkieli. Hakusana-artikkelien rakenteen ymmärtäminen kuitenkin auttaa käännösvastineiden etsinnässä. Apua löytyy myös käyttöliittymästämme, sillä mutteri-ikonin takana olevista asetuksista pääsee muun muassa muokkaamaan hakutulosten järjestystä erikoisalojen perusteella. Jos sinulla hyviä ideoita siitä, miten saamme hakusana-artikkeleistamme vielä selkeämpiä, niin otamme palautteen ilomielin vastaan!