Skip to main content

Tiedonhaun opas teekkareille

Teknillisten yliopistokirjastojen yhteinen tiedonhaun opas teekkareille

Miten haen?

Tiedonhaku ei ole ”nappulatekniikkaa” vaan ajattelutapa

Tietokannoissa ei ole juurikaan älykkyyttä. Hakusysteemit etsivät vain hakijan kirjoittamia merkkijonoja, jotka voivat olla sanoja, lyhenteitä tai jotakin muuta.

 

  1. Tietokannat eivät aina osaa etsiä sanojen erilaisia taivutusmuotoja ilman, että se kerrotaan niille. Tämä tapahtuu käyttämällä katkaisumerkkiä (truncation character, wild card). Katkaisumerkit vaihtelevat tietokannoittain. Esimerkissä katkaisumerkki on *

product* löytää product, products, production, productive, productivity, productization, productize…

  1. Pitää oppia ajattelemaan joukkoja.

On osumien (kirjojen, artikkeleiden...) joukko, jossa esiintyy ’hakusana1’ ja toinen joukko, jossa esiintyy ’hakusana2’.

Katkaisumerkkiä käytettäessä syntyy sellaisten osumien joukko, joissa esiintyy vähintään yksi annetulla tavalla alkava sana.

  1. Jos etsitään käsitteellä, jota kuvataan kahdella tai useammalla sanalla, käsite eli fraasi (phrase) kirjoitetaan lainausmerkkien sisään. Tällöin sanojen tulee olla annetussa järjestyksessä ja juuri kirjoitetussa muodossa. Lainausmerkkien sisällä olevia sanojakin voi useimmissa tietokannoissa katkaista.

”supply chain”

”life cycle cost model*”

  1. Tiedonhaussa yhdistetään hakujoukkoja Boolen operaattoreilla, joita ovat AND, OR ja NOT.

quality AND control tarkoittaa, että jokaisesta osumasta löytyvät molemmat sanat

manufacture OR produce tarkoittaa, että jokaisesta osumasta löytyy jompikumpi sanoista

energy NOT nuclear tarkoittaa, että niistä osumista, joissa esiintyy sana energy poistetaan ne, joissa on sana nuclear

  1. Tiedonhaussa hakusanoja voidaan yhdistää myös läheisyysoperaattorilla (proximity operator). Läheisyysoperaattori määrittelee hakusanojen enimmäisetäisyyden toisistaan. Läheisyysoperaattorit voivat olla erilaisia eri tietokannoissa. Esimerkissä käytetään muotoa W/n, jossa n on enin määrä sanoja, mitä sallitaan hakusanojen väliin. Sanat voivat myös vaihtaa paikkaa.

quality W/2 control* tarkoittaa, että jokaisessa löydetyssä osumassa ovat sana quality ja control-alkuinen sana enintään kahden sanan päässä toisistaan

löydetään quality control, controlling quality, controlling product quality, quality and productivity control…

  1. Tiedonhakuun voidaan yhdistää erilaisia edellä mainittuja hakutapoja. Tällöin toimitaan ikään kuin rakennettaisiin matemaattinen lauseke.

Esimerkki:

”supply chain*” AND performance AND (metrics OR measur*)

tarkoittaa, että etsitään toimitusketju(je)n suorituskyvyn mittaamista. Tässä on fraasi lainausmerkeissä ja siinä toinen sana on katkaistu, seuraavaksi yksittäinen sana ja viimeisenä vaihtoehtoiset mittaamista kuvaavat sanat, joista jälkimmäinen on katkaistu. Huomaa OR-operaattorilla yhdistettyjen sanojen ympärillä olevat sulut. Niiden avulla kerrotaan hakujärjestelmälle, että OR-operaatio suoritetaan ensin ja sitten yhdistetään siten saatu tulosjoukko muihin osiin.

 

Mistä hakusanan pitäisi löytyä?

Mistä sanaa etsitään? Otsikosta, asiasanoista, kokotekstistä?

Tavallisesti hakukoneet etsivät annettua hakusanaa mahdollisimman laajasti. Ne selaavat tekstimassaa ja tarjoavat tulosjoukkoon kaikki osumat, missä sana esiintyy. Seurauksena on, että tulosjoukko kasvaa usein valtavaksi. Toisaalta haun tarkkuus kärsii, koska useimmissa löydetyissä dokumenteissa sana ei ehkä ole kovin merkittävässä roolissa.

Täsmällisen haun aikaansaamiseksi kannattaa hakusanaa etsiä täsmennetysti rajoitetuista tietueen osista eli kentistä (field). Sopivia osia ovat esimerkiksi otsikko, tiivistelmä ja asiasanat (title, abstract, keywords/subject/topic).

Jos etsitään tietyn henkilön  tuotoksia, hakusanaksi annetaan kirjoittajan nimi ja kohdistetaan haku tekijä-kenttään (author).

Kenttä, johon haku kohdistetaan, valitaan tavallisesti hakusanalaatikon vieressä olevasta pudotusvalikosta.

Liikaa vai liian vähän?

Liikaa / Liian vähän / Vääränlaisia hakutuloksia

Tuliko tuloksia liikaa? Voit tarkentaa hakuasi seuraavasti:

  • Korvaa liian yleinen sana tarkemmin aihetta kuvaavalla termillä.
  • Vältä sanan katkaisua liian aikaisin tai kirjoita sana kokonaan.
  • Lisää tarkentavia hakusanoja käyttäen AND-operaattoria.
  • Käytä läheisyysoperaattoria, jos AND-operaattorilla yhdistäminen tuo liian laajan tuloksen.
  • Rajaa jokin ominaisuus pois NOT-operaattorilla esimerkiksi storage NOT "data storage".
  • Kohdista haku tiettyyn kenttään (otsikko, asiasanat, tiivistelmä jne.)
  • Kohdista haku esimerkiksi haluttua tieteenalaa käsittelevään tietokannan osaan (mm. Elsevierin Science Directissä voi valita sopivan tieteenalan).
  • Rajaa hakua määrittämällä halutut julkaisuvuodet.

Tuliko tuloksia liian vähän? Kokeile seuraavia keinoja:

  • Jos tulee nollatulos, tarkista, onko joku sana kirjoitettu väärin. Ovatko hakusanasi tietokannan kielellä?
  • Hyvistä osumista löytyy uusia hakusanoja. Kokeile niitä!
  • Käytä hakusanojen katkaisua. Jos käytit jo katkaisumerkkiä, katkaise sana aikaisemmin, jolloin tulee enemmän vaihtoehtoisia kirjoitusmuotoja.
  • Onko käyttämillesi hakusanoille synonyymejä? Yhdistä niitä käyttäen OR-operaattoria. "mobile phone" OR "cell phone"
  • Käytä laajempaa käsitettä. Jos olet hakenut esimerkiksi fraasilla "solar energy", kokeile "renewable energy".
  • Jätä pois vähemmän tärkeitä AND-operaattorilla yhdistettyjä sanoja.
  • Jos olet hakenut vaikka otsikkokentästä, laajenna hakua käsittämään kaikki kentät.
  • Kokeile muita sopivia tietokantoja?

Etkö löytänyt oikeaa asiaa käsitteleviä lähteitä?

  • Rajaa sopivaan tieteenalaan. Tämä onnistuu vaikkapa Science Directissä ja Scopuksessa.
  • Kokeile muita, sopivampia tietokantoja?
  • Tarkista käyttämiesi hakusanojen merkitykset sanakirjasta.
  • Jos käytät lyhenteitä haussa, tarkista, että ne tarkoittavat sitä mitä pitääkin. Samalla lyhenteellä voi olla monta merkitystä.