Luento 6 - Kuvat WWW:ssä ja tiedonhaku
Luennon äänitys ikävä kyllä epäonnistui. Tarjolla on korvikkeeksi
viime vuonna Tommin pitämä vastaava luento:
Jos jollakin on käytössä minidisc-soitin jolla voidaan pelastaa levy jonka
TOC on jäänyt tallentamatta niin ottakoon kurssin luennoijiin yhteyttä niin
yritetään pelastaa Petrin luento.
Seuraavassa käsitellään kuvankäsittelyyn liittyviä perusasioita sekä tiedonhakuun liittyviä asioita.
Kuvat WWW:ssä
Kuvankäsittely termistöä
- Pikseli (engl. pixel) - kuvapiste
- Resoluutio - kuvapisteiden määrä tuumaa kohti (dpi).
- Bittisyvyys - kuvan esittämien värin määrä (esim. 24 bit - 16 milj. väriä).
-
Bittejä | 2^ | Värien määrä |
1 | 2^1 | 2 |
2 | 2^2 | 4 |
4 | 2^4 | 16 |
8 | 2^8 | 256 |
15 | 2^15 | 32768 |
16 | 2^16 | 65536 |
24 | 2^24 | 16 miljoonaa |
- Indeksoidut värit(engl. indexed colors) ja täysvärit eli 16 miljoonaa väriä
- Lomitus (engl. interlacing) - kuva tarkentuu tasoittain näytölle.
- Läpinäkyvyys (engl. transparency) - jonkin värin kohdalta tausta näkyy läpi.
- Häviöllinen (engl. lossy) ja häviöttömät kuvaformaatti
Bittikarttaformaatit
- Kuva esitetään bittikarttana, joka koostuu pikseleistä.
- Kuvan värien määrä riippuu kuvapikselin tiedon pituudesta (esim. 8 bittinen kuva 256 väriä)
- Kuvan koko on karkeasti pikseleiden lukumäärä kertaa värien bittisyys (+lisainfot).
- Kuvia ei voi suurentaa kunnolla.
JPEG
- Käytetään valokuvien näyttämiseen WWW:ssä.
- Pakkausaste voidaan määritellä. (Pakkausasteiden vertailu)
- 16 miljoonaa väriä (24 bit).
- Tukee lomitusta (progressive jpeg).
- Ei tue läpinäkyvyyttä.
- Häviöllinen (lossy), joten informaation palauttaminen ei onnistu.
- Selaimet tukevat formaatti hyvin.
- Käytetään viivapiirroksien ja kaavioiden esittämiseen WWW:ssä.
- Käytetään myös kuvaoriginaalien säilyttämiseen.
- Tukee lomitusta.
- Tukee läpinäkyvyyttä (alpha channel).
- Gamma-korjaus, joka korjaa kuvan kirkkauden vääristymiä järjestelmästä toiseen siirryttäessä.
- Maksimissaan 48 bittiset värit.
- Lisenssivapaa pakkausalgoritmi, jossa ei menetetä tietoa.
- GIF-formaattia parempi pakkaustapa.
- Virheiden tarkistus.
- Tulee korvaamaan GIF-formaatin.
- Vanhemmat selaimet eivät tue.
GIF
- Käytetään viivapiirroksissa ja kaavioissa.
- Pieni kuvan koko oikein käytettynä.
- Tukee lomitusta (interlaced gif).
- Tukee "taustavärin" läpinäkyvyyttä.
- Tukee animaatioita.
- Maksimissaan 256 väriä (8 bit).
- Lisenssimaksuja vaativa pakkausalgoritmi.
- Näkyy myös vanhemmilla graafisilla selaimilla.
- Windowsissa yleisesti käyttettävä kuvaformaatti.
- Kuvat yleensä huomattavan suuria.
- Selaimet eivät tue BMP-formaattia.
- Soveltuu kuvaoriginaalien säilyttämiseen.
- Selaimet eivät tue TIFF-formaattia.
Vektorigrafiikka
- Kuvan tieto esitetään matemaattisina lausekkeina.
- Koon suurentaminen mahdollista tarkkuuden säilyessä.
- Pienempi tiedostokoko bittikarttakuvaan verrattuna.
- Ei sovellu luontokuvien näyttämiseen.
SVG (Scalable Vector Graphics)
- Tulevaisuuden WWW:ssä käytettävä vektorigrafiikkaformaatti.
- Selaimet eivät tällä hetkellä (syksy 2001) tue formaattia ilman erillisiä lisäosia.
Seuraavassa W3C:n sivuilta esimerkki SVG:n käytöstä:
<?xml version="1.0" standalone="no"?>
<!DOCTYPE svg PUBLIC "-//W3C//DTD SVG 20010904//EN"
"http://www.w3.org/TR/2001/REC-SVG-20010904/DTD/svg10.dtd">
<svg width="12cm" height="4cm" viewBox="0 0 1200 400"
xmlns="http://www.w3.org/2000/svg" xmlns:xlink="http://www.w3.org/1999/xlink">
<desc>Example rect01 - rectangle with sharp corners</desc>
<!-- Show outline of canvas using 'rect' element -->
<rect x="1" y="1" width="1198" height="398"
fill="none" stroke="blue" stroke-width="2"/>
<rect x="400" y="100" width="400" height="200"
fill="yellow" stroke="navy" stroke-width="10" />
</svg>
Seuraavassa kuvassa on esitetty edellisen esimerkin koodien muodostama kuva.
Muita vektorigrafiikkaformaatteja
- Postscript - tulostinten sivunkuvauskieli.
- CGM
Kuvatiedoston koko
Kuvatiedoston kokoon vaikuttavat seuraavat asiat:
- Kuvan värien lukumäärä.
- Kuvan fyysinen koko (pituus leveys).
- Käytettävä kuvaformaatti.
- Kuvan resoluutio.
WWW-sivuille tulevat kuvat
Kuvia laitettaessa WWW-sivuille kannattaa muistaa seuraavat asiat:
- Käytä mahdollisimman pieniä ja ydin asian sisältäviä kuvia.
- Käytä sivuilla pieniä kuvia (engl. thumbnail), joista mahdollisuus päästä suurempaan kuvaan.
- Merkitse suuremman kuvan yhteydessä kuvan koko linkkitekstin yhteyteen.
- 600x400 kokoinen kuva mahtuu näytölle lähes aina.
- Resoluution ei tarvitse näyttöä varten olla suurempi kuin 72 dpi.
- Värimääräksi kannattaa valita pienin mahdollinen.
- Muista aina määritellä kuvan leveys ja korkeus, koska se nopeuttaa sivun näkymistä.
- Valitse tilanteeseen oikea formaatti.(formaatin ja värimäärän vaikutus kuvan kokoon)
Kuvankäsittelyn perustoimintoja
- Rajaus (engl. crop)
- Kääntäminen (engl. rotate)
- Koon muuttaminen (engl. resize tai resample)
- Erilaiset korjaukset.
- Efektit.
Kuvat käyttötarkoituksen mukaan
Seuraavassa muutamia vinkkejä kuvien skannaamiseen ja käyttämiseen.
- Kuvien säilytys
- Mahdollisimman suuri tarkkuus.
- Suuri koko.
- Resoluutio 300 dpi.
- TIFF- tai PNG-formaatti
- WWW-sivulla olevat maisemakuvat
- Resoluutio 72 dpi.
- Värimäärä mahdollisuuksien mukaan pieneksi.
- JPEG-formaatti.
- WWW-sivuille tulevat kaaviokuvat
- Resoluutio 72 dpi.
- Värimäärä mahdollisimman pieneksi.
- PNG-formaatti.
- Kuvakaappaus (engl. screenshot)
- Resoluutio riippuen käytetystä mediasta.
- Värimäärä riippuen käytettävästä mediasta.
- PNG-formaatti.
Värijärjestelmät
- RGB (Red Green Blue)
- Lisäävä värimalli.
- Käytetään tietokoneiden näytöissä.
- CMYK (Cyan Magenta Yellow blacK)
- Vähentävä värimalli.
- Käytetään painotöissä.
Ohjelmistoja kuvien käsittelyyn
- Paint Shop Pro 7.0
- Macromedia Fireworks
- Photoshop 5.5
- Photo-Paint
- Ohjelmia voi etsiä seuraavista osoitteista:
Yllämainittujen graafisella käyttöliittymällä varustettujen ohjelmien lisäksi voi käyttää
myös komentoriviliittymällä toimivaa ImageMagick-ohjelmistoa, joka on täysin ilmainen
ja löytyy useimmille eri käyttöjärjestelmille. Jukka Korpela on kirjoittanut pikaohjeen
ImageMagickin asentamisesta Windowsiin. ImageMagic löytyy valmiiksi asennettuna
atk-keskuksen st-sarjan (silmu, itu, verso) linux-koneista ja www-palvelimesta.
Lisätietoa kuvista ja kuvankäsittelystä
Tiedonhaku
Erilaisia tiedonhakutapoja
Arvaaminen
- Haetaan esimerkiksi yrityksen kotisivua ja yritetään suoraan http://www.yritys.com/
- Etsitään yrityksen hakutoiminnoilla.
- Etsitään sivusto(hakemisto)logiikan mukaan.
Aihehakemistot
- Mennään aihehakemistoon, josta valitaan haluttu aihepiiri.
- Seurataan aihehakemisto polkuja.
- Voi olla pitkiäkin hierarkioita.
- Esimerkkihakemistoja:
Aiheen tai alan tietokannat
- Hyvä paikka alakohtaisten artikkelien hakemiseen.
- Sekalaisia tietokantoja
Hakukoneet
Seuraavissa esimerkeissä voi esiintyä eroja hakukoneen kieliversioiden suhteen. Esimerkeissä käytetään Googlen suomenkielistä, Altavistan suomenkielistä ja Yahoon englanninkielistä hakukonetta.
- Syötetään hakusana jollekin hakukoneelle
- boolen haku ( AND (ja), OR (tai), NOT (ei) )
- Sanarunkohaku
- Fraasihaku
- Esimerkkihaku
- Joillekin hakukoneille voidaan edelleen rajoittaa hakua seuraavien ehtojen perusteella:
- Domain-nimen perusteella.
- Sanojen esiintymien suhteen.
- Päivämäärän suhteen.
- Kielen suhteen.
Seuraavassa on esitelty muutamia erilaisia hakukoneita:
- Metahaku
- Metahakukoneissa ei omaa tietokantaa vaan ohjaavat kyselyn muille hakukoneille
- Dogpile
- Huskysearch
- Erikoistuneet hakukoneet
- Suomalaiset hakukoneet
- Hakukonekokoelma
Tehokaaseen tiedonhakuun liittyviä asioita
- Valitse käytettävä hakutapa haettavan asian mukaan.
- Valitse käytettävä hakukone: yleinen vaiko erikoistunut?
- Päätä millä kielellä kirjoitettuja dokumentteja haluat.
- Mieti tarkkaan käytettävä hakusanat. Mitä useampia hakusanoja niin sitä tarkemman ja rajatumman tuloksen saat.
- Poista hakutuloksesta epäoleellisia sanoja sisältävät dokumentit.
- Tutki löytyviä dokumentteja ja poimi niistä tarkentavia hakusanoja.
- Käytä selaimen etsi-toimintoa tutkiessasi pitkiä dokumentteja.
- Muista lähdekritiikki!
Miten sivut kannattaa suunnitella hakukoneen kannalta
Sivut kannattaa suunnitella noudattaen käytettävyyden ja esteettömyyden periaatteita!
- Käytä sivustolla asiaankuuluvia ja oikeita sanoja niiden oikeissa muodoissa.
- Title-elementtiin kuvaava otsikko sivuille.
- Tiivistelmä asiasta aina sivun alkuun.
- Käytä sivuilla metatietoa.
- Sivulle tulevat linkit voivat ratkaista.
- Älä yritä liikaa päästä hakukoneen listan kärkeen!
- Ei siis toisteta sanoja tarkoituksettomasti!
- Ei käytetä sanoja, jotka eivät liity asiaa!
Lisää tiedonhausta voi lukea esimerkiksi seuraavista osoitteista: