Python, tietokannat ja sqlite

Tällä luennolla käsitellään tietokantoja Pythonin näkökulmasta.

Luentotaltiointi 1

Luentotaltiointi 2

Luentotaltioinit ovat vanhoja ja sisältävät joitakin asioita jotka eivät enää päde. Tietokannan käsittely on kuitenkin edelleen validia tietoa.

Uusi esimerkki: videorekisteri (lähdekoodi, template1, template2)

Vanha esimerkki (suorita suoraan python-tulkilla): db.py (lähdekoodi)

Yleistä tietokannoista

Tällä kurssilla oletetaan, että tietokannat ja niihin liittyvät SQL-lauseet ovat tuttuja jo esitietokursseilta. Jos kyseiset asiat eivät ole kovin hyvin hallussa, itseopiskelua voi harrastaa esimerkiksi ao. kurssien materiaaleilla.

Käsiteltäessä tietokantoja on aina hyvä pitää mielessä se perussääntö, että annetaan tietokannan tehdä eri operaatiot mahdollisimman pitkälle. Siispä esimerkiksi viite-eheydet, rajoitteet ja lajittelut kannattaa aina tehdä suoraan kannassa, jos mahdollista. Myös esimerkiksi haut kannattaa rajata mahdollisimman tarkkaan jo SQL-lausetta muodostaessa. Kannassa operoiminen on merkittävästi tehokkaampaa kuin tehdä vastaavat asiat vasta ohjelmakoodin puolella. Tehokkuuden lisäksi operaatioiden tekeminen ohjelmakoodissa on paljon virhealttiimpaa kuin että tietokanta tekisi vastaavat operaatiot itse.

Lisäksi kannattaa pitää mielessä se, että jokainen tietokantakutsu syö nopeutta sovellukselta (merkittävää siinä vaiheessa, kun tehdään isoja sovelluksia). Tietokantakutsut kannattaa siis miettiä tarkkaan siten, ettei kantaan tehdä turhia kutsuja (ei samoja kutsuja useaan kertaan samalla sivulla; ei päivitystä, jos ei ole päivitettävää jne.).

Python Database API Specification v2.0 (PEP249)

PEP249 määrittelee rajapinnan jolla käsitellään tietokantoja.

On syytä käyttää vain PEP249-rajapinnan toteuttavia tietokantakirjastoa jolloin varmistaa parhaiten ohjelmansa siirrettävyyden.

sqlite3-kirjastolla voidaan käsitellä sqlite3-tietokantoja.

users.jyu.fi:ssä olevassa pythonissa on valmiina mukana sqlite3-kirjasto

Muut tietokannat vaativat omat kirjastonsa:

Tietokantayhteys

Mallitietokanta

Tietokantayhteys sqlite-tietokantaan avataan seuraavasti:

import sqlite3

con = sqlite3.connect( '/absoluuttinen/polku/tietokantaan/mallidb'))

Muihin tietokantoihin yhteys avataan samaan tapaan.

Tietokannasta riippuen voidaan tarvita lisäparametreja mm. tietokantapalvelimen ip-osoite, tunnus, salasana jne.

Yhteyden avaaminen kannattaa upottaa try...except-lohkoon koska yhteyden avaaminen ei aina onnistu!

    try:
      # sqlite haluaa absoluuttisen polun
      # os.path.abspath muuntaa suhteellisen polun absoluuttiseksi. Vaatii myös import os -rivin
      con = sqlite3.connect(os.path.abspath('../../hidden/resepti'))
      con.row_factory = sqlite3.Row
      # kirjoittaa rivin lokitiedostoon
      logging.debug("onnistui!")
    except Exception as e:
      logging.debug("Kanta ei aukea")
      logging.debug(str(e))

sqlite-tietokannoissa kannattaa asettaa yhteydelle heti seuraavat asetukset:

con.row_factory = sqlite3.Row

row_factory mahdollistaa kursorin kenttiin viittaamisen kenttien nimillä.

Jos tietokantayhteyttä ei enää tarvita niin se on syytä sulkea:

con.close()

Kyselyt

Tietokantayhteyden avaamisen jälkeen kantaan voidaan tehdä kyselyjä.

        cur = con.cursor()

        try:
                cur.execute("""
                SELECT *
                FROM resepti
                """)
        except:
                print "nyt tuli virhe: %s" % sys.exc_info()[0]
        # tulostaa kaikki rivit 
        print str(cur.fetchall())+"\n")

Kursori palauttaa python-listan, jonka sisällä on tupleja. Yksi tuple vastaa aina yhtä tietuetta:

[(u'Ananas Con Carne', u'Tulinen', 4, 1, 2), (u'Tiramisu', u'Hieno herkku', 6, 2, 7), (u'Banaanicurry', u'Mainio kasvisruoka', 2, 3, 2), (u'Porkkanapiirakka', u'Suuri herkku', 8, 4, 7), (u'Rommikakku', u'Hyytel\xf6kakku, ei tarvi paistaa', 6, 5, 7), (u'Kauralastut', u'Helppo ja nopea', 4, 6, 7)]

Tuples, Lists and Dictionaries

Yleensä tietokantakyselyissä käytetään ns. valmisteltuja kyselyjä mutta pythonin sqlitekirjaston kanssa tämä ei ole mahdollista.

Dynaamiset kyselyt sidotuilla muuttujilla

Dynaamisissa kyselyissä kyselyyn sidotaan mukaan muuttujia.

Muuttujia ei koskaan pidä sijoittaa suoraan SQL-lauseeseen. vrt. merkkijonot

Älä koskaan tee näin:

        cur.execute("""
        SELECT *
        FROM resepti
        WHERE nimi = %s
        """ % muuttuja

Esimerkkejä


	resepti1 = "Makaronilaatikko"

        cur.execute("""
        SELECT *
        FROM resepti
        WHERE nimi = ?
        """, (resepti1,))

        for (nimi, kuvaus, hlomaara, id, tyyppi) in cur:
            print ('nimi:\t%s\n' % (nimi) )
            print('kuvaus:\t%s\n' % (kuvaus) )
            print('hlomaara:\t%s\n' % (hlomaara) )
            print('id:\t%s\n' % (id) )
            print('tyyppi:\t%s\n\n' % (tyyppi) )

        resepti2 = "Lihakeitto"
        reseptit = (resepti1, resepti2)

        sql = """
        SELECT *
        FROM resepti
        WHERE nimi = ?
        OR nimi = ?
        """

        cur.execute(sql, reseptit)

        for rivi in cur:
            print('nimi:\t%s\n' % (rivi[0]) )
            print('kuvaus:\t%s\n' % (rivi[1]) )
            print('hlomaara:\t%s\n' % (rivi[2]) )
            print('id:\t%s\n' % (rivi[3]) )
            print('tyyppi:\t%s\n\n' % (rivi[4]) )

        reseptit = {"rese1":resepti1, "rese2":resepti2}

        cur.execute("""
        SELECT *
        FROM resepti
        WHERE nimi = :rese1
        OR nimi = :rese2
        """, reseptit)

        # Läpikäynti onnistuu seuraavilla tavoilla jos on asetettuna
        # con.row_factory = sqlite.Row

        for rivi in cur:
                for i in rivi.keys():
                    print('%s:\t%s\n' % (i, rivi[i]) )

        for rivi in cur:
                print('Nimi:\t%s\n' % (rivi['Nimi']) )
                print('Kuvaus:\t%s\n' % (rivi['Kuvaus']) )
                print('Henkilomaara:\t%s\n' % (rivi['Henkilomaara']) )
                print('ReseptiID:\t%s\n' % (rivi['ReseptiID']) )
                print('RuokalajiID:\t%s\n' % (rivi['RuokalajiID']) )


Kyselyn suorittamisen vaiheet

  1. Kysely valmistellaan - valmisteltu kysely suoritetaan seuraavilla suorituskerroilla tehokkaammin (prepare).
  2. Kysely suoritetaan (execute).
  3. Kyselyn tulos käydään läpi kursorin avulla for-silmukassa (voi käyttää myös: fetchone, fetchmany tai fetchall).

Transaktiot

SQL As Understood By SQLite

Transaktioiden avulla pystytään hallitsemaan tietokantaoperaatiokokonaisuuksia. Esimerkiksi, jos tietokantaan pitää syöttää useita tietueita peräkkäin ja jos yksikin lisäys epäonnistuu, niin kaikki lisäykset pitää pystyä peruuttamaan (vrt. verkkopankki). Transaktio varmistaa, etteivät keskeneräisen transaktion vaikutukset tietokantaan heijastu muille tietokannan käyttäjille kuin vasta transaktion hyväksymisen jälkeen.

Python sqlite-kirjastossa transaktiot ovat oletuksena käytössä. Monen muun kirjaston kohdalla ne saattaa joutua erikseen käynnistämään.

Myös tietojen lisääminen, poistaminen ja muuttaminen onnistuu samalla idealla kuin kyselyjen tekeminen. Seuraavassa esimerkkejä tietojen lisäämisestä, muuttamisesta ja poistamisesta sekä transaktioista:


        try:
                cur.execute("""
                INSERT INTO Resepti (Nimi, Kuvaus, Henkilomaara, RuokalajiID)
                VALUES (:nimi, :kuvaus, :henkilomaara, :ruokalajiID )
                """, {"nimi":"Talkkunahyve", "kuvaus":"perinteinen jälkkäri",
                         "henkilomaara":4,"ruokalajiID":7})
        except:
                print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
                print("Lisääminen epäonnistui\n")
                con.rollback()
                return

        #palauttaa viimeisimmän lisätyn tietueen perusavaimen
        reseptiID = cur.lastrowid

        try:
                cur.execute("""
                UPDATE Resepti
                SET Nimi = 'Puolukkahyve'
                WHERE ReseptiID = ?
                """, (reseptiID,))
        except:
                print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
                print("Päivittäminen epäonnistui\n")
                con.rollback()
                return

        try:
                cur.execute("""
                DELETE From Resepti
                WHERE ReseptiID = :id
                """, {"id":reseptiID} )
        except:
                print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
                print("Poistaminen epäonnistui\n")
                con.rollback()
                return

        #ilman tätä muutokset eivät jää voimaan!
        con.commit()

cur.lastrowid palauttaa viimeisen tietokantaan lisätyn avaimen (primary key).

Transaktio hyväksytään komennolla con.commit() tai perutaan komennolla con.rollback()

Controlling Transactions in SQLite

SQLite

Ohjeita SQLite-tietokannan käyttöön SQLite-pääteohjauksesta.

Tietokantayhteyden jakaminen

Raskaissa WWW-sovelluksissa tietokantayhteyttä ei avata ja suljeta yhtenään vaan samaa yhteyttä pidetään auki pitempään ja jaetaan eri prosessien kesken. Tietokantayhteyksiä avataan kerralla useita ja niitä säilytetään ja jaetaan tarpeen mukaan. kts. Connection pool.

Työkaluja tietokantayhteyden tehostamiseen:

SQLAlchemy

SQL Relay

What is the best way to make persistent connections to a database?

Esimerkkejä

Uusi esimerkki: videorekisteri (lähdekoodi, template1, template2)

db.py (lähdekoodi)

Tarvitsetko oikeasti tietokantaa?

Mieti aina tarkkaan onko tietokannasta sinulle varmasti hyötyä vai riittääkö esim. pelkkä JSON-tiedosto? Onko tarpeen tehdä kyselyjä? Onko tietoja päivitettävä usein?

Kannattaa lukea Firefoxin kehittäjien kommentit SQLite-tietokannan käyttämisestä Firefoxissa: Performance/Avoid SQLite In Your Next Firefox Feature.

Lisätietoa

Käyttäjien kommentit

Kommentoi Lisää kommentti
Kurssimateriaalien käyttäminen kaupallisiin tarkoituksiin tai opetusmateriaalina ilman lupaa on ehdottomasti kielletty!
http://appro.mit.jyu.fi/tiea2080/luennot/sqlite/
© 2018-03-14 12:48:20
Informaatioteknologia - Jyväskylän yliopiston informaatioteknologian tiedekunta