Python, tietokannat ja sqlite
- Luentotaltiointi 1
- Luentotaltiointi 2
- Yleistä tietokannoista
- Python Database API Specification v2.0 (PEP249)
- Tietokantayhteys
- Kyselyt
- Transaktiot
- SQLite
- Tietokantayhteyden jakaminen
- Esimerkkejä
- Lisätietoa
Tällä luennolla käsitellään tietokantoja Pythonin näkökulmasta.
Luentotaltiointi 1
- sovellus09.wmv 37M
- sovellus09.mp3 29M
- youtube
Luentotaltiointi 2
- sovellukset10.wmv 78M
- sovellukset10.mp3 30M
- youtube 200M
Luentotaltioinit ovat vanhoja ja sisältävät joitakin asioita jotka eivät enää päde. Tietokannan käsittely on kuitenkin edelleen validia tietoa.
Uusi esimerkki: videorekisteri (lähdekoodi, template1, template2)
Vanha esimerkki (suorita suoraan python-tulkilla): db.py (lähdekoodi)
Yleistä tietokannoista
Tällä kurssilla oletetaan, että tietokannat ja niihin liittyvät SQL-lauseet ovat tuttuja jo esitietokursseilta. Jos kyseiset asiat eivät ole kovin hyvin hallussa, itseopiskelua voi harrastaa esimerkiksi ao. kurssien materiaaleilla.
Käsiteltäessä tietokantoja on aina hyvä pitää mielessä se perussääntö, että annetaan tietokannan tehdä eri operaatiot mahdollisimman pitkälle. Siispä esimerkiksi viite-eheydet, rajoitteet ja lajittelut kannattaa aina tehdä suoraan kannassa, jos mahdollista. Myös esimerkiksi haut kannattaa rajata mahdollisimman tarkkaan jo SQL-lausetta muodostaessa. Kannassa operoiminen on merkittävästi tehokkaampaa kuin tehdä vastaavat asiat vasta ohjelmakoodin puolella. Tehokkuuden lisäksi operaatioiden tekeminen ohjelmakoodissa on paljon virhealttiimpaa kuin että tietokanta tekisi vastaavat operaatiot itse.
Lisäksi kannattaa pitää mielessä se, että jokainen tietokantakutsu syö nopeutta sovellukselta (merkittävää siinä vaiheessa, kun tehdään isoja sovelluksia). Tietokantakutsut kannattaa siis miettiä tarkkaan siten, ettei kantaan tehdä turhia kutsuja (ei samoja kutsuja useaan kertaan samalla sivulla; ei päivitystä, jos ei ole päivitettävää jne.).
Python Database API Specification v2.0 (PEP249)
PEP249 määrittelee rajapinnan jolla käsitellään tietokantoja.
On syytä käyttää vain PEP249-rajapinnan toteuttavia tietokantakirjastoa jolloin varmistaa parhaiten ohjelmansa siirrettävyyden.
sqlite3-kirjastolla voidaan käsitellä sqlite3-tietokantoja.
users.jyu.fi:ssä olevassa pythonissa on valmiina mukana sqlite3-kirjasto
Muut tietokannat vaativat omat kirjastonsa:
Tietokantayhteys
Tietokantayhteys sqlite-tietokantaan avataan seuraavasti:
import sqlite3
con = sqlite3.connect( '/absoluuttinen/polku/tietokantaan/mallidb'))
Muihin tietokantoihin yhteys avataan samaan tapaan.
Tietokannasta riippuen voidaan tarvita lisäparametreja mm. tietokantapalvelimen ip-osoite, tunnus, salasana jne.
Yhteyden avaaminen kannattaa upottaa try...except-lohkoon koska yhteyden avaaminen ei aina onnistu!
try: # sqlite haluaa absoluuttisen polun # os.path.abspath muuntaa suhteellisen polun absoluuttiseksi. Vaatii myös import os -rivin con = sqlite3.connect(os.path.abspath('../../hidden/resepti')) con.row_factory = sqlite3.Row # kirjoittaa rivin lokitiedostoon logging.debug("onnistui!") except Exception as e: logging.debug("Kanta ei aukea") logging.debug(str(e))
sqlite-tietokannoissa kannattaa asettaa yhteydelle heti seuraavat asetukset:
con.row_factory = sqlite3.Row
row_factory mahdollistaa kursorin kenttiin viittaamisen kenttien nimillä.
Jos tietokantayhteyttä ei enää tarvita niin se on syytä sulkea:
con.close()
Kyselyt
Tietokantayhteyden avaamisen jälkeen kantaan voidaan tehdä kyselyjä.
cur = con.cursor() try: cur.execute(""" SELECT * FROM resepti """) except: print "nyt tuli virhe: %s" % sys.exc_info()[0] # tulostaa kaikki rivit print str(cur.fetchall())+"\n")
Kursori palauttaa python-listan, jonka sisällä on tupleja. Yksi tuple vastaa aina yhtä tietuetta:
[(u'Ananas Con Carne', u'Tulinen', 4, 1, 2), (u'Tiramisu', u'Hieno herkku', 6, 2, 7), (u'Banaanicurry', u'Mainio kasvisruoka', 2, 3, 2), (u'Porkkanapiirakka', u'Suuri herkku', 8, 4, 7), (u'Rommikakku', u'Hyytel\xf6kakku, ei tarvi paistaa', 6, 5, 7), (u'Kauralastut', u'Helppo ja nopea', 4, 6, 7)]
Tuples, Lists and Dictionaries
Yleensä tietokantakyselyissä käytetään ns. valmisteltuja kyselyjä mutta pythonin sqlitekirjaston kanssa tämä ei ole mahdollista.
Dynaamiset kyselyt sidotuilla muuttujilla
Dynaamisissa kyselyissä kyselyyn sidotaan mukaan muuttujia.
Muuttujia ei koskaan pidä sijoittaa suoraan SQL-lauseeseen. vrt. merkkijonot
Älä koskaan tee näin:
cur.execute(""" SELECT * FROM resepti WHERE nimi = %s """ % muuttuja
Esimerkkejä
resepti1 = "Makaronilaatikko"
cur.execute("""
SELECT *
FROM resepti
WHERE nimi = ?
""", (resepti1,))
for (nimi, kuvaus, hlomaara, id, tyyppi) in cur:
print ('nimi:\t%s\n' % (nimi) )
print('kuvaus:\t%s\n' % (kuvaus) )
print('hlomaara:\t%s\n' % (hlomaara) )
print('id:\t%s\n' % (id) )
print('tyyppi:\t%s\n\n' % (tyyppi) )
resepti2 = "Lihakeitto"
reseptit = (resepti1, resepti2)
sql = """
SELECT *
FROM resepti
WHERE nimi = ?
OR nimi = ?
"""
cur.execute(sql, reseptit)
for rivi in cur:
print('nimi:\t%s\n' % (rivi[0]) )
print('kuvaus:\t%s\n' % (rivi[1]) )
print('hlomaara:\t%s\n' % (rivi[2]) )
print('id:\t%s\n' % (rivi[3]) )
print('tyyppi:\t%s\n\n' % (rivi[4]) )
reseptit = {"rese1":resepti1, "rese2":resepti2}
cur.execute("""
SELECT *
FROM resepti
WHERE nimi = :rese1
OR nimi = :rese2
""", reseptit)
# Läpikäynti onnistuu seuraavilla tavoilla jos on asetettuna
# con.row_factory = sqlite.Row
for rivi in cur:
for i in rivi.keys():
print('%s:\t%s\n' % (i, rivi[i]) )
for rivi in cur:
print('Nimi:\t%s\n' % (rivi['Nimi']) )
print('Kuvaus:\t%s\n' % (rivi['Kuvaus']) )
print('Henkilomaara:\t%s\n' % (rivi['Henkilomaara']) )
print('ReseptiID:\t%s\n' % (rivi['ReseptiID']) )
print('RuokalajiID:\t%s\n' % (rivi['RuokalajiID']) )
Kyselyn suorittamisen vaiheet
- Kysely valmistellaan - valmisteltu kysely suoritetaan seuraavilla suorituskerroilla tehokkaammin (prepare).
- Kysely suoritetaan (execute).
- Kyselyn tulos käydään läpi kursorin avulla for-silmukassa (voi käyttää myös: fetchone, fetchmany tai fetchall).
Transaktiot
Transaktioiden avulla pystytään hallitsemaan tietokantaoperaatiokokonaisuuksia. Esimerkiksi, jos tietokantaan pitää syöttää useita tietueita peräkkäin ja jos yksikin lisäys epäonnistuu, niin kaikki lisäykset pitää pystyä peruuttamaan (vrt. verkkopankki). Transaktio varmistaa, etteivät keskeneräisen transaktion vaikutukset tietokantaan heijastu muille tietokannan käyttäjille kuin vasta transaktion hyväksymisen jälkeen.
Python sqlite-kirjastossa transaktiot ovat oletuksena käytössä. Monen muun kirjaston kohdalla ne saattaa joutua erikseen käynnistämään.
Myös tietojen lisääminen, poistaminen ja muuttaminen onnistuu samalla idealla kuin kyselyjen tekeminen. Seuraavassa esimerkkejä tietojen lisäämisestä, muuttamisesta ja poistamisesta sekä transaktioista:
try:
cur.execute("""
INSERT INTO Resepti (Nimi, Kuvaus, Henkilomaara, RuokalajiID)
VALUES (:nimi, :kuvaus, :henkilomaara, :ruokalajiID )
""", {"nimi":"Talkkunahyve", "kuvaus":"perinteinen jälkkäri",
"henkilomaara":4,"ruokalajiID":7})
except:
print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
print("Lisääminen epäonnistui\n")
con.rollback()
return
#palauttaa viimeisimmän lisätyn tietueen perusavaimen
reseptiID = cur.lastrowid
try:
cur.execute("""
UPDATE Resepti
SET Nimi = 'Puolukkahyve'
WHERE ReseptiID = ?
""", (reseptiID,))
except:
print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
print("Päivittäminen epäonnistui\n")
con.rollback()
return
try:
cur.execute("""
DELETE From Resepti
WHERE ReseptiID = :id
""", {"id":reseptiID} )
except:
print("nyt tuli virhe: %s" % sys.exc_info()[0] + "\n")
print("Poistaminen epäonnistui\n")
con.rollback()
return
#ilman tätä muutokset eivät jää voimaan!
con.commit()
cur.lastrowid palauttaa viimeisen tietokantaan lisätyn avaimen (primary key).
- Saman saa selville SQL-kysellä: SELECT last_insert_rowid()
- Kätevä keino saada selville lisätty ID silloin, kun tietokannassa on autoincrement-määritys ID:lle (primary keylle).
- Tietokantariippuvainen toiminto
- ROWIDs and the INTEGER PRIMARY KEY
Transaktio hyväksytään komennolla con.commit() tai perutaan komennolla con.rollback()
Controlling Transactions in SQLite
SQLite
Ohjeita SQLite-tietokannan käyttöön SQLite-pääteohjauksesta.
Tietokantayhteyden jakaminen
Raskaissa WWW-sovelluksissa tietokantayhteyttä ei avata ja suljeta yhtenään vaan samaa yhteyttä pidetään auki pitempään ja jaetaan eri prosessien kesken. Tietokantayhteyksiä avataan kerralla useita ja niitä säilytetään ja jaetaan tarpeen mukaan. kts. Connection pool.
Työkaluja tietokantayhteyden tehostamiseen:
What is the best way to make persistent connections to a database?
Esimerkkejä
Uusi esimerkki: videorekisteri (lähdekoodi, template1, template2)
Käyttäjien kommentit