# Rečnici

Uopštenje listi. 

Čuva parove u vidu (ključ, vrednost). 

Kod običnih lista, ključ je ceo broj (0, 1, 2, ...), a vrednost može da bude bilo šta. 

Kod rečnika, ključ može da bude i ceo broj, ali i decimalan broj, niska.

U Python-u se zove se `dict` i pravi se na dva različita načina.

In [1]:
# prazan recnik
dict()

{}

In [2]:
# prazan recnik, II nacin
{}

{}

In [4]:
#  razliiti tipovi kljuceva i vrednosti
d = {'Ana': 34, 'Vera': [1, 3, 'Milica'], 0: 'Nemanja'}
d

{'Ana': 34, 'Vera': [1, 3, 'Milica'], 0: 'Nemanja'}

In [5]:
# pristupamo elementima
d['Ana']

34

In [6]:
d['Vera']

[1, 3, 'Milica']

In [7]:
d['Vera'][1]

3

In [8]:
# kljuc ne postoji
d['Petar']

KeyError: 'Petar'

In [9]:
d[0]

'Nemanja'

In [10]:
# lista kao recnik
r = {0: 'a', 1: 'b', 2: 'c', 3: 'e'}
r[0]

'a'

In [11]:
# kao da smo uradili
s = ['a', 'b', 'c', 'd']
s[0]

'a'

In [12]:
# ali, kod recnika nije moguce uzimati opseg vrednosti
r[1:]

TypeError: unhashable type: 'slice'

In [13]:
# sto je pogodnost listi
s[1:]

['b', 'c', 'd']

In [14]:
# dodavanje novih parova (kljuc, vrednost)
d['Ivan'] = 15
d

{'Ana': 34, 'Vera': [1, 3, 'Milica'], 0: 'Nemanja', 'Ivan': 15}

In [15]:
# izmena postojecih vrednosti
d['Ana'] = -99
d

{'Ana': -99, 'Vera': [1, 3, 'Milica'], 0: 'Nemanja', 'Ivan': 15}

In [16]:
# prolazak kroz recnik, ispisivanje kljuceva i vrednosti, I nacin
for kljuc in d:
    vrednost = d[kljuc]
    print(kljuc, vrednost)

Ana -99
Vera [1, 3, 'Milica']
0 Nemanja
Ivan 15


In [17]:
# II nacin prolaska
for kljuc, vrednost in d.items():
    print(kljuc, vrednost)

Ana -99
Vera [1, 3, 'Milica']
0 Nemanja
Ivan 15


In [18]:
# III nacin
for kljuc in d.keys():
    vrednost = d[kljuc]
    print(kljuc, vrednost)

Ana -99
Vera [1, 3, 'Milica']
0 Nemanja
Ivan 15


In [19]:
# IV nacin, samo vrednosti
for vrednost in d.values():
    print(vrednost)

-99
[1, 3, 'Milica']
Nemanja
15


In [20]:
# provera da li je kljuc prisutan u recniku
'Ana' in d

True

In [21]:
# II nacin
'Marija' in d.keys()

False

# Distribucije: karakteri i tokeni

In [24]:
# broj svih karaktera se jednostavno utvrdjuje funkcijom len()
t = 'Neka niska nad kojom vežbamo zadatke.'
len(t)

37

In [33]:
# broj svih karaktera koji nisu, na primer, delimiteri
delimiteri = " ,.?!"
br = 0
for karakter in t: # karakter po karakter, II nacin
    if not karakter in delimiteri:
        br += 1
br

31

In [27]:
# distribucija karaktera, cuvanje
# zelimo recnik ovog oblika: {'a': 12, 'b': 3, 'c': 5, ...}
# kljuc je karakter, a vrednost je broj pojavljivanja tog karaktera u niski
d = dict()
for karakter in t:
    if not karakter in d: # ako kljuc jos uvek ne postoji u recniku
        d[karakter] = 0 # kad ne bi bilo ovog koraka, u narednoj liniji, pri uvecavanju vrednosti brojaca, kod bi pukao
    d[karakter] += 1 
d

{'N': 1,
 'e': 3,
 'k': 4,
 'a': 6,
 ' ': 5,
 'n': 2,
 'i': 1,
 's': 1,
 'd': 2,
 'o': 3,
 'j': 1,
 'm': 2,
 'v': 1,
 'ž': 1,
 'b': 1,
 'z': 1,
 't': 1,
 '.': 1}

In [28]:
# ako zelimo da prebrojavanje bude 'case-insensitive', prebacimo sva slova u mala
t_lower = t.lower()
t_lower

'neka niska nad kojom vežbamo zadatke.'

In [29]:
# pre nego sto opet prebrojimo, izmestimo kod u funkciju
def broj_karaktere(niska):
    d = dict()
    for karakter in niska:
        if not karakter in d: # ako kljuc jos uvek ne postoji u recniku
            d[karakter] = 0 # kad ne bi bilo ovog koraka, u narednoj liniji, pri uvecavanju vrednosti brojaca, kod bi pukao
        d[karakter] += 1 
    return d

In [30]:
# pozovemo funkciju za razlicite niske
a = 'AbRakAdabrAA'
broj_karaktere(a)

{'A': 4, 'b': 2, 'R': 1, 'a': 2, 'k': 1, 'd': 1, 'r': 1}

In [31]:
a = a.lower()
broj_karaktere(a)

{'a': 6, 'b': 2, 'r': 2, 'k': 1, 'd': 1}

In [34]:
s = 'Zašto ne bi niska sadržala i neka slova posebna za našu latinicu, kao i interpunkciju?'
broj_karaktere(s)

{'Z': 1,
 'a': 12,
 'š': 2,
 't': 3,
 'o': 4,
 ' ': 14,
 'n': 8,
 'e': 4,
 'b': 2,
 'i': 8,
 's': 4,
 'k': 4,
 'd': 1,
 'r': 2,
 'ž': 1,
 'l': 3,
 'v': 1,
 'p': 2,
 'z': 1,
 'u': 4,
 'c': 2,
 ',': 1,
 'j': 1,
 '?': 1}

Prilagoditi funkciju `broj_tokena()` koja vraća broj pojavljivanja svih tokena. Token je sekvenca karaktera koji nisu beline.

In [40]:
# brojimo tokene (ako zovemo split bez delimitera, ne brinemo o visestrukim razmacima)
def broj_tokena(niska):

    reci = niska.split()
    
    d = dict()
    
    for rec in reci:
        if rec not in d:
            d[rec] = 0
        d[rec] += 1
    
    return d

In [41]:
# brojimo tokene pozivajuci funkciju
broj_tokena(s)

{'Zašto': 1,
 'ne': 1,
 'bi': 1,
 'niska': 1,
 'sadržala': 1,
 'i': 2,
 'neka': 1,
 'slova': 1,
 'posebna': 1,
 'za': 1,
 'našu': 1,
 'latinicu,': 1,
 'kao': 1,
 'interpunkciju?': 1}