Zipfov zakon

Avtor: Leandro Alegsa

07-12-2021 22:51

Zipfov zakon je empirični zakon, oblikovan s pomočjo matematične statistike, poimenovan po jezikoslovcu Georgeu Kingsleyju Zipfu, ki ga je prvi predlagal.

Zipfov zakon pravi, da je pri velikem vzorcu uporabljenih besed pogostost katere koli besede obratno sorazmerna z njenim položajem v frekvenčni tabeli. Tako je pogostost besede n sorazmerna z 1/n.

Tako se bo najpogostejša beseda pojavljala približno dvakrat pogosteje kot druga najpogostejša beseda, trikrat pogosteje kot tretja najpogostejša beseda itd. Na primer, v enem od vzorcev besed v angleškem jeziku predstavlja najpogostejša beseda "the" skoraj 7 % vseh besed (69.971 od nekaj več kot 1 milijona). V skladu z Zipfovim zakonom je na drugem mestu beseda "of", ki predstavlja nekaj več kot 3,5 % besed (36 411 pojavitev), sledi ji beseda "and" (28 852 pojavitev). Za polovico besed v velikem vzorcu je potrebnih le približno 135 besed.

Enako razmerje se pojavlja pri številnih drugih lestvicah, ki niso povezane z jezikom, na primer pri razvrstitvi mest po številu prebivalcev v različnih državah, velikosti korporacij, dohodku itd. Felix Auerbach je leta 1913 prvič opazil pojav porazdelitve na lestvicah mest po številu prebivalcev.

Ni znano, zakaj Zipfov zakon velja za večino jezikov.

Vprašanja in odgovori

V: Kaj je Zipfov zakon?

O: Zipfov zakon je empirični zakon, ki pravi, da je pogostost besede v velikem vzorcu obratno sorazmerna z njenim položajem v frekvenčni tabeli.

V: Kdo je predlagal Zipfov zakon?

O: Zipfov zakon je prvi predlagal jezikoslovec George Kingsley Zipf.

V: Kako Zipfov zakon pojasnjuje pogostost besed v vzorcu angleških besed?

O: Po Zipfovem zakonu se najpogostejša beseda v vzorcu angleških besed pojavi približno dvakrat pogosteje kot druga najpogostejša beseda, trikrat pogosteje kot tretja najpogostejša beseda itd. Ta trend se nadaljuje z zmanjševanjem ranga besede.

V: Kolikšen odstotek vseh besed predstavlja najpogostejša beseda v vzorcu angleških besed?

O: V nekem vzorcu angleških besed najpogostejša beseda ("the") predstavlja skoraj 7 % vseh besed.

V: Kakšno je razmerje med številom besed, potrebnih za polovico vzorca, in pogostostjo teh besed?

O: V skladu z Zipfovim zakonom je za polovico besed v velikem vzorcu potrebnih le približno 135 besed.

V: Za katere druge lestvice velja Zipfov zakon?

O: Enako razmerje, kot ga Zipfov zakon opisuje pri pogostosti besed, se pojavlja tudi pri drugih lestvicah, ki niso povezane z jezikom, na primer pri razvrstitvi prebivalstva mest v različnih državah, velikosti korporacij in dohodkovnih lestvicah.

V: Kdo je opazil pojav porazdelitve na lestvicah mest po številu prebivalcev?

O: Felix Auerbach je leta 1913 prvi opazil pojav porazdelitve na lestvicah mest glede na število prebivalcev.

Iskati