Szóelemző programot futtattak magyar költők verssorain
Közismert állítás, hogy Arany János a legnagyobb szókincsű költőnk. Hogy kiderüljön, ez valóban igaz-e, az Origo a big data technológiával vette górcső alá a verses köteteket: a program darabra pontosan megszámolta, ki hány szót írt le, és ezek közt mennyi egyedi szó szerepelt.
A big data óriási mennyiségű információt képes rendszerezni, értelmezhetővé és elemezhetővé kell tenni. Általánosságban big datáról akkor beszélünk, ha több mint 1 milliárd sornyi adatunk van. „Bár költőink igen termékenyek voltak, ennyit együtt sem tudtak összehozni. Maga a technológia és az adatvezérelt gondolkodásmód azonban segít megérteni azt, amit eddig csak sejtettünk munkásságuk mögött” - írja az Origo. Az Origo Arany János, Petőfi Sándor, Ady Endre, Kölcsey Ferenc, Vörösmarty Mihály és József Attila költészetét vizsgálta.
Arany János a legendának megfelelően tényleg vitte a prímet: élete során 287 425 szót írt le - ha csak a költeményeit számoljuk. Összesen 59 697 egyedi szót használt, ha pedig a ragozott formákat nem tekintjük külön szónak, akkor valamivel több, mint 16 ezret. Ezzel hivatalosan is megnyerte a magyar költők szókincsversenyét. József Attilát is megilleti egy kategóriagyőzelem, hiszen az összes leírt szavához képest arányaiban ő használja a legtöbb egyedi szót (31,26százalék), ugyanez az arány Arany Jánosnál „csak" 20,77 százalék. Összehasonlításképp a magyar nyelvben összesen 60-100 ezer egyedi szó van, egy átlagos értelmiségi egyévnyi beszédét rögzítve körülbelül 25-30 ezer szó fordulna elő.
A legtöbbször használt szavak közt a „szép" jelző minden költőnél előkelő helyen szerepelt, Arany János ezek után legtöbbször a „király", „ember", „nap" kifejezéseket használta. A többi költőnél gyakran előfordult még a „magyar", a „bús" és az „Isten".