dunszt.sk

kultmag

Számítógépes algoritmussal dekódolhatják a holt nyelveket

Számos kutatás bizonyítja, hogy a valaha létezett nyelvek legnagyobb részét már nem beszélik. A holt nyelvek szerkezetének megfejtése nagy kihívás elé állítja a kutatókat, akiknek annál nehezebb a dolguk, minél kevesebb rokon nyelvvel és saját korpusszal rendelkezik a vizsgált holt nyelv. A massachusetts-i CSAIL (Computer Science and Artificial Intelligence Laboratory) munkatársai azonban most egy olyan algoritmust hoztak létre, amely megoldást jelenthet mindezekre a problémákra.

A lineáris B vagy szótagírás

A számítógépes algoritmus ugyanis képes arra, hogy úgy rekonstruáljon egy nyelvet, hogy nem ismeretes annak rokon nyelve. Az algoritmus többek között azon a nyelvtörténeti ismereten alapul, amely szerint a nyelvek továbbfejlődése mindig valamilyen törvényszerűséget követ. Így például előfordulhat, hogy egy nyelv „p“ hangzója a változása során „b“-vé alakul, ám az szinte elképzelhetetlen, hogy „k“ hang legyen belőle, mert az említett hangok kiejtésében áthidalhatatlan különbség van. Az algoritmus ezen ismeretek alapján létrehoz egy olyan teret, amelyben ezek a variációk előfordulhatnak, majd szegmentálja az így kapott nyelvmodellt.

A projekt a kutatók előző tevékenységén alapul, amelynek során sikerült megfejteni az ugariti nyelvet és a lineáris B írást, az említett nyelvek azonban egyértelmű kapcsolatot mutattak a héber, illetve a görög nyelv korai formáival, így a dekódolás egyszerűbb volt. A kutatók a nehézségek ellenére remélik, hogy többet megtudhatnak az ibériai nyelvről is, amelynek eredete máig bizonytalan.

Az eredeti cikk itt olvasható.

Ha tetszik, amit csinálunk, kérünk, szállj be a finanszírozásunkba, akár csak havi pár euróval!

Támogass minket