Hizkuntzalaritza kuantitatibo

Hizkuntzalaritza kuantitatiboa (HK), hizkuntzalaritza orokorraren azpidiziplina bat da. Hala ere, esan dezakegu oso lotura estua duela hizkuntzalaritza matematikoarekin. Azpidiziplina honek, honako esparru hauek hartzen ditu kontuan, esate baterako, hizkuntzen ikasketa, hizkuntza aldaketa, hizkuntzen erabilera eta hizkuntza desberdinen egiturak. HKren helburu nagusia, hizkuntza bat aztertzea da, metodo estatistikoak erabiliz, hizkuntza baten inguruko legeak sortzeko asmoz. Esan bezala, HKren oinarria, hizkuntzaren emaitza estatistikoak dira.

Emaitza estatistiko horiek atera eta aztertzerako orduan, honako bi esparruek sekulako garrantzia dute. Alde batetik, corpus-hizkuntzalaritzak, eta, beste aldetik, hizkuntzalaritza konputazionalak. Bi esparru hauekin ziurtasun enpirikoa lortzen da, hots, behaketa eta esperimentazioaren bidez jasotzen den jakinduria.

Historia

Hizkuntzalaritza kuantitatiboaren inguruko oinarriak antzinako Grezian eta indiar munduan finkatu ziren. HKri buruz informazioa jasotzen den lehenengo iturrietan, konbinatoria eta hizkuntzaren artean dauden loturak jasotzen dira ^[1]. Beste iturri batzuek, estatistikaren oinarri nagusiak jasotzen dituzte, hizkuntzarekin nolabaiteko lotura eginez. Aipatutako iturri hauek, ^[2]estikometriarekin lotura zuzena dutela esan daiteke, hots, antzinako greziarrek eta erromatarrek asmatutako prozesu bat, liburuen luzera neurtzeko. Neurketa hori, liburuan jasotako lerro-kopuruaren zenbatzean oinarritzen da.

Hizkuntza-legeak

Hizkuntzalaritza kuantitatiboan, lege deritze, hipotesi teorikoetatik abiatuta ondorioztatzen diren ideiei. Ideia bat lege bilakatzeko, matematikoki adierazita egotea ezinbestekoa da, eta, dagoeneko eremu horretan definituak dauden beste lege batzuekin erlazioa izan behar du. Gainera, sortutako lege berria, datu enpirikoetan oinarritu behar da, hots, esperientzian oinarritutako datuetan. Köhler psikologoak HKren legeei buruz idazten du: "Gainera, osagai linguistikoen ezaugarriak lege unibertsalen bitartez froga daitezke, matematikoki, natur zientziak bezala. Kontuan izan behar da, testuinguru honetan, lege hauek estokastikoak direla, hau da, lege horiek ez dira kasu guzti-guztietan aztertzen. Benetan aztertzen dena honakoa da: zerbait gertatzeko probabilitate edo proportzioa. Beraz, kasu batzuetan, erraza da kontraadibideren bat topatzea. Esan daiteke, lege bakoitza, kuantitatiboki definitzen dela. Egoera honek ez dakar natur zientzietan aldaketarik. Izan ere, aspaldi aldatu zen ikuspuntu determinista hura, hots, eredu estatistiko-probabilistikoek izugarrizko indarra hartu zutenean".^[3]

Zenbait hizkuntza-lege

Hainbat eta hainbat dira gaur egun proposatzen diren hizkuntza-arauak. Atal honetan, horietako batzuk besterik ez dira adieraziko. ^[4]

Dibertsifikatzearen legea: maila linguistikoak, esate baterako, diskurtso baten zatiak, era desberdinetan agertzen dira. Ondorioz, testuetan agertzen diren hitzen maiztasunak, arau desberdinekin kontrola daitezke.
Luzera banaketak: testu edota hiztegietan, edozein motatako unitate linguistikoen maiztasunak aztertzen direnean, hainbat banaketa sortzen dira. Banaketa horiek, unean aztertzen ari den unitate linguistikoaren motaren menpe egongo dira. Orain arte, honakoak dira aztertu diren unitate linguistikoak:
- Morfemen luzeraren banaketa-legea.
- Unitate erritmikoen luzeraren banaketa-legea.
- Perpausen luzeraren banaketa-legea.
- Silaben luzeraren banaketa-legea.
- Hitzen luzeraren banaketa-legea.

Badira beste elementu linguistiko batzuk ere zenbait arau aplikatzen zaizkienak, esate baterako, zailtasun desberdinetako letrei (karaktereei). Arau berberak aplika dakieke iraupen desberdineko soinuei.

Martin-en legea: lege hau, hiztegietan ageri diren hitzen esanahietan oinarritzen da, behin esanahi horiek topatuta, hainbat kate-lexiko osatuz. Ondoren, behin hitzen esanahiak aztertuta eta hitz desberdinen esanahien arteko loturak ezarrita, egitura hierarkiko bat osatzen da. Egitura hierarkikoa osatzen denean, lortzen dena zera da: hitzen esanahi orokorragoak, honako proportzioan: hitzen orokortasuna handitu ahala (eraikitako hierarkian gora egin ahala), hitzen esanahi kopurua murriztuz doa.
Menzerath-en legea (kasu askotan, Menzerath-Altmann-en legea bezala ere ezagututa, Paul Menzerath eta Gabrien Altmann-en omenez): lege honek dioenez, eraikitzaile linguistiko baten handitzea eraikitzaile horren zati txikien baturaren berdina da, eta alderantziz. Adibidez, esaldi bat gero eta luzeagoa izan (luzera hori, esaldia osatzen duten hitz kopuruaren arabera neurtzen da), esaldi hori osatzen duten hitzak orduan eta motzagoak izango dira (hitzen luzera, hitzak dituen hizki kopuruaren arabera neurtzen da). Altmannen arabera (1980), lege hau matematikoki adierazi daiteke, honela:

$y=a\cdot x^{-b}\cdot e^{-cx}$

non,
- y, eraikitzailearen tamaina den (adibidez, silabaren luzera).
- x, aztertzen ari garen esaldia osatzen duten hitz bakoitzaren silaba kopurua den.
- a, b, eta c, konstanteak diren.

Maiztasun mailaren araberako legea: berez, ia edozein unitate linguistikok, honako ezaugarriekin zerikusia dute. Kasu honetan, adibide batzuk soilik emango dira, hots, adierazgarrienak.
- Testu batean ageri diren hitzak, agerpen-kopuruaren (maiztasunaren) arabera antolatzen dira, eta, agerpen-kopuru zehatzaren arabera, hitz bakoitzari, maila eta maiztasun zehatz bat esleitzen zaio. George Kingsley Zipf hizkuntzalari eta filologoak ("Zipf-en Legea"-ren asmatzailea) esandakoaz geroztik, maiztasun mailaren inguruko eredu matematiko ugari proposatu dira.
- Antzeko banaketak azter daitezke soinu, fonema eta letren maiztasunetan oinarrituz.
- Hitz-elkarketak: hitzen elkarketa bidez sortutako hitzen maiztasunak.

Hizkuntza aldaketaren legea: hizkuntzaren hazkundea dakarten prozesuek, esaterako, hizkuntza baten hiztegiaren (lexikoaren) etengabeko hazkundeak, atzerriko hizkuntzetatik jasotako hitzak, HKn oso ezaguna den lege bat betetzen dute, Piotrowski-ren legea deiturikoa. Piotrowskiren legea, eredu logistiko bat da (ikus. ekuazio logistiko).
Testu blokeen legea: unitate linguistikoek, hala nola, hitzek, hizkiek, funtzio sintaktikoek, maiztasunaren banaketa zehatz bat erakusten dute testu-bloke handietan.
Zipf-en legea: hitzen maiztasuna, maiztasun-zerrendetan duten mailarekiko alderantzizko proportzionala da. ^[5]

Estilistika

Estilo poetiko zein ez-poetikoen ikasketa metodo estatistikoetan oinarritu daiteke; gainera, zenbait lege jarraitzen dituzten estilo desberdineko testuen ikerketa jakin batzuk egin daitezke. Kasu horietan, HKk ikerketa estilistikoaren alde egiten du. Honen helburu nagusietako bat, hizkuntza-legeen ikerketa, ahal den neurrian, ahalik eta objektiboena egitea da. Hizkuntzalaritza kuantitatiboaren lege batzuek, adibidez, hitzen luzeraren banaketa-legeak, hainbat ereduren beharra eskatzen dute balorazio bat egiterako orduan. Gainera, testu motaren arabera, ez da modu berean aplikatzen lege bat. Izan ere, aztertzen ari garen testua zein motatakoa den jakitea ezinbestekoa da, ezer analizatzen hasi baino lehen. Amaitzeko, testu poetikoak, HKk eskainitako metodoen bitartez aztertzen ari badira, HKren metodo horiek, literaturaren ikasketa kuantitatiboaren azpidiziplina osatzen dutela esan dezakegu (estilometria). ^[6]

Autore garrantzitsuak

Gabriel Altmann (1931-2020) ^[7]
Otto Behaghel (1854–1936); cf. Behaghel's laws
Karl-Heinz Best ^[8]^[9]
Sergej Grigor'evič Čebanov (1897–1966) ^[10]
William Palin Elderton (1877–1962) ^[11]
Gertraud Fenk-Oczlon ^[12]
Ernst Wilhelm Förstemann (1822–1906) ^[13]
Wilhelm Fucks (1902–1990) ^[14]
Peter Grzybek (1957-2019) ^[15]
Gustav Herdan (1897–1968); ^[16]^[17]
Luděk Hřebíček (1934) ^[18]
Friedrich Wilhelm Kaeding (1843–1928) ^[19]
Reinhard Köhler ^[20]
Werner Lehfeldt (1943) ^[21]
Viktor Vasil'evič Levickij (1938–2012) ^[22]
Haitao Liu ^[23]
Helmut Meier (1897–1973)
Paul Menzerath (1883–1954), ^[24] cf. Menzerath's law
Sizuo Mizutani (1926) ^[25]
Augustus de Morgan (1806–1871).
Charles Muller, Straßburg ^[26]
Raijmund G. Piotrowski ^[27] ^[28]
L.A. Sherman
Juhan Tuldava (1922–2003) ^[29]
Andrew Wilson, Lancaster ^[30]
Albert Thumb (1865–1915) ^[31]
George Kingsley Zipf (1902–1950); cf. Zipf's law
Eberhard Zwirner (1899–1984). Phonometry ^[32]

Bibliografia

Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4.
Reinhard Köhler with the assistance of Christiane Hoffmann: Bibliography of Quantitative Linguistics. Benjamins, Amsterdam/ Philadelphia 1995, ISBN 90-272-3751-4.
Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8.
Haitao Liu & Wei Huang. Quantitative Linguistics：State of the Art, Theories and Methods. Journal of Zhejiang University (Humanities and Social Science). 2012，43(2)：178–192. (In Chinese.)

Erreferentziak

↑ N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, pp. 109–136.
↑ Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, pp. 48–54.
↑ cf. note 1, pp. 1–2.
↑ cf. references: Köhler, Altmann, Piotrowski (eds.) (2005)
↑ H. Guiter, M. V. Arapov (eds.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. {{ISBN|3-88339-244-8}}.
↑ Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 325-348, esp. Quantitative Stilistik, pp. 339–340. {{ISBN|3-11-015578-8}}; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, {{ISBN|978-3-9802659-5-9}}.
↑ Grzybek, Peter, & Köhler, Reinhard (eds.) (2007): Exact Methods in the Study of Language and Text. Dedicated to Gabriel Altmann on the Occasion of his 75th Birthday. Berlin/ New York: Mouton de Gruyter
↑ de:Benutzer:Dr._Karl-Heinz_Best
↑ index
↑ de:Sergei Grigorjewitsch Tschebanow
↑ Best, Karl-Heinz (2009): William Palin Elderton (1877-1962). Glottometrics 19, p. 99-101 (PDF ram-verlag.eu).
↑ Homepage_Gertraud Fenk
↑ de:Ernst Förstemann; Karl-Heinz Best: Ernst Wilhelm Förstemann (1822-1906). In: Glottometrics 12, 2006, pp. 77–86 ( PDF ram-verlag.eu)
↑ Dieter Aichele: Das Werk von W. Fucks. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, pp. 152–158. ISBN 3-11-015578-8
↑ Peter Grzybek :: Homepage : Home / Kontakt Archived September 29, 2012, at the Wayback Machine.
↑ de:Gustav Herdan
↑ Herdan dimension - Laws in Quantitative Linguistics
↑ de:Luděk Hřebíček
↑ de:Friedrich Wilhelm Kaeding
↑ Universität Trier: Prof. Dr. Reinhard Köhler
↑ Georg-August-Universität Göttingen - Lehfeldt, Werner, Prof. em. Dr
↑ Festschrift on the occasion of the 70. anniversary: Problems of General, Germanic and Slavic Linguistics. Papers for 70th Anniversary of Professor V. Levickij. Herausgegeben von Gabriel Altmann, Iryna Zadoroshna, Yuliya Matskulyak. Books, Chernivtsi 2008. (No ISBN.) Levickij dedicated: Glottometrics, Heft 16, 2008 (PDF ram-verlag.eu); Emmerich Kelih: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Viktor V. Levickij. In: Naukovyj Visnyk Černivec’koho Universytetu: Hermans’ka filolohija. Vypusk 407, 2008, pp. 3–10.
↑ Human-Language-Computer - staff Homepage, ZJU
↑ Karl-Heinz Best: Paul Menzerath (1883-1954). In: Glottometrics 14, 2007, pp. 86–98 (PDF ram-verlag.eu)
↑ Shizuo Mizutani; Portrait on the occasion of his 80. anniversary in: Glottometrics 12, 2006 (PDF ram-verlag.eu); about Mizutani: Naoko Maruyama: Sizuo Mizutani (1926). The Founder of Japanese Quantitative Linguistics. In: Glottometrics 10, 2005, pp. 99–107 (PDF ram-verlag.eu).
↑ Charles Muller: Initiation à la statistique linguistique. Paris: Larousse 1968; German: Einführung in die Sprachstatistik. Hueber, München 1972.
↑ Rajmund G. Piotrowski, R.G. Piotrovskij; cf. Piotrowski's law: http://lql.uni-trier.de/index.php/Change_in_language
↑ de:Piotrowski-Gesetz
↑ Journal of Quantitative Linguistics 4, Nr. 1, 1997 (Festschrift in Honour of Juh. Tuldava)
↑ Dr Andrew Wilson - Linguistics and English Language at Lancaster University
↑ de:Albert Thumb
↑ de:Eberhard Zwirner

Kanpo estekak

IQLA - International Quantitative Linguistics Association

Datuak: Q2198157
Multimedia: Computational linguistics / Q2198157

[1] N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, pp. 109–136.

[2] Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, pp. 48–54.

[3] . note 1, pp. 1–2.

[4] . references: Köhler, Altmann, Piotrowski (eds.) (2005)

[5] H. Guiter, M. V. Arapov (eds.): Studies on Zipf's Law. Bochum: Brockmeyer 1982. {{ISBN|3-88339-244-8}}.

[6] Alexander Mehler: Eigenschaften der textuellen Einheiten und Systeme. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, p. 325-348, esp. Quantitative Stilistik, pp. 339–340. {{ISBN|3-11-015578-8}}; Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. Lüdenscheid: RAM-Verlag 2008, {{ISBN|978-3-9802659-5-9}}.

[7] Grzybek, Peter, & Köhler, Reinhard (eds.) (2007): Exact Methods in the Study of Language and Text. Dedicated to Gabriel Altmann on the Occasion of his 75th Birthday. Berlin/ New York: Mouton de Gruyter

[8] :Benutzer:Dr._Karl-Heinz_Best

[9] x

[10] :Sergei Grigorjewitsch Tschebanow

[11] Best, Karl-Heinz (2009): William Palin Elderton (1877-1962). Glottometrics 19, p. 99-101 (PDF ram-verlag.eu).

[12] Homepage_Gertraud Fenk

[13] :Ernst Förstemann; Karl-Heinz Best: Ernst Wilhelm Förstemann (1822-1906). In: Glottometrics 12, 2006, pp. 77–86 ( PDF ram-verlag.eu)

[14] Dieter Aichele: Das Werk von W. Fucks. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, pp. 152–158. ISBN 3-11-015578-8

[15] Peter Grzybek :: Homepage : Home / Kontakt Archived September 29, 2012, at the Wayback Machine.

[16] :Gustav Herdan

[17] Herdan dimension - Laws in Quantitative Linguistics

[18] :Luděk Hřebíček

[19] :Friedrich Wilhelm Kaeding

[20] Universität Trier: Prof. Dr. Reinhard Köhler

[21] Georg-August-Universität Göttingen - Lehfeldt, Werner, Prof. em. Dr

[22] Festschrift on the occasion of the 70. anniversary: Problems of General, Germanic and Slavic Linguistics. Papers for 70th Anniversary of Professor V. Levickij. Herausgegeben von Gabriel Altmann, Iryna Zadoroshna, Yuliya Matskulyak. Books, Chernivtsi 2008. (No ISBN.) Levickij dedicated: Glottometrics, Heft 16, 2008 (PDF ram-verlag.eu); Emmerich Kelih: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Viktor V. Levickij. In: Naukovyj Visnyk Černivec’koho Universytetu: Hermans’ka filolohija. Vypusk 407, 2008, pp. 3–10.

[23] Human-Language-Computer - staff Homepage, ZJU

[24] Karl-Heinz Best: Paul Menzerath (1883-1954). In: Glottometrics 14, 2007, pp. 86–98 (PDF ram-verlag.eu)

[25] Shizuo Mizutani; Portrait on the occasion of his 80. anniversary in: Glottometrics 12, 2006 (PDF ram-verlag.eu); about Mizutani: Naoko Maruyama: Sizuo Mizutani (1926). The Founder of Japanese Quantitative Linguistics. In: Glottometrics 10, 2005, pp. 99–107 (PDF ram-verlag.eu).

[26] Charles Muller: Initiation à la statistique linguistique. Paris: Larousse 1968; German: Einführung in die Sprachstatistik. Hueber, München 1972.

[27] Rajmund G. Piotrowski, R.G. Piotrovskij; cf. Piotrowski's law: http://lql.uni-trier.de/index.php/Change_in_language

[28] :Piotrowski-Gesetz

[29] Journal of Quantitative Linguistics 4, Nr. 1, 1997 (Festschrift in Honour of Juh. Tuldava)

[30] Dr Andrew Wilson - Linguistics and English Language at Lancaster University

[31] :Albert Thumb

[32] :Eberhard Zwirner

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]