Keelerühmad
Registri eesmärk on anda põhiinfo keelte kohast lingvistilises klassifikatsioonis, seetõttu on kogu ainestik jagatud keelerühmade kaupa. Keelerühma tähis on vähemalt kahetäheline, neist esimene suur, teine väike, järgnevad suurtähed või numbrid täpsustavad asukohta keelerühmas. Nt Ie tähistab indoeuroopa keelkonda, IeG germaani keeli, IeG1 põhjagermaani keeli.
Linguae andmebaasis on kasutusel järgmised keelerühmade põhitähised: Aa = austroaasia hõimkond, Ad = Andamani keelkond, Ae = Andi-ekvaatori suurhõimkond, Af = afroaasia keelkond, Al = Altai keelkond, An = austroneesia hõimkond, Ar = tehiskeeled, At = asteegi-tano hõimkond, Au = Austraalia keeled, Ca = Kaukaasia hõimkond, Dr = draviidi keelkond, Ea = eskimo-aleuudi keelkond, Gp = žee-pano-kariibi suurhõimkond, Ho = hoka hõimkond, Hu = hurri keeled, Ie = indoeuroopa keelkond, Ii = hõimkonnavälised ja isoleeritud indiaani keeled, Is = isoleeritud keeled, Ja = Jaapani keeled, Kh = khoisani keelkond, Ma = makroalgonkini hõimkond, Mc = makrotšibtša hõimkond, Ms = makrosiuu hõimkond, Nd = naa-dene hõimkond, Nk = Nigeri-Kordofani hõimkond, Ns = Niiluse-Sahara hõimkond, Om = oto-mange hõimkond, Pa = paleoaasia keeled, Pe = penuti hõimkond, Pp = Paapua keeled, Sg = viipekeeled, St = hiina-tiibeti keelkond, Ur = Uurali keelkond, xxx = liigitamata keeled, kirjad ja rahvad. Vt ka keelerühmade täisloendit.
Registrikirje struktuur
Registris on Sõnaveebi Linguae andmebaasis esinevad eestikeelsed märksõnad. Kirje struktuur täiskujul on järgmine:
- keele, kirja või rahvarühma liikme nimetus ~ sünonüümid, sh vananenud (van) (endanimetus, inglise või rahvusvaheline vm nimetus) ISO kood. Kiri: kasutatav kirjasüsteem. Rahvas: keelele vastav rahvas
ainsuses
(st rahvaliige), mitmuses. Asuala: asukohariik või -riigid. Kõnelejaid: keele kõnelejate ligikaudne arv. ♦ Märkused.
Kirjad: keelega seotud kirjad, sh kirjastiilid.
Murded: keele murded vm variatsioonid.
Rahvad: keelega seotud rahvarühmad.
Lisasümbolid:
- † hääbunud keel, ajalooline kiri või rahvas;
- *aegunud või hüpoteetiline keelerühm;
- ° muudatus, võrreldes Linguae senise andmebaasiga, mida viimati uuendati 2013;
- ⁺ uus kanne, võrreldes Linguae senise andmebaasiga.
Igas alajaotises loetletakse kõigepealt üldmõisted, seejärel keeled, kirjad ja rahvad.
Kirje koostisosade selgitus
Keele, kirja või rahvarühma liikme nimetus. Eestikeelne märksõna ja valikuliselt selle kasutatavad sünonüümid, vananenud vasted on tähistatud lühendiga van. Kui vaja, antakse nurksulgudes ja kursiivis eesti hääldus, nt Gagnoa [ganj`oa].
Endanimetus, inglise, rahvusvaheline vm nimetus. Esitatakse sulgudes ja kaldkirjas, eri keelte valik eraldatud semikooloniga. Endanimetus võib olla IPA transkriptsioonis (vt selle eestikeelset koondtabelit), see antakse alati nurksulgudes ja püstkirjas. Kui keel kasutab muud kirja kui ladina, antakse kõigepealt originaalkirjapilt, seejärel selle ümberkirjutus ladina kirja KNABis kasutusel oleva süsteemi kohaselt. Endanimetus võib ka puududa, seetõttu on ta paremaks eristuseks tähistatud ⓔ-tähega nimetuse ees. Teisena antakse inglise nimetus koos variantidega, esikohal tavaliselt standardis antud. Kolmandana võidakse anda mingi piirkonnas olulise keele variant. Variantide puhul kasutatakse täpsustavaid lühendeid või sümboleid:
- eksl – ekslikult (st ebaõigesti samastatud)
- hrv – harva
- van – vananenud, vananenult
- var – variant, variandid
- vig – vigaselt
- ¡ – halvustav nimetus
ISO kood. Kasutatakse koode järgmistest standarditest:
- ISO 639-1 – kahetähelised keelekoodid, nt et (eesti keel)
- ISO 639-2 – enamlevinud keelte ja keelerühmade kolmetähelised koodid, nt est (eesti keel), fiu (soome-ugri keeled); kümmekond koodi on kahes variandis: terminoloogiline (eelistatud) ja bibliograafiline, nt deu ja ger (saksa keel)
- ISO 639-3 – kõigi keelte kolmetähelised koodid, nt udm (udmurdi keel)
- ISO 639-5 – keelerühmade kolmetähelised koodid, nt urj (Uurali keeled)
- ISO 15924 – kirjade esisuurtähega neljatähelised koodid, nt Latn (ladina kiri)
Kolmetähelised keelekoodid võivad seega pärineda standardi kolmest osast, kuid et nad on unikaalsed, st kordumatud, siis vastuolusid ei teki, igal koodil on oma kindel tähendus. Kui keelel on mitu koodi, esitatakse need kaldkriipsuga eraldatult, nt et/est (eesti keel). Kui koode on kolm, siis järjekorras teine on terminoloogiline, kolmas bibliograafiline, nt de/deu/ger (saksa keel). Keelekoodide kehtivust ja põhiandmeid saab kontrollida järgmiselt lingilt, kui keelekood aae asendada otsitava koodiga: https://iso639-3.sil.org/code/aae.
Kiri. Kirjasüsteem(id), mida keele kirjapanekuks tarvitatakse, nt ladina.
Rahvas. Keelele vastav rahvas, esitatakse kahes vormis, ainsuses (rahvaliikmenimetusena) ja mitmuses (rahvanimetusena), nt eestlane, eestlased. Võõrkeelte vasted püütakse anda samuti ainsuse vormis, ent võivad esineda ka mitmuse vormis, kui ainsust ei ole usaldusväärselt võimalik kindlaks teha.
Asuala. Peamised riigid, kus keele kõnelejad asuvad, üldjuhul tähestikjärjestuses. Sulgudes võib olla lisatud haldusüksuse nimi, vahel ka täpsem asukohakirjeldus. Laiemaid määratlusi (maailmajagu, maailm) kasutatakse juhul, kui tegemist on mitme riigi alaga või ei ole asukoha täpsustus riigi tasandini otstarbekas.
Kõnelejate arv. Ümardatud hinnang, esialgu 2009.–2013. a kindlaks tehtud seisuga. Põhiallikaks on olnud Ethnologue’i andmebaas. Juhul, kui andmeid on 2022. aastast alates uuendatud, on kõnelejate arvule lisatud nurksulgudes võimaluse korral kõnelejate arvu dateering (st mis aastast andmed pärinevad) ning noole järel allikas (E = Ethnologue, W = Wikipedia) ja aastaarv, millal uuendus on tehtud (st millal andmeid on kontrollitud), nt 40 000 [2015 < W, 2022] (st arv 40 000 pärineb aastast 2015 ja see on üle kontrollitud Wikipediast aastal 2022).
Märkused. Eelkõige leiab siin mainimist, kas tegu on nn makrokeelega (katusterminiga, mille alla arvatakse mitu keelt) või makrokeele osaks oleva keelega. (Makrokeelte kohta lähemalt vt andmebaasi sissejuhatusest.)
Anna tagasisidet