June 19th, 2013

Аватара 2013

Оценка вашего словарного запаса в эсперанто // Pritaksado de via Esperanta vortprovizo

    ru:
Мои читатели, вероятно, помнят об интересном тесте, относительно быстро и легко определяющем приблизительный словарный запас тестируемого на английском языке (мой результат оказался около 6660 слов). Мне внезапно захотелось хотя бы как-нибудь, хотя бы через одно место, хотя бы весьма приблизительно определить, сколько слов я знаю на эсперанто. Методику пришлось находить и разрабатывать самому. Берём словник NPIV (взято отсюда), с помощью небольшой бейсиковской программы удаляем все производные от корней и все имена собственные, включая буквы алфавита. В результате имеем более-менее достоверный (но и большой) корпус эсперантских корней (это важно! не слов, а именно корней!), общее количество которых у меня (ну, если я нигде ничего не запорол) составило 13785. Там, разумеется, полно узкоспециализированных терминов и прочей ерунды, которая мне в жизни никогда не пригодится. Тем не менее — это наш радикарий. Дальше пишем на Бейсике ещё одну простенькую программу, которая из этой генеральной совокупности создаёт случайную выборку в 100 элементов. Почему сто? Ну, это и не мало, и не слишком много. Если нужно, изменением одного параметра можно создавать выборки любого размера, если кому интересно. Далее смотрим на эту случайную выборку и честно, не подглядывая в словарь, подсчитываем, сколько корней (повторяю, речь идёт исключительно о корнях!) нам знакомо (положим, x корней). Полагаем, что данный результат можно перенести на генеральную совокупность; таким образом общее количество корней, знаемых вами, будет равняться 13785*(x/100). Вуаля! :) За деталями и подробностями идём под кат.

    eo:
Miaj ruslingvaj legantoj verŝajne memoras pri la interesa testo, kiu facile kaj rapide pritaksas la proksimuman vortprovizon de la testato pri la angla lingvo (mia rezulto estis ĉ. 6660 vortoj). Mi subite ekdeziris almenaŭ iomete, almenaŭ tra-fike, almenaŭ proksumumege determini, kiom da vortoj de Esperanto mi konas. La metodikon mi elpensis kaj elprovis mem. Ni prenu la vort-kolekton de NPIV (ĉi tie), per eta bazika programo forigu ĉiujn derivaĵojn kaj proprajn nomojn inkluzive liter-nomojn. Rezulte ni havas pli-malpli fidindan (kaj samtempe grandan) populacion da Esperantaj radikoj (tio gravas! temas ne pri vortoj, sed pri la radikoj!), kies suma kvanto laŭ mi estas 13785 (eble mi ie iomete fuŝis, sed espereble ne). Kompreneble, tie multegas fakaj terminoj kaj cetera redundaĵo, kiu neniam utilos por mi. Tamen, tio estas ja nia radikokolekto. Poste mi skribis per Baziko plian simplan programeton, kiu kreas el tiu ĝenerala populacio samplon/muestron el 100 elementoj. Kial cent? Nu, tio estas kaj malmulte, kaj ne tro multe. Ĉebezone oni povas per ŝanĝo de unu parametro krei muestrojn de ajna grandeco, se iu interesiĝas. Poste ni rigardu al tiu muestro kaj senfraŭde, sen rigardi la vortarojn kalkulu, kiom da radikoj (mi ripetas: temas nur pri la radikoj!) ni konas (supozite x). Ni plue koncedu, ke la rezulton oni povas ĝeneraligi por la tuta populacio; tiel la entuta kvanto de la radikoj konataj al vi egalos al 13785*(x/100). Hop! :) Por pli da detaloj eniru la kaŝparton.


Collapse )