Лого на страниците (малко).

Заглавна страница > glotta > Честотен речник от глотометричния архив

 

Честотен речник от глотометричния архив на катедрата Български език към Софийския университет

Предназначение: Това е текстът на един от шестте речника по 500 килолекси, с които завършва онази грандиозна инициатива на Мирослав Янакиев да се направи Глотометричен архив към катедрата Български език на Софийския университет през 60-те години. Това е правено на ръка, с няколкостотин дипломни работи. Методиката, по която е било направено това, аз накратко съм преразказал в Пътят към един нов хуманизъм.

Отнасяйте се с нужната предпазливост към данните в този файл. Набирал съм го някога на Правец-8 (тоест, без възможност да отбелязвам главни и малки букви). Всички останали украшения — главни и малки букви, ударения, класификатори за части на речта — са поставяни по-късно с всички възможности за човешка грешка. Прибавете към това всички човешки грешки, които са направени преди това в предишните речници.

Например — на групите букви за съгласни и гласни може да се доверите; сигурно може да се доверите и на формантите за лице и число на глагола (ако сами си ги индексирате) или на „показателното т“. Ама на данните за енклитичните форми на местоименията, например, просто не се доверявайте — не са верни. Ако сте преподавател, направете собствен тест с първата дошла група студенти — сами ще се убедите колко достоверни могат да бъдат тези данни.

ИЗТЕГЛЯНЕ: MY_dict_500000a.zip (MD5 353056a20a9031ae60f912c3fbb4de86).

Страница: А. И.
Електронна поща
Дата на публикуване: 22.VII.2014
Последна редакция: 29.IV.2023
Съобразено с
html5/css3