Лого на страниците (малко). Система Orphus
Ако забележите грешка, маркирайте израза с мишката и натиснете Control+Enter. Благодаря!
Честотен речник от глотометричния архив на катедрата Български език към Софийския университет
 
Предназначение: Това е текстът на един от дванадесетте речника по 500 килолекси (общо около 6 милиона думи), с които завършва онази грандиозна инициатива на Мирослав Янакиев да се направи Глотометричен архив към катедрата Български език на Софийския университет през 60-те години. Това е правено на ръка, с няколкостотин дипломни работи. Янакиев казваше — осемстотин. Методиката, по която е било направено това, аз накратко съм преразказал в Пътят към един нов хуманизъм.
Отнасяйте се с нужната предпазливост към данните в този файл. Набирал съм го някога на Правец-8 (тоест, без възможност да отбелязвам главни и малки букви). Всички останали украшения — главни и малки букви, ударения, класификатори за части на речта — са поставяни по-късно с всички възможности за човешка грешка. Прибавете към това всички човешки грешки, които са направени преди това в предишните речници.
Например — на групите букви за съгласни и гласни може да се доверите; сигурно може да се доверите и на формантите за лице и число на глагола (ако сами си ги индексирате) или на „показателното т“. Ама на данните за енклитичните форми на местоименията, например, просто не се доверявайте — не са верни. Ако сте преподавател, направете собствен тест с първата дошла група студенти — сами ще се убедите колко достоверни могат да бъдат тези данни.
 
ИЗТЕГЛЯНЕ: MY_dict_500000a.zip (MD5 353056a20a9031ae60f912c3fbb4de86).