Лого на страниците (малко). Система Orphus
Ако забележите грешка, маркирайте израза с мишката и натиснете Control+Enter. Благодаря!
Имена на български граждани (2015)
(трета редакция)
 
ИЗТЕГЛЯНЕ (ТРЕТА РЕДАКЦИЯ: 23 октомври 2016 г.): bg_anthroponyms_2015_III.zip
MD5: fdfd43c3deec27129231ab4fb42bbb34
 
Е, да. Наложи се и трета редакция. Много се надявах да ми се размине, ама не би.
В избирателните списъци за поредния референдум (6 ноември 2016 г.) са включени и общините, за които не можах да намеря данни през 2015 година — Болярово, Завет и Чипровци. Та съм ги прибавил.
Впрочем, става дума за по-малко от 18 хиляди души. Това е по-малко от три десети от процента спрямо целия материал, но пък има няколко имена, които не бяха регистрирани досега.
Тъй като начинът на създаване на списъците за референдумите и начинът, по който аз съм събирал даните, са едни и същи, не виждам причина да мислим, че може да има някакво отклонение в методиката за събиране на данните.
Има и някои дребни уточнения в класификацията по пол.
Ето как изглеждат данните от третата редакция на извадката:
общ брой избиратели — 6 790 104,
общ брой на секциите — 11 381,
мъже — 3 263 730,
жени — 3 506 014,
избиратели, чиито имена не показват ясно пол — 20 360.
ИЗТЕГЛЯНЕ (ВТОРА РЕДАКЦИЯ: 27 юни 2016 г.): bg_anthroponyms_2015_II.02.zip
MD5: 48652da65070ae91f68c315dd29c06c8
 
Забележка: Запазвам тук препратката към втората редакция на данните (с втората корекция), защото съм ги използвал във вече нещо публикувано: Оценка на извадката от имена на български граждани по характеристиката „пол“. Ако сте амбициран и твърдоглав човек (много препоръчвам!), може да преизчислите примерите в този текст с данните от третата редакция. От сега да ви кажа — нищо съществено не се променя, ама практиката ще ви е много полезна.
В тази втора редакция (и втора корекция) на данните са отстранени някои технически грешки, които променят (незначително) и числовите данни, например, броят на избирателите е редуциран с 3970 — от 6 776 318 на 6 772 348. Дори да сте правили вече някакви глотометрични обработки, много е съмнително, че тази промяна ще промени резултатите ви. Но аз съм длъжен да ви предупредя.
Впрочем, населението на страната (данните за края на 2015 година са вече достъпни) се е намалило с 48 хиляди души спрямо 2014 г. Това също налагаше известна редакция на текста по-долу.
По-съществените промени в извадката от имена на български граждани са:
Първо, редактирал съм полето #НАСЕЛЕНО МЯСТО.
Второ, наслагал съм класификатори за пол — m за мъж и f за жена. Повече подробности има по-долу.
Трето, отстранил съм няколко повтарящи се секции:
—  Бургас, секция 044 (беше повторена два пъти);
—  Кърджали, с. Бойно, секция 118;
—  Плевен, с. Радишево, секция 221;
—  Плевен, с. Ралево, секция 222;
—  Брезник, секция 004.
Много ме е яд заради тези повтарящи се секции — аз съм човек с известен опит в обработката на текст и трябваше да се досетя колко лесно е при вмъкване на текст, той да се повтори. Та по-рано трябваше да проверя за повтарящи се секции. Както и да е — това вече е оправено.
Така че изводът е ясен — ако сте чели текста преди последната редакция (27 юни 2016 г.), ще го намерите доста променен.
И малко данни за извадката, събрани на едно място:
общ брой избиратели — 6 772 348,
общ брой на секциите — 11 335,
мъже — 3 254 905,
жени — 3 497 177,
избиратели, чиито имена не показват ясно пол — 20 266.
В раздела „Ресурси“ на glotta предоставям извадка от лични, бащини и фамилни имена на български граждани. Тя е направена върху избирателните списъци за изборите на 25 октомври 2015 година. Използвал съм списъците за референдума, а не за общинските избори, върху които действа — поне на теория — ограничение „за уседналост“, та може да се допусне, че списъците за националния референдум са по-пълни. Но в някои общини не са представени два списъка и в такъв случай е използван списъкът за изборите за общински съветници и кметове.
От всички 265 общини в България обхванати са 262. Не можах да намеря избирателните списъци за общините Чипровци (област Монтана), Завет (област Разград) и Болярово (област Ямбол). Впрочем, избирателите в тези три общини са не повече от 22 хиляди: вж. Таблица на населението по постоянен и настоящ адрес, която предоставя Главната дирекция Гражданска регистрация и административно обслужване на населението за края на 2015 г.
 
Това поставя обаче друг въпрос, граждански: как Централната избирателна комисия е приела резултатите от изборите в тези общини, които не са спазили изискванията на Изборния кодекс, Глава IV, Раздел I Избирателни списъци: „Чл. 24. (1) Избирателните списъци се съставят поотделно за всяка избирателна секция. Предварителните избирателни списъци се обявяват предварително на видно място в района на избирателната секция и се публикуват на интернет страницата на съответната община. Избирателните списъци за гласуване се предават на секционните избирателни комисии в деня преди изборния ден.“
Повтарям: и се публикуват на интернет страницата на съответната община. Което в тия три общини не е изпълнено. Имат ли смисъл изборите в тези три общини, щом не са спазени предварителните изисквания на Изборния кодекс?
(Данните за липсващите общини са допълнени в третата редакция на архива с данни от избирателните списъци за референдума на 6 ноември 2016 г.)
Обхванати са имената на близо шест милиона и осемстотин хиляди български граждани (6 772 348) при население на страната в края на 2015 година от седем милиона и сто и петдесет хиляди (7 153 784 — по данни на Националния статистически институт), тоест извадката обхваща почти 95% от населението на страната. Според данни на Централната избирателна комисия гласоподавателите за националния референдум са не повече от 6 885 893, тоест извадката съдържа 98% от тях.
При работа с тези данни трябва да се държи сметка, че тук липсват имената на деца и младежи под 18 години. Никакво друго „филтриране“ на данните не е правено.
 
Една специфика на антропонимията днес
Съвременните информационни технологии направиха много чудеса. Едно от тях пряко засяга антропонимията. То превърна антропонимията в донякъде уникален филологически обект — почти изцяло наблюдаем обект.
Още през 80-те години проф. Николай Ковачев обръща внимание, че антропонимията трябва да използва данните, съдържащи се в Единната система за гражданска регистрация и административно обслужване на населението (ЕСГРАОН), създадена у нас, в България, през 1977 година. Какво се отбелязва в тази единна система за всеки един от нас, може да видите на страницата на ГД ГРАО (Главна дирекция Гражданска регистрация и административно обслужване). Системата се обновяваше ежеседмично, а сега — ежедневно, следователно за този период (от 1977 г. насам) може да извеждате от нея изключително детайлизирани данни.
Ама всяка една от съседните ни страни има подобна система за регистрация на гражданите си — тоест, няма ограничения за съпоставителни изследвания със съседите ни на Балканите на равнище антропонимия поне в синхронен план.
Ако се размечтаем, можем да си представим дори световен антропонимен атлас, при това с глотометрични (количествени) данни. Това днес е в голяма степен осъществимо.
Разбира се, данните в ЕСГРАОН са „лични“, върху тях действа ограничителен режим и не са общодостъпни. Но една институция (държавна или университетска) може да се регистрира като „оператор на лични данни“ и да има достъп до тях, следователно промените в антропонимната система могат да се следят буквално ежедневно.
Е, да се следи чак ежедневно надали е необходимо — антропонимната система все пак е част от езиковата система и промените в нея стават бавно и постепенно. Разбира се, ако не изследваме срамните „преименувания“, на които нашата история през XX век е достатъчно богата. Само като пример вижте Евгения Благоева. За имената и преименуванията на българските мюсюлмани (1912–2000), при това тук не става дума за роми, черноморски гърци, арумъни, каракачани.
Та „засичане“ на данните от ЕСГРАОН през година, две, три, та дори пет ще ни даде достатъчно подробни данни, за да смятаме антропонимната система за (почти) изцяло описана в синхронен план, а съпоставките между тези „засичания“ биха могли да изведат някакви тенденции, ако съществуват.
При това за обработка на тези данни не се изискват кой знае какви ресурси — мое убеждение е, че поддръжката на един общодостъпен антропонимичен архив, използващ данните от ЕСГРАОН (и не само оттам), е по силите на един-единствен, но добре квалифициран филолог.
Е, естествено, една университетска или държавна институция непременно ще обособи това като звено, ще назначи съответните началници, които да му пречат. Но това е неизбежно според закона на Паркинсон (Сирил Нарткот Паркинсон, IV закон: „Броят на хората в работна група нараства независимо от количеството работа“).
Доколкото обаче това (следене на антропонимната информация чрез ЕСГРАОН) не е направено, предоставените от мене данни донякъде запълват тази празнина. Впрочем, опити да се използват данните от ЕСГРАОН вече има — вж. Т. Калканова. Популярно ли е твоето име, 1996 (2004), но те не са в необходимата и възможна пълнота.
В последните години интересът към антропонимията изглежда е до известна степен изместен от интереса към топонимията (вж. обзорната статия на Мария Ангелова-Атанасова. Тезаурусът на българската топонимия — реализация и перспективи. В: Състояние и проблеми на българската ономастика, т. 12. Университетско издателство „Св. св. Кирил и Методий“, Велико Търново, 2012, [pdf] с. 11–27).
И това изместване на интересите в ономастиката изглежда разумно — при скоростта, с която се обезлюдяват големи райони в България, топонимията, особено микротопонимията просто изчезва, стопява се. Та усилията в тази насока са необходими и трябва да се насърчават. Но не съм сигурен, че това трябва да става за сметка на антропонимията.
В същото време Николай Ковачев в Честотно-тълковен речник на личните имена у българите. Д-р Петър Берон, София, 1987 [djvu] [един файл] отчита архив от близо два милиона и осемстотин хиляди лични имена на деца, родени в периода от 1901 до 1970 година, тоест в период преди създаването на ЕСГРАОН. Неговите последователи в Центъра по българска ономастика „Проф. Николай Ковачев“ към Великотърновския университет са привели този архив в електронен вид и е крайно наложително да го направят достъпен по интернет. Това ще стимулира не само изследванията в антропонимията, но и обучението и квалификацията на млади специалисти в тази област.
 
Структура на данните в тази извадка
Архивът съдържа 265 директории, наименувани по общините в България. Както вече казах, три от директориите (Chiprovci, Zavet и Bolyarovo) за съжаление останаха празни.
При наименованието на директориите съм използвал предложената от М. Янакиев транскрипция. Сега давам минималните необходими сведения за нея:
 
ъ — w
ь, й — y
я — ya
ю — yu
ц — c
з — z
ш — sh
щ — sht
ж — zh
 
Не се използват латинските букви j и x; не се използват и никакви диакритични знакове.
Във всяка директория има текстов файл с име text_all.txt — кодировка UTF-8 и с край на реда 0x0A (десетично 10) както в системите, подобни на UNIX. В него е събрана информацията за всички избирателни секции в дадената община — оттам и наставката _all.
Преди списъка на лицата във всяка избирателна секция има служебна, описателна („мета“)информация, която съдържа следните пет полета (редът за съответното поле започва непременно със знак # пред името на полето):
#ИЗБОРЕН РАЙОН — това поле е винаги попълнено. Изборните райони съвпадат общо взето с областите (28 на брой). Но Пловдив (град) е обособен като изборен район от съответната област, а София (град) е разделен допълнително на три изборни района. Така се обособяват 31 изборни района.
#ОБЩИНА — това поле е винаги попълнено. В трите най-големи общини — Варна, Пловдив и София — има обособени административни райони, които са отбелязани в списъците в това поле, та бройката на „общините“ (295) излиза по-голяма от 265 въпреки трите пропуснати общини.
#КМЕТСТВО — това поле в списъците доста е затруднило общинските администрации. То би трябвало да се попълва само ако населеното място е кметство или административно е включено към друго населено място със статут на кметство. Вместо това в много случаи са попълвали тук механично името на населеното място, а другаде са написали дори коментар „няма статут на кметство“. Така че на данните от това поле в избирателните списъци не бива да се възлагат много надежди.
#НАСЕЛЕНО МЯСТО — това поле е попълнено в повечето случаи, но в 164 случая беше празно. Впрочем това е твърде нисък процент — около 1.4%. Във втората редакция на данните аз попълних това поле по предишното посочено населено място в списъка и грешката няма да е голяма, дори ако става дума за „подвижна“ избирателна секция.
Понякога в полето #НАСЕЛЕНО МЯСТО се посочват няколко селища — това са сравнително близки селища с малко избиратели, та са събрани в една избирателна секция.
Информацията в това поле беше въведена по много разнообразни начини — графичните съкращения (с., гр., кв., ж.к., ман.) най-често се изписваха с главни букви и най-често след точката нямаше шпация. Имената на селищата също най-често се изписваха с главни букви. Това е практика в ЕСГРАОН, която отразява техническите възможности от 70-те години (в крайна сметка всички избирателни списъци тръгват от ЕСГРАОН). Когато тук бяха изброени няколко селища, съвсем не беше задължително след запетайката да има шпация. За разнообразие вместо запетайка понякога се използваше съюзът и. В общините често бяха редактирали и допълвали тази информация, та можеше да се срещнете с всички възможни нееднаквости при оформление на текст.
Сега във втората редакция на данните аз донякъде съм нормализирал съдържанието на това поле. Имената на селищата са изписани с главни и малки букви според установения правопис (Малко Брягово, но Голяма долина; Капитан Андреево, но Стоян-Заимово и пр.). Когато в това поле са изброени няколко селища, те се изброяват със запетайка (и шпация), без да се използват съюзи. Съкращенията с., гр., кв. и ман. са изписани с малки букви и след точката винаги има шпация. Съкращението ман. се използва еднократно — в община Рила са обособили избирателна секция в Рилския манастир.
#СЕКЦИЯ — това поле е задължително: номер на избирателната секция. Тук данните също бяха доста разнообразно форматирани, но аз съм ги уеднаквил така: <шпация><№><шпация><номер>. Номерът на избирателната секция винаги е трицифрен с водещи (лидиращи) нули, напр. 001, 019 и т. н.
След тези пет полета следва списъкът с имена на избирателите в съответната секция.
Имената са изписани само с главни букви (вече споменах, че това е исторически реликт от 70-те години, когато са създавани базите с данни на ЕСГРАОН). Това не е пречка за филологическото изследване — нека да си дадем сметка, че разликата между главни и малки букви съществува само в писмената фиксация на речта и на тази разлика не отговаря никаква „речева реалност“. Тоест в писмената фиксация на речта ние добавяме допълнителна информация (синтактична, морфологична или стилистична), която в речта просто не се изразява по този начин. Изключително прецизен анализ на асиметрията между речта и писмената й реализация има у Мирослав Янакиев (вж. Основы теории орфографии, 1963 и Теория орфографии и речь, 1964).
Известен проблем (не чак толкова значителен) създава „триименната“ система на именуване на български граждани. Всички ние сме вписани в документите с по три имена — лично, бащино и фамилно. Тази административна практика е въведена у нас след Освобождението от руската окупационна администрация, която прави първите списъци на населението след Освобождението.
На тази практика са подчинени и повечето мюсюлмански имена, като към бащиното и фамилното име обикновено се поставят и българските словообразувателни наставки с окончание за род, например: Айсел Исметова Абдулова, Шефкет Ахмедов Халилов.
Но в нашата народностна практика бащино име ние фактически не използваме. Може да сте приятел с някого от десетилетия и да нямате представа какво е бащиното му име. Такава („двуименна“) е практиката и на околните ни балкански народи.
Та не е чудно, че в списъците са включени и хора само с лично и фамилно име. В преобладаващия брой случаи между личното и фамилното име са оставени две шпации — просто полето за бащино име е останало празно. Но имаше и случаи, когато личното и фамилното име се разделят само с една шпация. В тези случаи аз съм удвоил шпацията, та полето за бащино име да остава празно.
Всички тези случаи са относително малко — около 88 хиляди, тоест 1.3% от материала, а при обработката им не възникват технически трудности.
Прави впечатление, че значителна част от тези имена са мюсюлмански, фамилиите са оформени без наставка -ов и родово окончание и са групирани предимно в Североизточна България и Източните Родопи, та може да се допусне, че това са възстановените имена на български турци. За да се провери тази хипотеза обаче, трябват допълнителни данни. Което може да се окаже трудновато — наред с другите престъпления, извършени около тъй наречения „възродителен процес“, бяха „прочистени“ и унищожени много архиви по кметства и общини, включително и данни в ЕСГРАОН.
Също малобройни — под 6000 — са случаите на повече от три имена. Голямата част от тях са на съпруги, добавили към бащината си фамилия и фамилията на съпруга си без дефис или името и фамилията на съпруга си; понякога фамилията е съставна — Айт ел Хаж, Бен Абделмалек, Ван ден Хувел, Дел Вайе, Ди Оливера, Фон Крауз и пр. Друга причина са повече от едно лично име, отново изписани без дефис: Ана Мария, Дианамари София, Екатерина Свидна, Линда Барбара, Павел Мирослав, Сара Клавдия, Филип Александър и пр.
В случаите с повече от едно лично име (без дефис) аз съм се постарал да ги обединя с подчертаващо тире: ИВАН_ЛЕОНАРДУС, ЯНА_МАРИЯ и пр. Това облекчава обработките по-нататък, а от друга страна, подчертаващото тире винаги може да бъде заменено с шпация. Впрочем, става дума за редки случаи — под 4000 в извадката.
В някои случаи можем да допуснем и прибавяне на псевдоним като втора фамилия, напр. Сакакушев-фон Бисмарк или Йордан Янков Йорданов-Янислав Янков. Това не е изключено, въпреки че в бланката за лични данни на ЕСГРАОН е предвидена отделна графа за псевдоним.
И най-накрая — тук влизат и вероятни технически грешки, например, съвсем буквално: КРИСТОФ СЛАВЕЙКОАЛБЕР ЕРИК РОБРЕХТ.
 
Допускам, че в отделни случай това не са технически грешки, а е подигравка с „административните правила“, вижте Наредбата за гражданското състояние, публикувана в Държавен вестник, бр. 75 от 30.09.1975 г.: „Въвежда се забрана за вписване на новородено в акта за раждане с две или с повече лични имена или с умалително или галено лично име“.
Към това бяха раздали по общините „именник“ с внушение (при онези условия, практически — със заповед) на децата да се дават само „чисти български имена“. Това, разбира се, беше част от „възродителния процес“, та не си мислете, че той не засягаше цялото население на страната. Може да си съставите донякъде представа как изглеждаше този „именник“ по изданието Заимов, Й. Български именник. София, Издателство на Българската академия на науките, 1988, 1994, 2004.
При спорове между гражданите и администрацията в крайна сметка решаваща дума имаше Институтът за български език, най-вече Секцията за съвременен български език. Но в института работеше и Владко, и Кармен, и Будьони, и Роланда, и Ема-Даниела, и Розали — все специалисти, които нямаше как да бъдат регистрирани според административните измишльотини на властите. И нямаме основание да мислим, че някъде другаде нещата са били различни. Ето защо служителите „по места“ обикновено проявяваха здрав разум.
Та е твърде възможно така да са се появили и записите АЛЕКСАНДЪРТЕОДОРПИЕР, ДЖЕНИФЕРИВАВИЛХЕЛМИНА и пр. — те дословно се съобразяват със забраните в цитираната наредба.
При изписването на имената ще срещнете всякакви варианти — и Кольо (6586) и Колю (2836), и Кръстьо (2075) и Кръстю (2871), двойни съгласни извън морфемна граница (Анна, Мохаммед, Теккан, Фаикк), двойни гласни за предаване на дължина (Каан, Марооф, Нааджие, Феерди), ер малък (ь) във всякакви позиции, дори в начална — Ьозлем, Ьозтюрк, Ьотиен (общо — 19), нерегламентирана употреба на и с кратка (й) — Акйол, Вутйова, Йлдъз, Севалй и пр.
При имена на руснаци, сърби и македонци ясно личи стремеж да се запази оригиналният правопис на кирилица — Александар (1611 — предимно в Благоевград, Кюстендил, Петрич), Васильев (14), Ильинична (4), Крстоски (1), но и Крсте (4) и петнадесетина варианта на фамилното име Крстич/-евск(и/а)/-ев(а). По-слабо е изразено това в имена, които трябва да се транслитерират от латиница към кирилица — например, Пиньейро.
Повтарям, става дума за редки явления (като изключим конкуренцията между окончанията -ьо/-ю при едносрични мъжки имена на мека съгласна).
И все пак — защо точно при антропонимите се появяват такива значителни отклонения от „правописната норма“? В други области на лексиката — например, в терминологията, където процесите на заемане на чужда лексика са дори по-интензивни — такива значителни отклонения няма да срещнете. Струва си да се потърсят причините за това.
Друго ново във втората редакция на извадката е, че са поставени класификатори за пол: 3 497 177 за жени (f), 3 254 905 за мъже (m) и 20 266 са оставени неопределени (n). Тук, разбира се, n не означава среден род, а просто полът не е можело да се определи по фо́рмата на името.
Класификаторът е поставен след името на избирателя, като разделител между името и класификатора е табулаторът. Това е практика в glotta при създаването на списъци и речници — вижте в Методиката раздела Списъчно представяне на текста и формат на данните.
Няма съмнение, че като съм поставял класификаторите за пол, съм допускал грешки. Причините за това са много. Очевидно е, че тези грешки ще могат да бъдат отстранени, когато антропонимията започне да си сътрудничи с ЕСГРАОН. Засега мога само да ви уверя, че тези грешки не въвеждат значими отклонения в данните. Смятам да напиша и текст, където това ще се обсъжда по-подробно.
 
Какво има и какво няма в тази извадка
Преди всичко липсва, разбира се, възрастта на избирателя, тоест от тези данни не може да правите „диахронни“ наблюдения върху антропонимията. Когато антропонимията започне да си сътрудничи с ЕСГРАОН, тази информация ще може лесно да бъде набавена.
Като по-тежък недостатък аз оценявам липсата на ударения. Дали КОЦЕ е [коц`е] или [к`оце] няма как да се определи по тези данни. Тази липса няма да се запълни и от сътрудничество с ЕСГРАОН — нашата писменост не задължава да се отбелязват ударенията.
Така че не мислете, че антропонимията е „изчерпана“ със създаването на ЕСГРАОН — място за теренна работа остава много. И не само остава, ами просто има много работа за вършене.
 
Съвсем не става дума само за ударенията, чиито разлики — повече или по-малко — са описани в диалектологията: те са само част от проблематиката.
Помислете, моля, за произхода на антропонимите. В тази област целият ни (много голям!) етимологически опит няма почти никакъв смисъл.
Мога да го кажа по-привлекателно — антропонимията е област на съвременната семиотика в най-широк смисъл, както я разбира Мирослав Янакиев. Работата в тази област е невъзможна без привличане на историческа, културна, фолклорна, социологична и психолингвистична информация.
Нека да го илюстрирам с познат на всички пример.
Никакви фонетични закони, никакви познати ни морфологични трансформации и зависимости не могат да обяснят как в съвременния български език от Александър правим Сашо.
За щастие историята ни е позната — Александър започва да става популярно име в България около Освобождението под влияние на руския език, а след Освобождението и под влияние на княз Александър Батенберг — срв. Фердинанд (177), Фердинандка (3) и Фердо (83), — а не на гръцката култура, въпреки гръцкия си произход. И знаещите руски сега ще се сетят: Александр > Алексаша > Саша. Ама това става в руски, де, не в български. Формата Саша е трудно приемлива в българския език — за нас това е име на момиче, на жена. И така е осмислена — в извадката има близо 1400 Саши (макар че при стотина от тях, все пак със Саша се назовават мъже). Та за мъжкото име сме заменили окончанието с и получаваме Сашо (по данни от извадката шест пъти по-разпространено от женското име Саша, но със Сашка заедно разликата намалява).
Да направим сега един мислен експеримент — представете си, че това заемане е станало преди векове, че сме забравили връзката между Александър и Сашо. Каква етимология ще можем да предложим за Сашо? И можем ли да бъдем сигурни днес, че много трудно обясними или съвсем необясними лични имена не са минали по някакъв подобен път на трансформации?
Ето защо големият български филолог и лексикограф Стефан Илчев, като съставя Речника на личните и фамилни имена у българите (София, БАН, 1969) [djvu] [един файл], възприема точно такъв интердисциплинарен (днес е по-модерно да се нарича антроположки) подход: той привлича и фолклорен, и исторически материал, и семейни спомени, когато е възможно.
И все пак Стефан Илчев завършва Предговора към речника си така: „Въпреки дългогодишното събиране и проучване в речника има непълноти и недостатъчно убедителни тълкувания, които не можаха да бъдат избегнати. В тази област предстои още много да се работи.“
Повтарям: В тази област предстои още много да се работи.
А какво има в тази извадка?
Преди всичко има достоверна количествена информация.
Ние можем да бъдем сигурни, че една тройка антропоними (лично име, бащино име, фамилно име) отговаря на един-единствен човек, дори ако се повтарят и трите имена. Впрочем, българската традиция в именуването на момчета често довежда до съвпадение между трите имена на дядо и внук.
При преобладаващия брой случаи извадката ни дава информация за бащино име. В българската антропонимия има само най-общи наблюдения за връзката между имената на баща и дете — извадката ни дава възможност да им придадем количествен вид.
Количествените данни могат да бъдат съпоставяни с вече публикуваните от проф. Николай Ковачев (Честотно-тълковен речник на личните имена у българите. София, 1987) за първите 70 години на XX век. Съпоставките сигурно могат да бъдат още по-полезни и подробни, ако Центърът по ономастика към Великотърновския университет даде достъп до електронните си ресурси чрез интернет. А те не са малко — вж. Мария Ангелова-Атанасова. Електронните бази данни на Центъра по българска ономастика като основа за научно сътрудничество. В: Състояние и проблеми на българската ономастика, т. 13. Университетско издателство „Св. св. Кирил и Методий“, Велико Търново, 2013, [pdf] с. 801–805).
В началото на 2006 г. Георги Чорбаджийски публикува данни за извадка в размер малко повече от един милион лични и фамилни имена [html]. Тя е направена върху телефонните указатели за стационарните телефони на БТК на 24 предимно по-големи общини в страната през 2002 г. Достъпни са (като текстови файлове) както изходните данни, така и резултатите от количествените обработки, които е направил Георги Чорбаджийски. Тези данни също са много полезни за съпоставки, но като се държи сметка за спецификата на извадката.
 
Нека да очертая някои особености, с които филологът би трябвало да се съобрази, ако използва данни от тази „телефонна“ извадка.
По онова време за да придобиеш стационарен телефон, трябваше да имаш жилище. Придобиването на жилище беше трудно и отнемаше значително време. А като придобиеш жилище и пуснеш молба за телефон, можеше да чакаш с години, има случаи — с десетилетия. Тоест, в телефонния указател младите хора са силно орязани.
Ако дядо е успял да прокара телефон, синът му никак не бърза да смени името на „абоната“. Внукът — също. Защото сметките си текат, плащаш ги и телефонът работи. А да актуализираш името на абоната беше изключително сложно и губещо време административно приключение.
Тоест, ние със сигурност знаем, че тази извадка от антропоними е изместена назад във времето, но е доста трудно да определим колко.
Тъй като все пак се случваше някой да има повече от един телефонен пост, количествените данни съдържат и известен „шум“, който е трудно да бъде изчистен. Бащините имена се посочват само с инициал, но пък понякога има и бележки за професия.
В извадката, която предоставям тук, има подробна информация за географията на антропонимите, та тя е основа за доста подробни географски антропонимични карти. Дори в големите градове антропонимите могат да се локализират по квартали. Аз не очаквам това да донесе някаква смислена информация, но дали наистина е така?
И най-накрая — извадката съдържа антропонимите на българските мюсюлмани, а това е област, към която българската антропонимия е в дълг. Не са ми известни никакви количествени изследвания върху имената на българските мюсюлмани, ако изключим най-общите наблюдения в материалите за медиите, които публикува веднъж годишно Националният статистически институт [pdf].
Събрал съм този материал и го публикувам само за изследователски цели. Моля, не забравяйте дори за миг, че зад всяко име стои реален човек — може да сте вие, може да ви е роднина, познат или приятел. Не забравяйте това, докато обработвате материала, а още повече — когато публикувате резултатите си.
Нека да го кажа още по-ясно — дръжте се прилично, моля!
А. Иванов