Лого на страниците (малко). Система Orphus
Ако забележите грешка, маркирайте израза с мишката и натиснете Control+Enter. Благодаря!
Разяснения за инициативата glotta
 
Мечтата ми е glotta да стане взаимоучително място, където се събират филолози, информатици, неврофизиолози и специалисти от други области, за да си обменят опит и ресурси.
Защото днес е очевидно онова, което Мирослав Янакиев предвиждаше преди десетилетия — и информатиката, и филологията, и неврофизиологията, и психологията (и много други науки!) са дялове на по-обща дисциплина, на общата семиотика. Янакиев си представяше общата семиотика като наука за всички информационни (семиотични) взаимодействия между човека и околния свят — с другите хора, с живата и с неживата природа.
Съображенията на Янакиев са прости. Всички човешки рецептори са преводачи — те превеждат различни информационни въздействия на един единствен език, на езика на нервната система. От което следва, че всички семиотични системи имат инвариант — eто го предмета на общата семиотика.
Професор Янакиев беше убеден, че филологията е тази наука, която може да разшири предмета си до предмета на общата семиотика. И всичките му усилия бяха насочени в тази посока.
Напълно споделям този възглед — затова и поддържам тези страници.
Убеден съм, че която и публикация на Янакиев да отворите, който и абзац да прочетете от нея, ще намерите в него тема за докторска дисератация. Темата ви ще бъде съвременна, актуална, новаторска, с оглед към бъдещето, тоест ще притежава всички характеристики на сериозната научна разработка.
Което не означава, че непременно трябва да я направите (вижте по този повод разумните съвети на Умберто Еко. Как се пише дипломна работа. София: ИК „Ал. Панов“, 1999.).
Защото образованието е област традиционна. Днес филологът, информатикът, математикът, медикът, психологът или биологът се обучават по съвършено различен начин, почти без допирни точки, та е доста трудно да убедиш всички тези специалисти, че изучават един и същ предмет.
Затова нито напредъкът в изследванията върху висшата нервна дейност, нито създадените от информатиците огромни ресурси с езикова информация оказват някакво съществено въздействие върху филологията; и обратното — изследванията на филолозите са практически безполезни за информатиците (там има дори фолклор — ако искаш да провалиш един проект, включи в него лингвист…), както и за изследователите на нервната система или на някоя друга наука. И резултатите понякога са просто комични, например този „машинен превод“…
Ако филологът вече се е посмял на този „превод“, сега е време да спре и да помисли.
Бързо ще си даде сметка колко голяма, да го кажем направо — огромна е нуждата от лингвистична информация днес, нужда не просто теоретическа, а чисто практическа, ако щете дори, комерсиална. В същото време е очевидно колко неподготвена е съвременната филология да отговори на тази нужда.
Много ще е хубаво да прочетете пак последното изречение от предишния абзац. Аз наистина имам пред вид съвременната филология, а не филологията в България.
Още преди десетилетия Мирослав Янакиев ясно е показал как може и как трябва да се промени това — трябва да се надмогне сегашният изброително-описателен подход към анализа на езиковата практика (който, освен всичко друго, е изпълнен с логически противоречия) и да се замени с подход, основан върху количествени измервания.
Този подход подробно е разработен и усъвършенстван от М. Янакиев и неговите съмишленици и е наречен глотометрически (вижте като начало Стилистиката и езиковото обучение. София, 1977. [[djvu]] [един файл]).
Такава промяна, преди всичко, ще приведе филологическото познание към съвременен научен, тоест — измерим и съпоставим, вид. Така филологията ще може да предоставя данни на други науки, а и да съпоставя резултатите си с резултатитете от други науки.
Намирам това за изключително важно. Ако прекрасната стара наука филология не успее да направи тази промяна, тя просто ще изчезне.
Пред очите ни сега филологическите факултети се превръщат от изследователски центрове в курсове за учене на чужд език.
При това сме принудени да признаем, че всяка „шпионска“ държавна служба има далече по-богат опит в методиката на преподаване на чужд език, отколкото който и да било университетски факултет, тоест, нямаме никакви конкуретни предимства.
Можем засега с известна снизходителност да гледаме как информатиците използват термини като фонема, дума, изречение и как наивно им вярват. Но това няма да е за дълго — тези момчета и момичета са любознателни, четат, мислят и хич не ги мързи!
Я вижте практическите им резултати. Те са получени не поради помощта на филолозите, а въпреки липсата на такава помощ.
Нека обобщя: аз съм оптимист. Филологическото знание няма да изчезне. Няма как да изчезне. Но не съм сигурен, че онези, които ще го използват, ще се наричат филолози.
И докато стане това, ще се повтарят неща, вече правени в древността, в средновеновието, в Просвещението, ще се преоткрива колелото, топлата вода, Америка. Примери за такова „преоткриване“ вече имаме достатъчно.
Празнината, нека направо да го кажа — бездната от незнание между специалистите в различни науки, свързани с обща цел, днес може да бъде запълвана само по взаимоучителната (алилодидактичната) метода.
И дано идеята ви хареса — едно, за да протръгне glotta, второ и по-важно, за да протръгне развитието на общата семиотика.
И понеже и най-дългият път започва с първа крачка, нека да я направим!
 
* * *
Засега включвам в glotta два раздела — Програмно осигуряване и Ресурси.
Смятам също, че разделите Четива и Библиотека са близко свързани с glotta.
В Четива започвам да публикувам „учебни“ текстове. Целта е да се подпомагат читателите да овладеят работата с компютъра и методиката на глотометрията. Всеки ваш текст тук е добре дошъл! Нека текстът ви да е резултат от вашия опит — това гарантира, че ще е полезен и за други.
В Библиотека се опитвам да включвам и текстове в областта на глотометрическите изследвания. Защото глотометрията е филологическа дисциплина — всяко глотометрическо изследване тръгва от филологията, а резултатите от него се възвръщат към филологията, като често показват неотложната необходимост от преосмисляне на основни за филологията понятия. Мисля, че това е различието между глотометрията и сходните „броящи“ дисциплини — лигвостатистика, квантитативна лингвистика, корпусна лингвистика и пр. Но това различие не формира отношение (релация) на противопоставяне между глотометрията и тези дисциплини, а по-скоро на допълнителност, на комплементарност.
 
* * *
Раздела Програмно осигуряване си го представям като набор от малки програми. Разбира се, с отворен код.
На този принцип — малки програми, които вършат едно нещо, но го вършат както трябва — изглежда е замислен UNIX. Но със сигурност на този принцип е изграден най-разпространеният му „дериват“ Linux. И е просто удивително какви сложни обработки на данните можеш да направиш, без да излизаш от текстовия редактор, само като използваш тези малки програмки, включени в операционата система.
Та идеята ми е да се придържаме към този принцип. В информатиката той е известен като принципа KISS, а на български нека да го наречем в чест на всички програми преводачи „Водене Го Прости“ (ВГП).
Правил съм големи програми за обработка на текст, разбира се, с графичен интерфейс. Влагал съм много труд в тях, понякога дори находчивост.
Но ако съм бил по-умен или поне ако съм гледал по-внимателно какво прави Янакиев, нямаше да създавам такива прогромни чудовища.
Всяка програма с графичен интерфейс твърде бързо става прекалено сложна за поддръжка, графичният интерфейс остарява и изисква много грижи. А накрая се оказва, че и програмата не върши кой знае колко много работа…
Та нека разработваме тук програмно осигуряване според принципа ВГП, тоест:
— Нека всяка програмка да прави само едно нещо, но да го прави както трябва.
— Нека разработваме програмките (когато е възможно) като филтри, тоест да поемат входните данни от стандартния входен поток и да пишат в стандартния изходен поток. Това ще дава възможност да се използват самостоятелно в командния ред (включително и в конвейерна обработка) или да се извикват от текстовия редактор.
— Нека програмките да се разработват на съвременните интерпретаторни езици с отворен код — най-добре на пайтън (Python) пък дори само заради съвместимост с инициативата NLTK. При това препоръчвам да се използва Python от серията 3.x – в него е бъдещето. И програмките, които предлагам тук, са разработени точно на Python 3.x.
Читавите текстови редактори дават възможност такива програмки да бъдат включени в тях като „макрокоманди“, а преносимостта на интерпретаторите прави преносими и вашите програми (ако не се правите на пò програмист, отколкото трябва).
О, да… май трябва да разясня… „Преносимост“ означава програмката ви да работи на различни операционни системи (Widows, Linux, Mac OS X) и на различни варианти на операционните системи (32-битови или 64-битови), без да трябва да я преработвате.
— Нека пишем четлив и добре документиран програмен текст. „Сценариите“ (програмите за интерпретаторните езици, англ. scripts) се четата първо от хората и след това от интерпретаторите. Освен това смисълът на отворения код е всеки да може лесно да си адаптира програмата за своите цели, та текстът й трябва наистина да е четлив.
— Аз, понеже не искам да губя време да се занимавам с лицензи, пускам всичко под GPLv3 (GNU General Public License, version 3). Просто съм си прекопирал препоръчителния текст в шаблончето за програми и повече не се занимавам с това.
Този текст ми се струва прекрасен пример за американски юридически жаргон, затова накратко обяснявам за какво става дума.
Може да правите с програмите каквото си искате — да ги четете, да ги изпълнявате, да ги копирате и да ги подарявате на близки и познати, да ги променяте и да ги адаптирате спрямо вашите нужди. Срещу това имате едно задължение — да не „затваряте“ кода на програмата: при всички случаи трябва да предоставяте достъп до оригиналния програмен код. И понеже това задължение е малко обратното на стандартните правила за комерсиални програми (copyright), наричат понякога лицензите за отворен код на GNU copyleft.
И още нещо има уговорено в този лиценз — авторът ви предоставя програмата си с надеждата, че ще ви е полезна, но не носи никаква отговорност за каквито и да било щети — реални или измислени, морални или научни, които ви е причнила употребата на тази програма.
 
* * *
В раздела Ресурси съм включил едно-две неща и смятам да включвам още. Сега предлагам да възстановим банката от килофони (ВКС) на сп. „Съпоставително езикознание“, пък по-нататък — защо не?! — може и да я разширим.
 
* * *
И накрая — един организационен въпрос.
Използвайте за връзка с инициативата glotta електронната поща на страниците. Ако инициативата протръгне, ще мислим за някаква друга, по-удобна форма на комуникация.
Нека да повторя — тук всякакви идеи и всякаква помощ са добре дошли! А от идеите най-хубави са онези, които осъществявате.
 
Александър Иванов