Лого на страниците (малко).

Заглавна страница > Библиография > Как може да се използва автоматичната обработка на текстовете в обучението по български език

 

Мирослав Янакиев

Как може да се използва автоматичната обработка на текстовете в обучението по български език

В: сп. Български език и литература, София, 1985, № 2, с. 15–21.
Текстът тук е сверен и по публикацията в сб. Лингвистиката и езиковото обучение, София, 2007, с. 208–415.

 

В последно време поевтиняването на електронноизчислителната техника осигури материална основа за масовото й използване вкъщи и в училище. Появиха се рекламни названия на новите все поевтиняващи прибори за автоматично обработване на текст — названия, които създават впечатление, че става дума за апаратура, предназначена за математици-изчислители: „индивидуални компютри“, „персонални компютри“, „домашни компютри“.

В действителност тези компютри са уреди, които при наличие на джобен програмируем калкулатор има толкова смисъл да бъдат използвани за смятане в училище и вкъщи, колкото има смисъл „да стреляме по муха с топ“. Джобният програмируем калкулатор е специално пригоден за изпълняване на изчислителни програми, на него много по-лесно се и правят такива програми. Подобен джобен калкулатор струва не повече от 200 долара и е напълно достъпен да задоволи всички нужди на инженер, физик, математик изчислител. Разбира се, „персоналният компютър“ може да върши работата и на джобния програмируем калкулатор (впрочем напоследък и тези калкулатори започнаха да наричат „джобни компютри“), но главното предназначение на „персоналните компютри“ не е да правят изчисления. В ноемврийската книжка на сп. Scientific American (превеждано изцяло в СССР на руски език под название „В мире науки“) за 1984 г. е публикувана статия от един от челните специалисти по информатика в САЩ Тери Виноград, която започва така:

Широката публика смята компютрите за математически машини, разработвани с цел да изпълняват числени сметки. В действителност компютрите представляват езикови машини: основата на тяхното могъщество е способността им да манипулират лингвистични знакове-символи, на които е приписан някакъв смисъл. Естественият език (езикът, на който хората разговарят и пишат програмите за компютрите) заема фактически централно място в информатиката“.

В оригинала на статията срещу „информатиката“ (термин, който взимам от руския превод на статията) стои „Computer science“. Без тази бележка не би било ясно противопоставянето на „естествени“ и „изкуствени“, т. е. „компютърни“ езици (в термина „информатика“, наука, наричана в САЩ „компютърна наука“, не се съдържа дума, която да поддържа илюзията, че имаме работа с наука само за „езиците на програмиране“!).

Една от причините, поради които във Франция се въздържат да наричат компютрите „компютри“, е именно в това, че имаме работа с апарати, които умеят много повече от простото смятане. Там наричат компютрите ordinateurs, т. е. ’подреждачи’ (и не е важно в случая как се обяснява конкретноисторически това название; важно е, че то така се осъзнава).

Ако си дадем точна сметка какво ни е най-трудно да правим, когато се занимаваме с езиково обучение, веднага ще разберем огромната помощ, която е в състояние да ни окаже компютърът, когато искаме да повишим ефективността на работата си.

 

Какво днешният личен компютър може да върши по-добре от учителя?

Все още се изказват мнения, че използването на компютри в обучението може да доведе до „дехуманизация“ (при това обикновено не се уточнява „дехуманизация“ на какво). Да се опитаме да си представим езиковото обучение съставка по съставка, за да видим основателни ли са тези опасения не изобщо, конкретно.

Най-напред можем да си помислим, че ако вместо си пишат, учениците „начукват“ съчиненията си на клавиатурата на личния компютър, от това ще пострада изработването на „културен почерк“. Това е вярно, но само отчасти, но да приемем на първо време, че е съвсем вярно. Да се запитаме за какво му е на днешния млад човек „културен почерк“. У нас вече се смята за „некултурно“ да пишем документи на ръка.

На много места изобщо не приемат ръкописни молби. Да не говорим даже, че нито във вестник, нито в списание ще ви приемат ръкописен материал. Даже писма до близки младите все по-често пишат на машина. Наистина някои формуляри се попълват на ръка, но пък се изисква да ги попълваме „с печатни букви“, а когато пишем „с печатни букви“, както е известно, „почеркът“ почти не се проявява.

Да видим сега какви са предимствата на „начуканото“ на клавиатурата на личния компютър съчинение. На една магнетофонна касета, която поема 60 мин. запис от компютър с характеристиките на нашия Правец, може да се запише текст, равен по обем на текст, който може да се побере на поне 30 стандартни машинописни страници (30 реда по 60 удара на ред, т. е. около 300 български думи на страница). За една минута компютърът може да запише на касетофон и когато е нужно да „прочете“ от него около 200 български думи текст. За още минута-две компютърът може да провери има ли в текст с такъв обем правописни грешки, да ги предложи на вниманието на учителя или ученика, даже да учи индивидуално ученика да не продължава да повтаря грешки от едни и същи типове.

Не е тайна, че за учителя е скучно да проверява правописните грешки в писмените работи на учениците. Освен това човек не забелязва всички правописни грешки. Още по-трудно е да се осигури постоянно следене на „правописното развитие на всеки ученик“ и да се управлява то разумно и търпеливо от страна на учителя. А компютърът от типа на Правец, апарат за обработка на текстове, е специално пригоден за такъв вид операции — той не се уморява, не се ядосва, не ругае, но и не забравя допуснатите от ученик правописни грешки. Нещо повече — компютърът може да „прави обобщения“ на правописно равнище, да насочва вниманието на учителя към най-често допусканите от учениците грешки.

Какво остава на учителя при така организирано компютърно съдействие? Остава му ролята на експерт арбитър, който трябва да предприема мерки за подобряване грамотността на учениците отчасти пак с помощта на компютъра.

И само така да се използват личните компютри в обучението по български език, ще се запълни изцяло работното им време, което за разлика от човешкото работно време може да достигне и 24 часа на денонощие. Но личните компютри може да се натоварят и с подготовка на данни за по-обективно обосноваване на оценките, които дава учителят на ученическите съчинения.

Анализът на рецензиите, които придружават числените оценки на ученическите съчинения, свидетелства, че тези оценки не се опират на някои количествени показатели, чието изразяване „в число“ е по силите на личния компютър. Често се повтаря в рецензиите позоваване на богатство, разнообразие или обратно — на бедност, еднообразие на израза или „езика“. А тъй като „богатството, многообразието на езика на съчинението“ зависят в значителна степен от обема му, оценки от типа „богат език“, „разнообразен израз“ се дават обикновено на по-дълги изречения.

В действителност „разнообразието на израза“ и обемът на съчинението са в по-сложна зависимост, която може да бъде прекрасно изследвана (най-напред) и използвана (впоследствие) при оценяването на ученическите съчинения с помощта на компютри. Определянето на многообразието на израза в ученическите писмени съчинения „на ръка“ е толкова трудна работа, че си позволяваме да го оценяваме „на око“, като по правило подценяваме учениците, които умеят да пишат и кратко, и в същото време разнообразно. За личния компютър определянето и обема на съчинението, измерен с най-различни мерни единици (букви, думи, изречения), и на изразното му многообразие, също измерено с различни мерни единици (словоформи, речникови единици), е работа, която той е специално пригоден да върши.

По-трудно е за личния компютър да определя колко често се използват в едно ученическо съчинение различни видове думи (глаголи, съществителни, прилагателни, местоимения). Причината обаче не е в „несъвършенството“ на компютъра. Значителни са различията, които се появяват, когато различни езиковеди, даже високо ерудирани, трябва да отнесат към един или друг вид думи частите на текста. Но и тук компютърът може да помогне — можем да му предпишем да отнася едни и същи части на текста към различни морфологични видове думи и след това да проверяваме коя класификация най-много съответства на поставената числова оценка на съчинението.

Така стигаме до възможността да се използва компютърът за снемане на количествени показатели от големи текстови масиви при вариране на класификационните критерии, като се съвместват резултатите от тази работа с масови анкети, извършвани от учениците.

Участието на учениците в набирането на анкетен материал за обработка на компютър има особено важно възпитателно значение за тях. Езикознанието днес може да разчита на нови постижения, ако се занимава с изследване на начините, по които множества, големи множества хора приемат или отхвърлят езиковите факти (това е проблематика на така наречената социолингвистика). Набирането на социолингвистични наблюдения в достатъчен обем, че да се получат от тях надеждни изводи, до най-последно време беше нецелесъобразно, тъй като обработката им изискваше неразумно много време и изчислителен труд. С помощта на личния компютър времето за обработване на масови социолингвистични наблюдения се съкращава до разумни срокове. Остава само такива материали да се съберат и обобщаването им, извличането на изводи се осъществява практически веднага. Чрез участие в набиране на социолингвистически наблюдения учениците могат да привикнат да определят общественото си поведение, като се опират на познаване на социологическата ситуация, получавано чрез наблюдения, подобни на социолингвистичните.

Учителят по български език може да се превърне в главен организатор на социолингвистическата дейност на учениците си, чрез която да възпитава у тях активен стремеж да търсят с точни социолингвистични методи мнението на обществото. Едно е да си въобразяваш, че „всички“ мислят като тебе, друго е да знаеш, след като са ти известни резултатите от конкретно социологично проучване, кои мислят така и колко приблизително са те.

 

Засега с компютъра „разговаряме“ чрез клавиатурата му

Слабо място на днешния личен компютър е необходимостта да му съобщаваме всичко, което искаме от него, чрез натискане на клавишите на клавиатурата му. За някои компютри от класа на Правец вече може да се доставят за петдесетина долара така наречените синтезатори на говор, които дават възможност на компютъра да произнася кратки, произволно набрани от вас фрази, и то с „човешка интонация“, но все още наличните компютри са „глухи“ за човешкото говорене.

Наистина, след като сме „начукали“ някакъв текст на клавиатурата на компютъра, както беше казано, ние можем да го запишем на магнетофонна касета, но ако искаме да получим обратно записания на касетата текст, нужно е значително време. За да се намира бързо и се прави бързо достъпен за четене пределен дял от голям текст, например някаква речникова статия, с компютъра се свързва така нареченото дисково устройство (флопи), чрез което на така наречените меки дискове (дискети) може много по-бързо да се запише значително повече текст, отколкото на магнетофонната касета. Текст с обем 200 български думи се записва на диска не за минута (както на касета), а само за 2–3 секунди. И на един диск може да се запише български текст с общ обем поне 80–90 стандартни машинописни страници, т. е. 20–30 хиляди думи. А съществуват дискови устройства, които записват на мек диск с диаметър 12–13 см. до 100 хиляди думи български текст, т. е. над 300 стандартни машинописни страници.

Но най-важното предимство на магнитните дискове е, че всяка нужна част от текста (от средата, от края му) компютърът може да „вземе“ от диска и да покаже на екрана на телевизор или даже да прочете най-много 5–6 секунди след като сме я поискали. Другояче казано, дискета може да изпълнява ролята на речник, в който се съдържа учудващо компактно записана информация, практически мигновено достъпна за нуждаещия се от нея. И при това съдържанието на един диск (ако записалите го не са взели специални мерки да попречат) за броени минути може да бъде откопирано на друг диск.

Ако искаме да прехвърлим правописните, тълковните, правоговорните и всякакви терминологични речници, от които нашето общество черпи речникова информация, на дискове, доколкото такова прехвърляне може да стане само чрез клавиатурата на компютъра, разумно ще е за тази цел да използваме учениците. При добра организация на работата с помощта на учениците, които, като набират речниците, ще се научат на доброкачествен контакт с компютъра, ще живеят със съзнанието, че дават малък, но личен принос в решаването на важна национална задача, може да се свърши добра работа, неизпълнима по друг начин.

А ползата от създаването на такъв пълен речников архив на магнитен носител ще бъде огромна — най-малко за това, защото подобен архив ще може лесно не само да се размножава, като се копира автоматично, но и да се освежава, като се допълва с данни и се видоизменя („да се актуализира“ — казват в информационните центрове).

 

Всеки ученик — програмист

Във всички изброени дотук форми за използване на личните компютри в обучението по български език отреждат на учениците ролята на повече или по-малко активни помощници при решаване на големите задачи, които стоят пред цялото ни общество и могат да бъдат осъществени с участието на много-много хора, като се изпълняват програми, подготвени от програмисти-ентусиасти. Но личният компютър дава прекрасни възможности на ученика, на младия човек и за индивидуални творчески изяви в езиковото обучение и самообучение.

Учениците са склонни да строят „модели“ на самолети, на кораби, да монтират и ремонтират уреди от типа на радиоприемниците и касетофоните, да проектират и шият или плетат облекло. На някои прави удоволствие да съчиняват песни, стихове, художествена проза, да пишат сценарии, да търсят нови начини за постигане на успехи в спорта. И проектите на мнозина така си и остават нереализирани, понеже на младия проектант не стига физиологическа годност да ги реализира — ръцете или гласът не се подчиняват достатъчно, липсва търпение да се повтаря несполучлив опит, докато успее, не се намират подходящи консултанти, които да подтикват, а не да осмиват и обиждат.

Усвояването на работата с личния компютър разкрива пред жадуващите творчески изяви млади хора нов, много удобен простор за дейност. Умението да работи с личния компютър, като използва всичките му възможности, дава на ученика самочувствието на човек, придобил особена грамотност, овладял нов език, с чиято помощ може да проектира, т. е. да твори, и съвсем лесно да реализира проектите си „в образ и звук“. Напоследък се говори за въвеждане на нова учебна дисциплина „компютърна наука“. Всъщност става дума за обучение, в резултат от което обучаваният ще може да „разговаря“ с личния компютър на понятен компютърен език като използва клавиатурата му.

Разумно ще бъде тази учебна дисциплина да носи название „компютърни езици“, ако, разбира се, се сметне за необходимо да се въвежда нова учебна дисциплина с такова учебно съдържание. Значително по-добре ще бъде, ако се обединят преподаванията на всички езикови дисциплини под едно название — езикознание (или информатика). Подразделения на тази интегрираща дисциплина тогава ще бъдат уроците по български език (като водещ), руски език, западни езици (английски, френски, немски, испански и др.), компютърни езици и …математика (доколкото тя се преподава в общообразователната ни система като език за обработка на данни).

Ако езикознанието (информатиката) се преподава като „ограмотяваща“, основна учебна дисциплина от най-ранна детска възраст и с помощта на личния компютър, може да се очаква, че ще се освободи много учебно време и учениците ще могат повече да се занимават с интересната за тях творческа дейност. Известно е, че в уроците по български, по руски, по западен език се подава много еднаква учебна материя. С въвеждането на обучение по компютърни езици количеството на тази еднаква учебна материя ще нарасне още. Обединяването на преподаването „по всички езици“ в една научна дисциплина ще направи ясно видими повторенията още при осмислянето на учебното й съдържание и ще осигури съвсем лесно една действително „коренна“ реформа на обучението по всички „ограмотяващи (езиковедски)“ дисциплини.

При такова обединяване личният компютър ще стане реализатор на мечтания от добрите педагози учебен процес, основаващ се на принципа „docendo discimus“, т. е. „като обучаваме други, сами се учим“: който прави програма за компютри, фактически обучава компютърa на някаква дейност. Тъй като личният компютър се програмира „в диалог“ с програмиста, програмистът изпълнява ролята на учител. Когато ученикът програмира, той започва добре да разбира какви са „мъките на учителя“ и сам се мъчи да подбира различни начини за подобряване на изпълняваната по програмата работа.

На личния компютър ученикът може да рисува, съчинява мелодии, да получава желани от него рисунки, но …ако съумее да подготви съответната програма. А всяка желана програма представлява последователност от команди (инструкции, подбудителни изречения), записани на понятен компютърен език. Почти всички използвани за нуждите на образованието лични компютри се програмират на език, който наричат „бейсик“ (не бейзик!) — инициална абревиатура на Beginner’s All-purpose Symbolic Instruction Code = BASIC, за начинаещи за всякакви цели символен учебен код. Бейсик е език, съставен от английски морфеми най-напред за студентите в университета в Дартмът в САЩ. Той се усвоява много лесно, ако „разговаряме“ с компютър. Тъй като нашите компютри Правец могат пряко да бъдат програмирани непосредствено на този език, няма съмнение, че обучението по програмиране трябва да започне с усвояването му: достатъчно е да запомним всичко на всичко шейсетина английски морфеми, да се научим да ги използваме така, че компютърът да прави това, което искаме от него, и бейсик е усвоен. Трябва да се научим да разбираме и десетина английски фрази, с които компютърът реагира на нашите команди — главно когато не може да изпълни зададената от нас команда, и пътят към „диалог“ с компютъра е открит.

Тъй като историята на компютрите, които днес са уреди за обработване нa големи количества текст (независимо от езика на текста — английски, френски, руски, български), е свързана с помощ, оказвана на конструкторите им от математиците, у нас (а както личи от приведената в началото на тази статия мисъл на Т. Виноград — и другаде по света) е прието да се смята, че обучението в работата с личните компютри е задача на учителите по математика, че едва ли не е част от обучението по математика. На това коренно погрешно впечатление не трябва да се поддаваме не защото учителите по математика не са в състояние да се справят с решението на задачата да научат учениците да програмират (както беше показано, обучението по математика в нашето средно училище е по същество езиково обучение — учениците изучават математиката като език за обработка на числа и отчасти твърдения), а защото личният компютър и днес е вече, и още повече утре ще бъде главен източник на езикова информация, източник, много по-удобен от днешните речници и енциклопедически справочници.

Обработката на големи масиви текст на естествени човешки езици може и трябва да се извършва от учениците по начин и под ръководството на учителите по български език. (Че нашите ученици ще се научат да работят с такива масиви на личните компютри и без участието на учителите по роден език, няма никакво съмнение.) Тази дейност е част от компютризацията на учебния процес, повеля на нашето време. Учителите по български език (както впрочем и учителите по руски език и по западните езици) е разумно да осъзнаят тази повеля и де се стремят дейно да не останат встрани от главната линия в развитието на нашата и общочовешката просвета.

Страница: А. И.
Електронна поща
Дата на публикуване: 08.VI.2009
Последна редакция: 29.IV.2023
Съобразено с
html5/css3