gkphn_bg.py
Предназначение: отброява килофони от началото на текста и поставя последователно маркери от вида <kphn_BG_N /> след всяка килофона, където N е поредният номер на килофоната.
Технически изисквания: Python 3.x и модула gtools.
Параметри:
-h | --help – малко помощна информация;
-nN – където N е цяло положително число, номер на първата килофона (по подразбиране 1); числото трябва да се напише след -n без шпация;
-c – от counter: извежда сумата на всички монофони в текста, включително в „опашката“, която обикновено не формира килофона.
Пример:
$ gkphn_bg.py -n351 < text.petxt > text.kphn
ИЗТЕГЛЯНЕ: gkphn_bg.py.zip.
Какво може да се пре/доработи: съществено трябва да се промени работата на програмата със списъчно представен текст. Засега тя работи правилно със списъчно представен български текст, ако класификаторите съдържат само латински букви и цифри, защото програмата просто не ги брои. По-разумно е обаче да се обработва само текстът в реда до първия табулатор. Направено е — виж поправката от 26 февруари 2015 г.
Програмиране: 2013, 2014, А. Иванов