Давным-давно — лет пять или шесть назад, когда социальные сети ещё не получили нын
 
avatar
Давным-давно — лет пять или шесть назад, когда социальные сети ещё не получили нынешнего распространения, и народ вовсю общался во всяких там аськах и чатах, завели чат и в локальной сети моего тогдашнего провайдера. Но его быстро оседлала группа молодых людей, предпочитавших общаться на «русском устном». Мне это не понравилось (ведь это и дети и женщины читали), и я взял на себя бремя администрирования этого чата. Вопли «На локале блохастый завёлся! Материться не даёт!» быстро стихли — экосистема чата перестроилась из состояния «без кота» в состояние «с котом». Кроме того, я подобрал команду единомышленников. Но народец ушлый: видит, что админов нет — матерится, появились — воздерживается.
 
Я за несколько месяцев набрал базу из наиболее часто встречавшихся выражений, составил на их основе набор так называемых «регулярных выражений» (кто занимался текстовым поиском — знает, что это) и запрограммировал робота. С тех пор я поменял провайдера, но робот жив и сейчас, а мата на чате нет. Конечно, это во многом благодаря тому, что не нашлось достаточно грамотного матерщинника, который бы разобрался с роботом и не облагодетельствовал инструкциями широкие матерящиеся массы… Но полагаю, что пример такого чисто механического подхода показателен. Причём за всё время робот прокололся только на слове «Ибица», которое следовало бы занести в исключения. В остальном же регулярные выражения отлавливали только выражения матерные.
 
P.S. В ходе работы над ботом-антиматом мне пришлось найти и задействовать словарь всех форм слов русского языка, который лёг в основу программы анализа ритма поэтического текста. Крайности сходятся…
 

Авторизация


Регистрация
Напомнить пароль