10/11/2007 04:12 | Сергей Хлюпин

Программа-фильтр отсеет идиотские комментарии из форумов и блогов

Лучше поздно, чем никогда. Тем более, что в данном случае – никогда не поздно. Наконец создана программа, убирающая идиотские комментарии из конференций и блогов!

Команда разработчиков долго трудилась над «фильтром тупости», который бы работал как спам-фильтр и удалял «идиотские комментарии».

Группа программистов из американского города Альбукерке под руководством Гэбриэла Ортиса (Gabriel Ortiz) готовит свободно распространяемую бесплатную версию программы с открытым кодом. По сути, это ПО будет состоять из двух частей – фильтра, устанавливаемого на веб-сервер и программы, которая будет реализована в виде плагина к браузеру Firefox. Выход ПО ожидается в конце этого года.

Как же это работает? Если на сервере установлен фильтр, то он будет анализировать содержание каждого комментария перед его публикацией. Если фильтр «обнаружит», что комментарий невнятен, то пользователю будет выдано примерно следующее сообщение: «Данный комментарий в той или иной мере бессодержателен. Попробуйте его переформулировать».

Фильтр отслеживает такие популярные в интернете выражения как «LOL!!!», «OMG!!!» и тому подобные. Речь, конечно же, о выражениях, используемых в англоязычном интернете.

Internet, blogs, forums, comments, idiots, stupid filter, блоги, форумы, комментарии, идиоты, фильтр

Ортис отмечает, что одной из проблем при разработке программы было придумать, как фильтровать иронию. Поскольку компьютеры немного похожи на американцев: они не могут выделить высказывания иронического или саркастического характера. А это представляется большой проблемой, так как «умные» посты зачастую полны иронии. Люди, не обделённые интеллектом, очень часто допускают в своих постах «опечатки» иронического свойства, например для американских форумов и блогов характерна замена blog на bog (болото), Open Source – на Open Sauce (Открытый соус), и только действительно тупые люди не поймут иронии и намёков.

Однако Ортис, который изучал лингвистику на последнем курсе университета, отметил, что в «идиотских» комментариях часто используются подряд идущие согласные (например – amazinggggg!), в то время как в постах саркастического свойства – повторяющиеся гласные (например – Yeaaaaaah). Одним из «критериев оценки», используемом в фильтре Ортиса, являются стандартные правила грамматики английского языка. Например, если в одном из слов в посте сделана ошибка, оно написано неправильно, а остальная часть сообщения грамматически верна – то фильтр «пропустит» такой пост. Если же оставшаяся часть сообщения бессодержательна – то фильтр её отсеет.

Интересно, что Ортис и его команда приглашают всех желающих посетить свой сайт StupidFilter.org  – чтобы участвовать в определении наиболее тупых постов с сайта YouTube.

Несомненно, фильтр, разрабатываемый Ортисом – вещь не менее полезная, чем фильтр спама. Очень хотелось бы увидеть и фильтр для русскоязычного интернета. Ведь речь тут совсем не идее о цензуре или – упаси, Господи – ограничении свободы слова. Просто комментаторов в форумах и блогах стимулируют полно и чётко высказывать свои мысли. Ведь, согласитесь, если автор комментария потратит лишнюю пару минут и напишет своё мнение вместо известных выражений «ЛОЛ» или «баян» - то читать всю дискуссию будет намного интереснее.

© Cyberestyle.ru по материалам The Inquirer и Money.CNN.com