Архив Июль 2009

Содержимое-тип

| Комментариев: 2 | Нет трекбэков
В интернете как: если долго-долго думать и придумать какую-нибудь совершенно невозможную ошибку, то рано или поздно можно обнаружить сайт, где эта ошибка есть.

Вот, например, заголовки сайта forum.samsung-fun.ru, которые я получил только что через lwp-request:

Cache-Control: private, pre-check=0, post-check=0, max-age=0
Connection: keep-alive
Date: Tue, 21 Jul 2009 08:33:52 GMT
Server: nginx/0.3.27
Content-Type: text/html; charset=windows-1251
Expires: Tue, 21 Jul 2009 08:33:52 GMT
Last-Modified: Tue, 21 Jul 2009 08:33:52 GMT
Client-Date: Tue, 21 Jul 2009 08:33:54 GMT
Client-Peer: 93.191.15.73:80
Client-Response-Num: 1
Client-Transfer-Encoding: chunked
Content-Style-Type: text/css
Keep-Alive: timeout=20
Link: ; rel="shortcut icon"; type="image/x-icon"
Link: <templates subsilver="" style.css="">; rel="stylesheet"; type="text/css"
Link: </templates>; rel="alternate"; title="RSS Forum"; type="application/rss+xml"
Set-Cookie: sams_fun_data=a%3A0%3A%7B%7D; expires=Wednesday, 21-Jul-10 08:33:52 GMT; path=/
Set-Cookie: sams_fun_sid=5d374f68aac8862fb9aab8b77f05e151; path=/
Title: Главная :: Samsung-Fun.ru
X-Meta-Description: Главная - Samsung-Fun.ru
X-Powered-By: PHP/4.4.9
Содержимое-Тип: text/html; charset=windows-1251


Содержимое-Тип! Странно, что они остальное не перевели.

... пишу я в своём блоге по мотивам поста Сергея Петренко про историческую достоверность, где он сделал аналогичный вывод про советских публицистов, обидившись на них из-за слов Юлиана Семёнова про «столетия дисциплины при кайзерах», в то время как Сергей насчитал только лишь 47 лет.

И ладно бы Сергей остановился на своей внимательности, но ведь он дальше начал открывать читателям правду о том, как всё было на самом деле. Самое удивительное открытие, на мой взгляд, вот это:
Скорбите о жертвах Второй мировой? Так не забывайте, что вторым государством, чьи войска атаковали границу буржуазной Польши, был СССР и эта агрессия была поминутно согласована с планами Германии.
Поминутно!
Следует вспомнить, что Германия вошла в Польшу 1-го сентября (что и считается началом второй мировой), а советские войска пересекли польскую границу 17-го сентября. Как можно поминутно согласовать операцию, которая началась спустя 17 дней? Понятно, что Германия постоянно напоминала советскому руководству о том, что неплохо бы войти в Польшу, но получала отказ вплоть до 16-го сентября, пока Молотов не ответил что «военная интервенция Советского Союза произойдёт, вероятно, завтра или послезавтра». К тому моменту польская армия уже была практически разгромлена, а немцы стояли под Варшавой.

Если считать масштаб ошибки, то Юлиан Семёнов ошибся  в 4 раза (столетий может быть минимум два), а вот числа Сергея Петренко отличаются от реальных в 2880 раз (столько минут в двух сутках).

Если же серьёзно, то меня давно уже смущал этот термин: вторая мировая война. Что такое, «мировая война»? Кто и каким образом отличает обычную войну от мировой? Почему, к примеру, то что творилось в Европе до 1-го сентября ещё не было второй мировой, а вот после -- вдруг ей оказалось?

И только примерно год назад я нашёл ясный и очевидный ответ на этот вопрос, хотя и  несколько для себя неожиданный. Мировая война это такая война, в которой участвуют просвещённые страны, т.е. на тот момент Англия, Франция и Германия. Пока Англия не воевала -- никакой мировой войны не было, что вы. Был абсолютный мир и полное спокойствие. А то что происходило с Чехословакией, Австрией -- это всё были мелочи.

Собственно, и вторжение в Польшу просвещённые державы тоже бы спустили на тормозах, если бы Гитлер сделал главное, ради чего его и пестовали: атаковал бы Советский Союз. Это видно по странным манёврам войск союзников после объявления войны. Где они были, что они делали? Как они спасали Польшу? Но Германия вместо ожидаемого хода развернула войну в Европе, а, значит, всё-таки наступила мировая война.

И тогда понятно почему для Советского Союза и России этот термин не значит практически ничего: он чужой, непонятный, потому что с СССР в этой войне никто не воевал. В общем-то, это справедливо: в свой мир просвещённые и цивилизованные страны СССР не пускали.

Длина слова

| Нет комментариев | Нет трекбэков
В любых задачах, связанных с обработкой текстов на естественном языке, так или иначе возникает небольшая проблема: какой максимальной длины может быть слово?

Ответ тут такой: если для небольшой коллекции документов этот лимит может быть посчитан, то для постоянно разрастающегося и потенциально бесконечного индекса всего интернета размеры слов могут быть любыми, к чему нужно быть готовым. Тут бывают и настоящие слова (к примеру, немецкие числительные), но в основном попадается всякий мусор, с которым тоже приходится работать. Естественно, что потом делать с длинными словами -- вопрос отдельный, их можно урезать, можно дробить, можно вообще не учитывать, но вот падать на них совершенно ни к чему.

Недавно столкнулся с ещё одним примером того, что если один человек чего-то сделал, то другой завсегда может это сломать. Ну и то что даже в русском языке слова могут быть любой длины (хотя в словарях их, конечно, не найти). На одном форуме один человек другому написал:

ДЭЭЭ....ЭЭЭЭБИЛ

в 1032 символа.

И конечно же это слово оказалось чрезвычайно сложным для индексации! Какое коварство: длина слова не только больше 256, но даже 1024-х символов! Вокруг все опытные программисты, понятное дело. Но сколько же можно по одним и тем же граблям ходить? В одном месте эти ограничения учли, в другом месте забыли...

Лучший пароль

| Нет комментариев | Нет трекбэков
Из рабочей беседы:
 - А я считаю, что самый лучший и безопасный пароль это шесть звёздочек!

В бизнес-линче увидел забавную идею социальной рекламы: плакат с надписью «Бросайте мусор прямо здесь» (там ещё есть много приятных деталей в виде названий общественных организаций). Правда, думаю, этот плакат не будет сильно эффективным, так как люди существа социальные и большая часть из них мусорит не по каким-то особым причинам, а просто потому что уже намусорено и значит «здесь так принято», а следовательно лучший способ борьбы с поведением людей это штат уборщиков и легко доступные мусорные урны. Однако я вспомнил, что год тому назад размышлял примерно на ту же тему и у меня возникла пара мыслей относительно надписей в духе «минздрав предупреждает...» на табачных пачках и рекламе алкогольной продукции.

Прежде всего, очевидно что эти надписи не работают, потому что они:
  • неправильно составлены (одно слово «минсоцразвития» чего стоит).
  • всегда одинаковые у людей замыливается взгляд и они перестают их замечать.
  • почему-то указывают на вред здоровью, хотя курят и пьют совсем не из-за этого, да и про вред тоже все знают.
Соответственно, пользы от них никакой. Правильная надпись должна быть короткой и ёмкой, по возможности должно быть много разных вариантов оформления (самое лучшее если бы надпись разрабатывалась против конкретной упаковки, хотя это невозможно практически) и она должна быть направлена против реальной причины, заставляющей людей курить или пить.

Ясно же, что люди начинают курить не из-за ошибочного предположения, будто они себе  курением продлят жизнь. Более того, я читал в книжке Малькольма Гладуэлла «Переломный момент», что проводился даже интересный опрос среди курильщиков: их спрашивали, на сколько лет они сократят себе жизнь ежедневным курением. Ответы оказались неожиданными: в среднем курильщики называли число лет, большее чем то, которым их хотели испугать.

То есть, все эти «Smoking kills» не работают, так как сообщают общеизвестный факт, с которым как опытный курильщик, так и начинающий, уже смирились.

Основная же причина, по которой люди начинают курить или пить, кроется опять же в социальном окружении: если вокруг принято курить и считается, что некурящий чем-то хуже остальных, то конечно люди будут курить несмотря ни на что. Грубо говоря, начинают курить чтобы казаться «круче», а уже потом сюда навешивается наркотическая зависимость, хронический бронхит и рак лёгких. Так что нужно делать вредные привычки непопулярными и они сами собой уменьшатся.

К примеру, с курением так и происходит, достаточно посмотреть на издевательства, которым подвергают курящих в Европе: в самолётах курить запретили, сделали места для курения в виде довольно-таки унизительных прозрачных загончиков и т.д. Соотвественно и надпись должна быть не просто про вред курения, а про то что «я знаю что вредно, мне рассказали про рак лёгких, но я всё равно выкуриваю пачку в день, а следовательно я дурак», ну или по простому: «Я ЛОХ». Такую пачку с сигаретами будет стыдно доставать, а это как раз и может заставить покупателя задуматься.

PS. Есть, правда, небольшая вероятность что тогда слово «ЛОХ» потеряет негативную окраску и станет популярным. Тогда нужно будет ещё что-нибудь придумать.

Об архиве

Страница содержит архив записей за Июль 2009, расположенных по убыванию.

Июнь 2009 — предыдущий архив.

Август 2009 — следующий архив.

Смотрите новые записи на главной странице или загляните в архив, где есть ссылки на все сообщения.

Страницы

OpenID принимается здесь Узнать больше об OpenID