The Story Of Civilization

| Нет комментариев | Нет трекбэков
В Амазоне наконец-то появилась электронная версия The Story Of Civilization, которую всю свою жизнь  писал Will Durant (вот, например, первый том: The Oriental Heritage). Это такая могучая работа, завораживающая своей монументальностью: автор решил взять и описать всю историю западной цивилизации. Писал с 1937-го года до конца жизни, написал 11 томов и добрался до Наполеона. Книга приятно читается, ну и вообще, масштаб поражает -- это редкие сейчас осколки практики академических работ прошлых веков, когда, допустим, человек брался за то, чтобы рассчитать цифры числа Пи или описать историю Римской империи, и занимался этим всю свою жизнь. Сейчас только "сумасшедшие" на такое способны. Ну или уже по факту, только таких "сумасшедших" и помнят спустя столетия.

Я эту книгу начинал читать уже два раза:
  1. Первый раз начал слушать аудиокнигу, прослушал полтора тома. Отлично начитана, хороший диктор -- но слушать всё-таки тяжело, особенно учитывая то, что аудиокниги я слушаю исключительно на улице, где постоянно отвлекаешься и теряешь нить повествования. Всё-таки, английскую речь я ещё не так хорошо воспринимаю.
  2. Второй раз взял отсканированные листы книги, прочёл ещё полтома. Но читать отсканированный текст в таких обьёмах не очень приятно, а особенно глупо себя ощущаешь, когда приходится лазить в словарь, посмотреть толкование того или иного слова. На Kindle очень удобно это сделано, можно посмотреть толкование в Оксфордском словаре сразу, наведя курсор на аппаратных Киндлах или ткнув пальцем в слово на устройствах с тач-скрином. А тут смотришь на экран Киндла и лезешь куда-то в другой словарик в телефоне... а ведь 21-й век на дворе. 

Теперь, наконец-то, можно прочесть по нормальному, как я уже привык читать с Киндлом. Но Амазоновская практика ограничивать регионы для продажи электронных книг раздражает. В этот раз вообще волшебно: тома 1 и 4-11 в Европе продаются, а 2 и 3 -- нет. Пришлось виртуально переехать в США и купить их же на 2 доллара дешевле.

Ну а вообще - рекомендую. Оно, конечно, местами очень спорно написано, но где можно найти "обьективную" историческую книжку?

Незалежный перевод

| Комментариев: 7 | Нет трекбэков
Вот уже третий год для подготовки к лекциям по дискретному анализу я читаю одни и те же книги: Кормена, Гасфилда, Кнута и т.п. При этом, судя по всему, "Алгоритмы: построение и анализ", осталась последней книгой из них, которую я читаю в русском переводе, но тоже потихоньку перехожу на английский оригинал.

А сегодня, в описании задачи о рюкзаке, обнаружил ранее не замеченную особенность:
Вор во время ограбления магазина обнаружил n предметов. Предмет под номером i имеет стоимость vi грн.

Грн!
Сначала я думал, что бы это может быть (кроме гривен, видеть которые было совсем неожиданно). Потом я решил, что у меня какое-то специальное украинское издание. И только после этого осознал, что ничего специального в моей книге нет, просто второе издание делалось киевским отделением издательского дома "Вильямс".

В первом издании перевода, кстати, в этом месте были оставлены исходные доллары.

Вот что демократия с переводчиками делает!

Интеллект из случайности

| Нет комментариев | Нет трекбэков
Перечитывал старые статьи про реферирование документов. В 1958-м году Лун опубликовал первую работу по этой теме, «The Automatic Creation of Literature Abstracts», в которой меня поразила следующая цитата:
However, instead of sampling at random, as reader normally does when scanning, the new mechanical method selects those among all the sentences of an article than are most representative of pertinent information.
То есть, считалось, что человек при беглом просмотре статьи выбирает фрагменты для ознакомления случайно, а предлагаемый алгоритм делает это на основе оценки важности или показательности  того или иного кусочка текста. И в том как раз помощь человечеству: раз выборка делается не случайно, а по разумным критериям, это точно будет лучше, чем раньше.

Как сильно это отличается от современного подохода к подобным задачам! Понятно, что изменение точки зрения произошло как раз из-за наблюдения за подобными алгоритмами, где простые варианты расчёта весов почему-то не работают, а сложные становятся запутанными для самих создателей: 200 разных настроечных коэффициентов, десятки словарей, понять что на что влияет крайне сложно.
 
Поэтому сейчас, наоборот, считается что никакой особенной случайности в выполняемых человеком действиях нет, и что как раз нужно извлекать закономерности из поведения человека, причём по возможности так, чтобы сам наблюдаемый человек об этом не знал, а выполнял свои действия рутинно. Математическая модель выбирается исходя из её потенциальной вычислимости, а параметры настраиваются из экспериментов, т.е. обучаются.

Тем самым, сейчас фактически предполагается невозможность человеком формализовать поведение самого себя, а основной расчёт делается на  автоматическое извлечение паттернов поведения при исследовании большого количества примеров этого поведения.

Интересно, если когда-нибудь методы машинного обучения достигнут такого совершенства, что таки будет создан и поставлен на поток Настоящей Искусственный Интеллект (чтобы не подразумевалось под этим термином), будет ли зафиксировано создание ИИ человеком (и, как следствие, равенство его Богу, не меньше; а может атеистический триумф), или будет принято во внимание, что в результате обучения человек ничерта не понимает в результате: что-то там как-то обучилось, но почему именно так и что сделать, чтобы было иначе -- неясно, т.к. ни один человек в мире не сможет осознать смысла значений полученных в результате обучения миллионов или миллиардов параметров математической модели этого «настоящего» ИИ.

Самое смешное, что текущий метод создания Естественного Интеллекта, в принципе, похож на этот гипотетический. ЕИ рождается, а дальше ведёт себя совершенно как хочет, и методов повлиять на него у создателей довольно мало, и все сводятся к тому же обучению на собственном примере. Я к тому, что типичная бытовая задача: есть некий представитель ЕИ, можно ли сделать точно такого же, но чуть более доброго-вежливого-терпимого -- не решается как раз из-за непонимания сложности взаимосвязей в ЕИ. То есть, наверное, можно как-то сосредоточиться и чуть изменить желаемый параметр, но ведь и остальные «поедут». Так что если вдруг получится что-то изменить (что маловероятно), то это будет какой-то совсем другой ЕИ, скорее всего неожиданно хуже предыдущего по суммарным параметрам.

И, спрашивается, зачем тогда мучаться и создавать этот самый ИИ? Чтобы огрести всё те же проблемы, но только более сложным путём? Нет, конечно. Это всё имеет смысл только потому, что интересен не Искусственный Интеллект, а Искусственный Недоинтеллект. Но ведь не получится остановиться на пути совершенствования Недоинтеллекта: Интеллект появится сам по себе.

Это всё довольно очевидные мысли, которые так или иначе уже просачивались в фантастические повести и кинофильмы, однако, повторю, меня поразила первая цитата, ясно демонстрирующая путь, который прошла современная наука в представлениях об автоматизации человеческого труда.

От
Мы в себе ничего не понимаем, но там и понимать нечего -- всё что ни сделаем, будет лучше!
до
Мы сами в себе ничего не понимаем, но это не беда: автоматизируем, не задумываясь! Только бы хватило процессорных мощностей.

ОГугление народа

| 1 комментарий | Нет трекбэков
Сначала ведь как? Если человек не способен найти свой ответ через поисковую систему и зачем-то задаёт вопрос на каком-нибудь форуме, хотя если он введёт его же в Яндекс или Гугл, то получит первым же документом искомый ответ, то его раздражённо называют чайником, ламером и вообще потешаются.

А что потом? Человек настолько свыкается с мыслью о том, что в Гугле-Яндексе можно найти ответ на любой вопрос, что считает будто поисковая система заменяет ему образование. В любом споре начинает сорить ссылочками, цитатами из свеженайденных текстов, не трудясь даже осмыслить сказанное.

В итоге ощущаешь себя разговаривающим с роботом, у которого много гигабайт информации и ноль мозгов. Этакий человекоподобный интерфейс к поисковой системе.

Удобный трекер

| Нет комментариев | Нет трекбэков
Уже довольно-таки долго пользуемся Trac'ом для ведения списков дел и прочего. В смысле работы Trac, конечно, очень удобен: смесь вики-разметки и баг-треккера даёт широкие возможности по организации рабочего пространства.

Однако, заметил за собой, что со временем мне стало лениво заводить новые тикеты на каждую задачу и значительно проще использовать Trac вместо записной книжки, где просто перечисляются всё что нужно сделать, а потом вычёркивается сделанное. Т.е., фактически, использование Trac'а только в виде вики-движка, без треккера.

Каждый такой пункт внутри записной книжки можно заводить отдельным тикетом, конечно, но это ведь сколько нужно сделать телодвижений: создать тикет, выбрать компоненту, назначить ответственного, вписать текст, завершить создание... Значительно проще, конечно, просто вписать задачу в список дел.

По-моему, было бы идеально пойти дальше в викифицировании трекера: давать специальный тег разметки, который бы автоматически создавал тикет. Например,

[[ ticket: Сделать самое главное и важное. | owner: vasya ]] 

и при первом сохранении шаблона присваивать этому тикету номер и модифицировать разметку соответствующим образом.

Тут возникает куча идеологических вопросов (типа, куда девать title после такого сохранения? давать ли возможность его изменять таким же образом?), но ведь было бы значительно удобнее работать с небольшими проектами.

Noscript

| Нет комментариев | Нет трекбэков
noscript.pngВ приступе паранойи поставил себе в FireFox плагин NoScript, контроллирующий выполнение js-кода на веб-страницах. Думал, что он у меня не продержится и недели, однако его использование параною только усилило. Сколько же всякого хлама грузится!

Вот к примеру, Яндекс грузит js-код не только с yandex.ru, но и с yandex.net и, почему-то, с yandex.st. На разных сайтах регулярно грузится рекламный js-код с каких-то непонятных ip-адресов.

В общем, NoScript у меня прижился.

Как улучшить качество

| Нет комментариев | Нет трекбэков
Читаю Speech and Language Processing, к одной из глав приведён замечательный эпиграф:
Anytime a linguist leaves the group the recognition rate goes up.
Fred Jelinek (head of the IBM speech group) (1988)
Так же к этому эпиграфу прилагается небольшой комментарий:
In an address to the first Workshop on the Evaluation of Natural Language Processing Systems, December 7, 1988. While this workshop is described in Palmer and Finin (1990), the quote was not written down; some participants remember a more snappy version:
Every time I fire a linguist the performance of the recognizer improves.
Между прочим это подтвержает известное мнение, что в компьютерной лингвистике собственно лингвистики должно быть как можно меньше, от неё вред один. Сразу же вспоминается как Алексей Байтин во время доклада про работу опечаточника в Яндексе шутил, что на этот раз он довёл это утверждение до логического конца и в опечаточнике теперь никакой лингвистики нет, сплошная статистика.

Резкое обострение

| Комментариев: 8 | Нет трекбэков
Сегодня, пока ехал на работу, наблюдал как минимум 4-х жертв мозговируса свиного гриппа: в повязках, отрешённо глядящих куда-то мимо соседей. Ещё на прошлой неделе такого не было, что случилось-то?

Бренд Грипп А/H1N1

| 1 комментарий | Нет трекбэков
Обнаружил у Коммерсанта на сайте выделение объектов из текста в виде отдельного блока «В статье», где перечисляются персоны, организации, бренды и регионы, упомянутые в документе.

При этом в статье «Свиная кормушка» про свиной грипп список брендов начинается с «Грипп А/H1N1».

И ведь не поспоришь.

Сегодня проверяли опытным путём, сколько программистов нужно, чтобы вкрутить лампочку. Я надеялся, что при правильном руководстве хватит и одного, однако правильный ответ иной: понадобится столько программистов, сколько их есть в комнате, включая случайно зашедшего системного администратора.

Потому что вкручивание лампочки это очень увлекательный процесс, в котором каждый хочет поучаствовать.

Смотрите новые записи на главной странице или загляните в архив, где есть ссылки на все сообщения.

Последние комментарии

  • Андрей Калинин: Интересно было бы узнать, это ошибка авторов Ты страницу покажи, читать дальше
  • btromanova.myopenid.com: А еще во втором издании "Алгоритмов" в главе про кратчайшие читать дальше
  • Андрей Калинин: Да, придираюсь. Я, собственно, именно это и пишу. С другой читать дальше
  • sigterm: Ну ты придираешься. Я тут недавно почитал канонические переводы некоторых читать дальше
  • Андрей Калинин: Это смотря что и с чем сравнивать. Так, в общем, читать дальше
  • sigterm: Да ладно, у "Алгоритмы: построение и анализ" очень хороший перевод читать дальше
  • adw0rd: Нда, ужас :) читать дальше
  • Отзыв: Гугл пока не так силен, и врятли будет пока жив читать дальше
  • андрей: угу, "В общем-то, уже сейчас изучение и понимание русского языка читать дальше
  • Андрей Калинин: Насчёт девушек --- я видел и мужчин :) Но женщин читать дальше

Последнее медиа

  • noscript.png
  • CPDVDC.jpg

Страницы

OpenID принимается здесь Узнать больше об OpenID