Yaroslav (yarikas) wrote,
Yaroslav
yarikas

Распределённая библиотека

Спрашивали - отвечаем.

Как нас учил Александр Зиновьев, начинать надо с определений. Что такое "данные"?
Вот написано множество книг, выходит ежемесячно масса журналов, а сколько в них данных?
(Интуитивно определим как "необходимую нам в данный конкретный момент информацию" для решения, по-видимому, насущных задач в преследовании какой-то Великой цели, а определение информации примем вослед за Чернавским по Кастлеру как "запомненный выбор из множества равноправных вариантов").
Самое непростое - определиться, что же может понадобиться.

Второй задачей будет избавление от дублирующей/избыточной информации (дай бог 5% в книге информации ценной, а остальное? зачем храним? ради пары страниц, где подчеркнули пару строк? в то же время, для кого-то, у кого контекст другой, будет может и больше пользы от прочтения остального, но точно не будет времени на прочтение/обработку всего массива книг/изданий!).
Можно все шаги соотносить с реляционной теорией и её реализациями...

Третьей - из всего важного выделить главное (сортировка и поиск, селекция и выбор, ага).
По-моему, сейчас именно об оценке говорят, когда речь заходит про web 3.0, да? Т.е. не столь уж важен для поиска в сети сам контент, кем он написан, как его оценка другими (и соотв. статус автора от этого зависит, но это при повторных обращениях к материалу по заданной тематике - см. "эксперт").
Доходит до того, что комментарии для поиска становятся важнее поста/контента, грубо говоря :/

Дальше уже можно обсуждать задачи распределения прав и времени доступа, необходимости централизованного или распределённого хранения (в т.ч. для обеспечения сокращения времени доступа "по месту"/ad-hoc: иметь книгу у себя в биб-ке или бежать в городскую, тянуть с торрентов и т.п. - это хорошо ещё, если знать что и где искать), внесения правок/уточнений.
Да, тут часть информации будут пытаться сохранить закрытой, часть будут отдавать за деньги, типа, она вам поможет сделать ещё бОльшие деньги (ну, потратили время - выучили php по книжке за $50 (стоимость книги можно определять по скорости изучения по оной материала - по откликам пользователей) и построили сайт за $500 - надо, правда, ещё знать как и кому свои знания/умения/навыки продать, чтобы все эти вложения окупились, не говоря уж про устаревание некоторой информации).
Так или иначе со временем информация либо утонет, либо всплывёт на так называемую "информационную поверхность" (что только не всплывает! каждый раз вспоминаются слова из Степанова о гибели адмирала Макарова при подрыве на мине "Петропавловска" и чудесном спасении князя Ухтомского). Идёт некий "естественный отбор" - сосуществование людей как генераторов и селекторов информации + самой информации (данных/идей) = в качестве самосогласованой развивающейся (эволюционирующей?) системы.

В остальном - Лем "Сумма технологий" - "Мегабитная бомба".
Как помогают "облачные" вычисления в вышеперечисленных задачах, думаю, говорить даже не стоит.

PS: Коэволюция железо-софт также хорошо видна на примере развития IT. Полста лет уж в обед... Кстати, созданная Тимом Бернерсом-Ли система структуризации информации в CERN'е через 20 лет превратилась ныне в свалку, в которой и Великий Гугол порой может и не поможет найти "жемчужное зерно". Опять надо "знать, где искать" - от инструментального способа решения проблемы структурирования информации вернулись к "ментальному" :/

PPS: Прошу прощения, если снова избыточно кратко и не совсем по теме.

UPD: Основные зеркала "Генезиса" накрылись, походу.
Tags: books, comp, evo
Subscribe
  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 5 comments