Хранение и поиск информации Печать

Вернуться к оглавлению

Хранение и поиск информации - процесс автоматизированного хранения и поиска информации, обеспечивающий ее выдачу для быстрой реализации.
storage

Все, что не так давно называли сведениями, фактами, данными, известиями, теперь называют одним общим словом «информация». Информация - это все: от простой записки до научной монографии. Информация - это все фиксированные сообщения: книги, газеты, журналы, фотографии, фильмы, магнитные записи, записи на пластинах, каталоги, реклама, отчеты, письма и т. д.

Надо ли подчеркивать, сколь велик ее объем? И сколь сложен процесс поиска, накопления, обработки и передачи информации? А находить, накапливать, обрабатывать и передавать информацию нужно всюду.

Хранение информации - процесс не менее древний, нежели жизнь человеческой цивилизации. В самые древние времена ее хранил и передавал из поколения в поколение человек - его интеллект, его опыт.

С рождением письменности родился новый механизм интеллектуального отбора. Возник специальный аппарат фиксирования и распространения мысли в пространстве и времени. Родилась документированная информация - рукописи и рукописные книги. Появились своеобразные информационно-накопительные центры - древние библиотеки и архивы. Они были важным атрибутом цивилизации. Постепенно письменный документ стал и орудием управления.

Вторым информационным скачком явилось книгопечатание. Типографский станок вызвал к жизни рост печатной продукции, небывало увеличил возможности накопления и размножения информации.

Не будем брать далекие от нас годы, обратимся к недавнему времени. Каждую секунду в мире появляется около двадцати тысяч страниц текста о достижениях в различных отраслях науки и техники. Сто тысяч научных и технических журналов ежегодно. Они публикуют 2 миллиона статей и заметок по разным отраслям знания. К тому же ежегодно выходит более 10 тысяч научных книг. Специальных публикаций - бюллетеней, отчетов о конференциях и симпозиумах, рефератов - печатается до 2 миллионов экземпляров. Процесс этот пока неудержим. Количество таких изданий растет на 5-10 процентов в год.

По образному выражению одного исследователя, если ученые во все времена только качались на информационных волнах в море научной информации, то сегодня они в ней просто задыхаются: информационный поток в наши дни в 15-20 раз выше реальных возможностей восприятия его человеческим мозгом.

Специалисты подсчитали, что в ближайшем будущем количество названий и тиражей печатной продукции будет катастрофически увеличиваться и накопление ее приведет к тому, что на каждого человека только в Европе, включая детей, придется для прочтения 7 тысяч страниц в месяц.

В научных и научно-технических публикациях конденсирование информации необходимо. И оно проводится. Наиболее распространенная форма такого приема - рефераты. Они собраны в реферативных журналах, которые издают, например, различные институты научной информации. Научные сведения сжимают здесь в рефераты, аннотации, библиографические описания, списки. Для реферативных журналов обрабатывают миллионы статей из книг, журналов, газет и других изданий.

Однако, как ни густы сети, расставленные ловцами информации, охватить ее всю и всюду невозможно. Практически невозможно все успеть прочитать. Ведь число изданий постоянно увеличивается.

До сих пор, к сожалению, некоторые изобретатели работают, будто научно-технической информации не существует. Они, подобно Одиссею, залепив уши воском, спокойно проплывают мимо сирен, извещающих о множестве открытий и изобретений. И это не вина, а беда современных инженеров и ученых. Не прочитанная никем информация - немая информация: она не работает, не помогает.

Нас часто удивляют и радуют несметные богатства книгохранилищ миллионеров. Например, крупнейшие национальные библиотеки мира содержат: Библиотека конгресса США в Вашингтоне 19570000 единиц хранения, Национальная библиотека Китая в Пекине 10 000 000, Национальная библиотека Франции в Париже 1 000 000, Британская библиотека в Лондоне 8 750 000, Национальная библиотека Бразилии в Рио-де-Жанейро 3 000 000, Национальная библиотека Австралии в Канберре 2 120 000. Однако около половины книг, имеющихся здесь, никогда не были затребованы читателями. Почему? Потому что читатель захлебывается в море информации. У него руки не доходят до того, чтобы просмотреть все каталоги и справочники.

Сейчас некоторые даже придерживаются такого правила: если исследование стоит недорого, то его в большинстве случаев дешевле заново проделать, чем искать иголку в стоге сена, выясняя, не проведено ли кем-то другим и какие получены результаты.

Специалисты знают, во что обходятся поиски информации. Например, на «раскопки» в библиотеках США тратится 300 миллионов долларов. Подсчитано, что пятая, часть ассигнований на научные исследования расходуется во всеми на сбор и распространение информации.

Вывод из сказанного однозначен. Книгопечатание, создав принципиально новую технологию накопления и распространения информации, не может сегодня полностью удовлетворить важнейшее требование этого процесса: усилив рост информации, не изменило способа ее пере работки.

Как быть в таком случае? Необходимы высокоэффективные средства обработки информации и новые технологии.

Хранение и передача информации зависит от ее носителя. Машинная технология обработки информации основана на новых носителях, на которых записывают данные для хранения в памяти машин. В хранящиеся в памяти машины сведения называют базами данных, и. информационными массивами, а для их обработки используют информационно-поисковые системы.

Наиболее характерный пример такой системы - автоматизированная система резервирования и продажи авиационных билетов. Для работы требуется информация о расписании движения самолетов, о ценах на билеты, о проданных и заказанных билетах. Система составляет базу данных, или информационный массив, этого автоматизированного «кассира контролера - администратора».

При решении каждой очередной задачи - в разбираемом случае при оформлении заказа на билет - система нуждается во вводе только небольшой дополнительной информации: о содержании заказа. Остальная берется из базы данных. Изменение в ней - очень важное свойство хранение информации в памяти машины. Вновь вводимые сведения изменяют информационный массив, придают системе динамичность, способность к быстрой перестройке структуры данных, содержащихся в них сведений.

В зависимости от характера информационного массива, а значит, и по характеру выдаваемой информации информационно-поисковые системы делятся на документальные и фактографические.

База данных документальной информационно-поисковой системы со стоит из множества элементов, которые описывают содержание документа Причем под словом «документ» подразумевается и книга, и статья, и технический отчет, и патент и т. п.

Информационный массив фактографической системы содержит элементы, каждый из которых относится к какому-то определенному объекту независимо от того, описан этот объект в одном документе или в нескольких. Например, системе неважно, сведения о меди содержатся в одном каком-то описании или разбросаны по многочисленным источникам. Для системы важно, чтобы она знала о меди все, что об этом химическом элементе известно на сегодня.

Документальная и фактографическая информационные системы выдают пользователю информацию и по виду разную. Так, документальная, отвечая на посланный ей запрос, выдает сведения о множестве документов, где содержится нужная информация. Есть системы, которые указывают адрес хранения документов. Фактографическая же система тут же выдает на запрос необходимую пользователю информацию.

Есть еще и комбинированные информационно-поисковые системы. Они совмещают в себе свойства документальной и фактографической систем.

Информационные системы позволяют проводить анализ и оценку сведений, создавать и использовать банки данных, получать комплексно обработанную целевую информацию и оперативно обеспечивать ею пользователей.

Опыт показал, что хранение очень больших объемов информации оправдано только при условии, если поиск идет быстро, а сведения выдаются в доступной форме. Развитие информационных систем идет так быстро, что специалисты, разрабатывающие программы для них, вынуждены поспевать за техническими средствами.

Автоматизированные информационно-поисковые системы произвели подлинный переворот в службе хранения, поиска и переработки информации. Они зарекомендовали себя как незаменимые помощники человека, превратив службу информации в подлинную индустрию информации, располагающую электронными архивами, электронными каталогами, электронными библиотеками и даже электронными информационными магазинами, в которых есть множество самых разнообразных данных: литературных, медицинских, экономических, научных, политических, из области образования и спорта.

Создали и «электронные энциклопедии» для разных специалистов информационно-поисковые системы для медиков, химиков, машиностроителей, экономистов.

Подсчитано, что автоматизированное составление списка литературы из разного рода информативных материалов библиотеки сокращает затраты времени в 100-200 раз по сравнению с обычным. В одной из таких работ в информационную систему заложили библиографию, включающую 275 тысяч названий книг. Каждую неделю память системы пополнялась 300 новыми названиями. Система выдавала более трех миллионов справок о различных произведениях, их авторах, содержании, количестве страниц, годе издания,- любой ответ можно получить через секунду.

Ныне прогресс микроминиатюрной электроники резко увеличил емкость хранилищ информации, а успехи лазерной техники позволили увеличить пропускную способность каналов передачи информации. Только один компактный диск диаметром до двенадцати сантиметров вмещает миллион страниц текста - громадный архив документов, статей, фотографий, чертежей, всевозможных бумаг. В цифровой форме на диске могут быть записаны самые разные географические и топографические карты, схемы, цветные рисунки. Все 9 миллионов слов «Американской энциклопедии» заняли лишь одну пятую часть компактного диска.

Развитая сеть институтов и центров хранения и поиска информации непрерывно ведет пере работку дорогостоящего «информационного продукта». Чем измеряются результаты такой работы? Не только количеством и качеством информации, но также и умением сжимать информацию об информации, помогая потребителю лучше в ней ориентироваться, а в конечном итоге способствовать накоплению все большего и большего интеллектуального богатства.