Меры информации синтаксического уровня. Информация и данные. Методы кодирования звуковой информации

Меры информации синтаксического уровня. Информация и данные. Методы кодирования звуковой информации

02.05.2019

Как уже отмечалось, понятие информации можно рассматривать при различных ограничениях, накладываемых на ее свойства, т.е. при различных уровнях рассмотрения. В основном выделяют три уровня – синтаксический, семантический и прагматический. Соответственно на каждом из них для определения количества информации применяют различные оценки.

На синтаксическом уровне для оценки количества информации используют вероятностные методы, которые принимают во внимание только вероятностные свойства информации и не учитывают другие (смысловое содержание, полезность, актуальность и т.д.). Разработанные в середине XXв. математические и, в частности, вероятностные методы позволили сформировать подход к оценке количества информации как к мере уменьшения неопределенности знаний.

Такой подход, называемый также вероятностным, постулирует принцип: если некоторое сообщение приводит к уменьшению неопределенности наших знаний, то можно утверждать, что такое сообщение содержит информацию. При этом сообщения содержат информацию о каких-либо событиях, которые могут реализоваться с различными вероятностями.

Формулу для определения количества информации для событий с различными вероятностями и получаемых от дискретного источника информации предложил американский ученый К. Шеннон в 1948г. Согласно этой формуле количество информации может быть определено следующим образом:

Где I – количество информации; N – количество возможных событий (сообщений); p i – вероятность отдельных событий (сообщений).

Определяемое с помощью формулы (2.1) количество информации принимает только положительное значение. Поскольку вероятность отдельных событий меньше единицы, то соответственно выражение log 2 ,- является отрицательной величиной и для получения положительного значения количества информации в формуле (2.1) перед знаком суммы стоит знак «минус».

Если вероятность появления отдельных событий одинаковая и они образуют полную группу событий, т. е.:

то формула (2.1) преобразуется в формулу Р. Хартли:

В формулах (2.1) и (2.2) отношение между количеством информации I и соответственно вероятностью (или количеством) отдельных событий выражается с помощью логарифма.

Применение логарифмов в формулах (2.1) и (2.2) можно объяснить следующим образом. Для простоты рассуждений воспользуемся соотношением (2.2). Будем последовательно присваивать аргументу N значения, выбираемые, например, из ряда чисел: 1, 2, 4, 8, 16, 32, 64 и т.д. Чтобы определить, какое событие из N равновероятных событий произошло, для каждого числа ряда необходимо последовательно производить операции выбора из двух возможных событий.

Так, при N = 1 количество операций будет равно 0 (вероятность события равна 1), при N = 2, количество операций будет равно 1, при N = 4 количество операций будет равно 2, при N = 8, количество операций будет равно 3 и т.д. Таким образом, получим следующий ряд чисел: 0, 1, 2, 3, 4, 5, 6 и т.д., который можно считать соответствующим значениям функции I в соотношении (2.2).

Последовательность значений чисел, которые принимает аргумент N , представляет собой ряд, известный в математике как ряд чисел, образующих геометрическую прогрессию, а последовательность значений чисел, которые принимает функция I , будет являться рядом, образующим арифметическую прогрессию. Таким образом, логарифм в формулах (2.1) и (2.2) устанавливает соотношение между рядами, представляющими геометрическую и арифметическую прогрессии, что достаточно хорошо известно в математике.

Для количественного определения (оценки) любой физической величины необходимо определить единицу измерения, которая в теории измерений носит название меры .


Как уже отмечалось, информацию перед обработкой, передачей и хранением необходимо подвергнуть кодированию.

Кодирование производится с помощью специальных алфавитов (знаковых систем). В информатике, изучающей процессы получения, обработки, передачи и хранения информации с помощью вычислительных (компьютерных) систем, в основном используется двоичное кодирование, при котором используется знаковая система, состоящая из двух символов 0 и 1. По этой причине в формулах (2.1) и (2.2) в качестве основания логарифма используется цифра 2.

Исходя из вероятностного подхода к определению количества информации эти два символа двоичной знаковой системы можно рассматривать как два различных возможных события, поэтому за единицу количества информации принято такое количество информации, которое содержит сообщение, уменьшающее неопределенность знания в два раза (до получения событий их вероятность равна 0,5, после получения – 1, неопределенность уменьшается соответственно: 1/0,5 = 2, т.е. в2 раза). Такая единица измерения информации называется битом (от англ. слова binary digit – двоичная цифра). Таким образом, в качестве меры для оценки количества информации на синтаксическом уровне, при условии двоичного кодирования, принят один бит.

Следующей по величине единицей измерения количества информации является байт, представляющий собой последовательность, составленную из восьми бит, т.е.:

1 байт = 2 3 бит = 8 бит.

В информатике также широко используются кратные байту единицы измерения количества информации, однако в отличие от метрической системы мер, где в качестве множителей кратных единиц применяют коэффициент 10n, где n = 3, 6, 9 и т.д., в кратных единицах измерения количества информации используется коэффициент 2n. Выбор этот объясняется тем, что компьютер в основном оперирует числами не в десятичной, а в двоичной системе счисления.

Кратные байту единицы измерения количества информации вводятся следующим образом:

1 килобайт (Кбайт) = 210 байт = 1024 байт;

1 мегабайт (Мбайт) = 210 Кбайт = 1024 Кбайт;

1 гигабайт (Гбайт) = 210 Мбайт = 1024 Мбайт;

1 терабайт (Тбайт) = 210 Гбайт = 1024 Гбайт;

1 петабайт (Пбайт) = 210 Тбайт = 1024 Тбайт;

1 экзабайт (Эбайт) = 210 Пбайт = 1024 Пбайт.

Единицы измерения количества информации, в названии которых есть приставки «кило», «мега» и т.д., с точки зрения теории измерений не являются корректными, поскольку эти приставки используются в метрической системе мер, в которой в качестве множителей кратных единиц используется коэффициент 10 n , где n = 3, 6, 9 и т.д. Для устранения этой некорректности международная организация International Electrotechnical Commission , занимающаяся созданием стандартов для отрасли электронных технологий, утвердила ряд новых приставок для единиц измерения количества информации: киби (kibi), меби (mebi), гиби (gibi), теби (tebi), пети (peti), эксби (exbi). Однако пока используются старые обозначения единиц измерения количества информации, и требуется время, чтобы новые названия начали широко применяться.

Вероятностный подход используется и при определении количества информации, представленной с помощью знаковых систем. Если рассматривать символы алфавита как множество возможных сообщений N, то количество информации, которое несет один знак алфавита, можно определить по формуле (2.1). При равновероятном появлении каждого знака алфавита в тексте сообщения для определения количества информации можно воспользоваться формулой (2.2).

Количество информации, которое несет один знак алфавита, тем больше, чем больше знаков входит в этот алфавит. Количество знаков, входящих в алфавит, называется мощностью алфавита. Количество информации (информационный объем), содержащееся в сообщении, закодированном с помощью знаковой системы и содержащем определенное количество знаков (символов), определяется с помощью формулы:

где V – информационный объем сообщения; I = log 2 N , информационный объем одного символа (знака); К – количество символов (знаков) в сообщении; N – мощность алфавита (количество знаков в алфавите).

Информации - это что такое? На чем он базируется? Какие цели преследует и задачи выполняет? Обо всём этом мы и поговорим в рамках данной статьи.

Общая информация

В каких случаях применяется семантический способ измерения информации? Используется сущность информации, интересует содержательная сторона полученного сообщения - вот показания для его применения. Но для начала давайте дадим изъяснение того, что он собой представляет. Следует отметить, что семантический способ измерения информации - это трудно формализованный подход, который до сих пор полностью не сформировался. Используется он для того, чтобы измерять количество смысла в данных, которые были получены. Иными словами, какой объем информации из полученной является необходимым в данном случае. Такой подход используется для определения содержательной стороны получаемых сведений. И если мы говорим про семантический способ измерения информации, используется понятие тезауруса, которое неразрывно связано с рассматриваемой темой. Что же оно собой представляет?

Тезаурус

Хочется сделать небольшое введение и дать ответ на один вопрос про семантический способ измерения информации. Кем введен он? Предложил использовать этот метод основатель кибернетики Норберт Винер, но значительное развитие он получил под влиянием нашего соотечественника А. Ю. Шрейдера. Чем же является название используется для обозначения совокупности сведений, которые есть у получателя информации. Если соотнести тезаурус с содержанием сообщения, которое поступило, то можно выяснить, насколько оно снизило неопределённость. Хочется исправить одну ошибку, под влияние которой часто попадает большое количество людей. Так, они считают, что семантический способ измерения информации введен Клодом Шенноном. Неизвестно, как именно возникло это заблуждение, но это мнение неверно. Клод Шеннон ввёл статистический способ измерения информации, «наследником» которого и считается семантический.

Графический подход для определения объема смысловой информации в полученном сообщении

Для чего нужно что-то рисовать? Семантический способ измерения использует такую возможность для наглядного предоставления данных о полезности данных в виде легко понимаемых рисунков. Что же это значит на практике? Для пояснения положения дел строят зависимость в виде графика. Если у пользователя отсутствуют знания о сути сообщения, которое было получено (равняется нулю), то объем семантической информации будет равен этому же значению. Можно ли найти оптимальное значение? Да! Так называется тезаурус, где объем семантической информации максимальный. Давайте рассмотрим небольшой пример. Допустим, пользователю поступило сообщение, написанное на незнакомом иностранном языке, или же человек может прочитать, что там написано, но это для него уже не является новостью, поскольку всё это известно. В таких случаях говорят о том, что в сообщении содержится ноль семантической информации.

Историческое развитие

Вероятно, об этом следовало поговорить немного выше, но наверстать упущенное ещё не поздно. Первоначально семантический способ измерения информации введен Ральфом Хартли в 1928 году. Ранее упоминалось, что в качестве основателя часто упоминают Клода Шеннона. Почему же возникла такая путаница? Дело в том, что, хотя семантический способ измерения информации и был введён Ральфом Хартли в 1928 году, обобщили его в 1948 году именно Клод Шеннон и Уоррен Уивер. После этого основоположник кибернетики Норберт Винер сформировал идею тезаурусного метода, которая получила наибольшее признание в виде меры, разработанной Ю. И. Шнейдером. Следует отметить, что для того чтобы разобраться в этом, необходим достаточно высокий уровень знаний.

Результативность

Что же нам даёт тезаурусный метод на практике? Он является реальным подтверждением тезиса о том, что информация обладает таким свойством, как относительность. При этом следует отметить, что она обладает относительной (или же субъективной) ценностью. Для того чтобы можно было объективно оценивать научную информацию, ввели понятие общечеловеческого тезауруса. Его степень изменения и показывает значительность знаний, которые получает человечество. При этом нельзя точно сказать, какой конечный результат (или же промежуточный) можно будет получить от информации. Возьмём, к примеру, компьютеры. Вычислительная техника создавалась на основе ламповой технологии и битового состояния каждого структурного элемента и первоначально использовалась для осуществления расчетов. Сейчас же почти у каждого человека есть что-то, что работает на основании данной технологии: радио, телефон, компьютер, телевизор, ноутбук. Даже современные холодильники, плиты и умывальники содержат в себе немного электроники, в основе работы которой лежит информация об облегчении использования человеком данных бытовых устройств.

Научный подход

Где же изучается семантический способ измерения информации? Информатика - вот та наука, которая занимается различными аспектами этого вопроса. В чём же заключается особенность? В основу способа положено использование системы «истина/ложь», или же битовая система «единица/ноль». Когда поступает определённая информация, то она разбивается на отдельные блоки, которые именуются подобно единицам речи: слова, слоги и тому подобное. Каждый блок получает определённое значение. Давайте рассмотрим небольшой пример. Рядом стоят два друга. Один обращается ко второму со словами: «Завтра у нас выходной». Когда дни для отдыха - знает каждый. Поэтому ценность этой информации нулевая. Но если второй скажет, что он завтра работает, то для первого это будет неожиданность. Ведь в таком случае может оказаться, что будут нарушены планы, которые строил один человек, например, сходить поиграть в боулинг или же покопаться в мастерской. Каждую часть описанного примера можно описать с помощью единиц и нулей.

Оперирование понятиями

Но что же используется ещё, кроме тезауруса? Что ещё нужно знать, чтобы понимать семантический способ измерения информации? Основные понятия, которые дополнительно можно изучить ещё, - это знаковые системы. Под ними понимают средства выражения смысла, вроде правил интерпретации знаков или же их сочетаний. Давайте рассмотрим ещё один пример из информатики. Компьютеры оперируют условными нулями и единицами. По сути, это низкое и высокое напряжение, которое подаётся на компоненты техники. Причем передают они эти единицы и нули без конца и края. Как же делать различие между ними технике? Ответ на это был найден - прерывания. Когда передаётся эта же самая информация, то получаются различные блоки вроде слов, словосочетаний и отдельных значений. В устной человеческой речи для разбивки данных на отдельные блоки тоже используются паузы. Они настолько незаметны, что большинство из них мы замечаем на «автомате». В письме для этой цели служат точки и запятые.

Особенности

Давайте затронем ещё и тему свойств, которые есть у семантического способа измерения информации. Мы уже знаем, что так называется специальный подход, которые оценивает важность информации. Можно ли говорить, что данные, которые будут оцениваться таким способом, будут объективными? Нет, это не верно. Информация является субъективной. Давайте рассмотрим это на примере школы. Есть отличник, который идёт впереди утверждённой программы, и среднестатистический середнячок, который изучает то, что излагается на занятиях. Для первого большинство информации, которую он будет получать в школе, будет представлять достаточно слабый интерес, поскольку он это уже знает и не впервые слышит/читает. Поэтому на субъективном уровне для него это будет не очень ценно (за счёт разве что отдельных замечаний учителя, которые он подметил за время изложения своего предмета). Тогда как середнячок о новой информации что-то слыхал только отдаленно, поэтому для него ценность данных, которые будут излагаться на уроках, на порядок больше.

Заключение

Следует отметить, что в информатике семантический способ измерений информации - это не единственный вариант, в рамках которого можно решать имеющиеся задачи. Выбор должен зависеть от поставленных целей и присутствующих возможностей. Поэтому, если тема заинтересовала или же в ней существует потребность, то можно только настоятельно порекомендовать изучить её более подробно и узнать, какие ещё способы измерения информации, кроме семантического, существуют.

Объем информации измеряется количеством символов (разрядов) в сообщении. В разных системах исчисления один разряд имеет различный вес и соответственно меняется единица измерения данных. К примеру, сообщение "10111011" в бинарной системе имеет объем данных а = 8 бит, а в десятичной - V = 8 дет.

Для измерения содержания информации, т.е. ее количества на семантическом уровне, наибольшее признание получила степень тезауруса, что связывает семантические свойства информации со способностью пользователя воспринимать сообщение, которое поступило. Тезаурус - это совокупность справочников, которые применяет пользователь ИС

Прагматическая мера информации - ценность информации для достижения пользователем поставленной цели. Эта мера - величина относительная, обусловленная особенностями использования информации в той или иной ИС.

Ценность информации определяется ее количеством, необходимым для достижения поставленной пользователем цели.

Если до получения информации вероятность достижения цели равна Р г, а после ее получения - Р 2 , то ценность информации определяется по формуле Ип(Г,/Г 2) за Клодом Шенноном.

Способ определения вероятности меры ценности информации для достижения цели было предложено М. Бонгартом и А. Харкевичем. Это можно сформулировать так: если достижение цели вероятное и значение этой вероятности известно до получения информации, а также после получения информации, то меру ценности информации можно определить по формуле

В=ош 2 (Г/г),

где V - мера ценности информации; г - вероятность достижения цели до получения информации; Р - вероятность достижения цели после получения информации.

Ценность информации всегда связано с ее конкретным получателем, с конкретной целью, которую он хочет реализовать, и с конкретными возможностями реализации этой цели.

Следует отметить такие свойства информации через ее воспроизводственный жизненный цикл: способность к накоплению, обобщению, систематизации, копирование, кодирование, адресной направленности и т.д. (рис. 1.1).

Рис. 1.1. Жизненный цикл информации через предоставление услуг в информационном обществе

Перечислим некоторые свойства информации: полнота, достоверность, ценность, адекватность, актуальность, четкость, доступность, неисчерпаемость, кумулятивность, понятность, субъективность.

Полнота информации характеризует качество информации и определяет достаточность данных для принятия решений. Понятие полноты информации связано с ее содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.

Форма также является важным фактором в отражении информации. Информационные продукты подаются в типичной для определенных отрасли, корпорации, подразделения форме.

Достоверность информации - ее свойство отражать реальные объекты с необходимой точностью. Достоверность информации измеряется вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности. Недостоверная информация характеризуется информационным шумом, и чем он выше, тем ниже достоверность информации.

Ценность информации не может быть абстрактной. Информация должна быть полезной и ценной для определенной категории пользователей. Ценность информации зависит от того, какие задачи можно решать с ее помощью.

Адекватность информации характеризует степень соответствия информации реалиям. Адекватная информация - это полная и достоверная информация.

Актуальность информации - степень сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения определенной информации. Актуальность является важным при работе в постоянно изменяющихся условиях. Своевременная подача информации в любой сфере человеческой деятельности является критическим моментом, потому что за определенный период времени она может терять свою ценность. На каждом уровне вырабатываются свои информационные продукты, связанные с определенными временными промежутками.

Своевременность информации - ее поступление не позже заранее определенного времени, согласованного с временем решения поставленной перед пользователем задачи. К примеру, для бухгалтерии - это ежесуточные оперативные, ежемесячные, ежеквартальные и ежегодные отчеты.

Четкость информации - информация должна быть понятна тому, кому она предназначена.

Доступность информации - это возможность получения и преобразования информации. На это свойство информации влияют одновременно как доступность данных и возможность применения адекватных методов. К примеру, в информационной системе информация превращается в доступную и удобную для восприятия пользователем форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.

Точность информации - степень сходства полученной информации к реальному состоянию объекта, процесса, явления и т.д. Различают: формальная точность, измеряемая значением единицы младшего разряда числа; действительную точность, что обусловлено значением единицы последнего разряда числа; максимальную точность, которую можно получить в конкретных условиях функционирования системы; необходимую точность, что обусловлено функциональным назначением показателя.

Субъективность информации. Информация имеет субъективный характер, поскольку ее ценность определяется степенью восприятия субъекта (получателя информации).

Полезная информация - свойство, которое уменьшает неопределенность принятия решения.

Качество - это характеристика информационных продуктов. Эффективность использования информации предопределяет репрезентативность, содержательность, достаточность, актуальность, своевременность, точность, достоверность, устойчивость.

Репрезентативность информации - правильность ее отбора и формирования для адекватного отражения свойств объекта. Важнейшее значение здесь имеют: правильность концепции, на базе которой сформулировано исходное понятие; обоснованность отбора существенных признаков и связей отображаемого явления. Нарушение репрезентативности информации нередко приводит к существенным погрешностям.

Наряду с коэффициентом содержательности, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества синтаксической информации к объему данных.

Постоянство информации - ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и ее репрезентативность, связано с избранной методикой отбора и формирования. Актуальность, своевременность, точность и достоверность информации влияют на другие параметры функционирования ИС, среди которых такой, как ее надежность.

Понятие информации, данных, знаний родственные. Во многих ситуациях часто бывает достаточно интуитивного понимания и интерпретации этих категорий. Сложность формального определения терминов "информация", "данные", "знания" заключается в общеупотребительности этих терминов. Другой причиной терминологической путаницы является тот факт, что граница между этими терминами для большинства специалистов достаточно условна.

Данные - это элементарные описания предметов, событий, действий и транзакций, запоминающиеся, классифицируются и хранятся, но никак не организованы.

Информация - это данные, которые организованы так, что они имеют определенное значение и ценность для пользователя.

Знание состоят из данных или информации, организованы и обработаны с целью передачи определенного понимания, накопленного опыта, результатов обучения и экспертизы таким образом, что могут использоваться для решения проблем или выполнения действий.

Данные можно рассматривать как базовое понятие. Попытка дать определение базовым понятиям приводит к необходимости дополнительно определять используемые термины.

Данные - это сведения, показатели, необходимые для ознакомления с кем-, чем-либо, для характеристики кого -, чего-либо для определенных выводов и решений; их отношения, словосочетания и факты, путем преобразования и обработкой которых можно получить информацию о предметы, процессы или явления.

В широком смысле данные являются фактами, текстом, графиками, картинками, звуками, аналоговыми или видеоматериалами. Они могут быть получены в результате измерений, экспериментов, арифметических и логических операций. Данные должны быть представлены в форме, пригодной для хранения, передачи и обработки. Они являются сырьем для создания информации.

Данные разделяют на структурированные, неструктурированные, распределены. Итак, данные - это необработанный материал, предоставляется поставщиками данных и используется потребителями для формирования информации на основе данных.

Данные с точки зрения программного кода - это часть, совокупность значений определенных ячеек памяти, преобразование которых осуществляет код. Контроль за доступом к данным в современных электронно-вычислительных машинах (ЭВМ) осуществляется аппаратно. По принципу фон Неймана одна и та же область памяти ЭВМ может выступать как данные и как исполняемый код.

Данные представляются в персональном компьютере в виде файлов, которые бывают двух типов - двоичные (бинарные) и текстовые; бинарные обрабатываются специализированным программным обеспечением, а текстовые - стандартным.

Модель данных в информационных технологиях и системах - это средства представления информации в информационных системах, методы и технологии обработки информации. Модель данных в языках программирования - это определенные структуры данных, ограничения целостности и операции манипулирования данными.

Модель данных в базах данных (БД) - это совокупность методов и средств определения логической структуры БД и динамического моделирования состояний предметной области (ПрО) в БД.

Традиционно структуры данных считают декларативными знаниями, которые отражают О. Над структурами данных может осуществляться упорядоченная последовательность операций - программа, которая реализует определенный алгоритм. Результатом работы программы всегда есть декларативные знания, а сама программа - процедурными знаниями. Тип данных является абстрактной концепцией, что определяется набором логических возможностей. Как только абстрактный тип данных и связанные с ним операции определены, можно реализовать этот тип данных. Реализация может быть аппаратной, когда для выполнения необходимых операций разрабатываются специальные электронные схемы, что является частью самой ЭВМ. Или же это может быть программная реализация, когда программа, состоящая из существующих аппаратных инструкций, интерпретирует битовые строки необходимым способом. Программная реализация включает спецификацию того, каким образом объект с данными нового типа представлен объектами уже существующих типов данных, а также спецификацию того, каким образом с помощью определенных для такого объекта операций осуществляется работа с ним.

Переход от данных к знаниям - следствие развития и усложнения информационно-логических структур, обрабатываются на ЭВМ.

Знание - форма существования и систематизации результатов познавательной деятельности человека. Это субъективный образ объективной реальности, т.е. отражение внешнего мира в деятельности человека, в формах его сознания и воли. Знания могут различаться по уровню представления (конкретные и абстрактные) и уровнем детализации данных, быть полными или неполными, достоверными или недостоверными.

Знание - это закономерности предметной области (принципы, связи, законы), полученные в результате практически" деятельности и профессионального опыта, позволяющие специалистам решать задачи предметной области.

Предметная область (О) - это та часть реальности, что вызывает у человека специальный интерес и ней выделяется из общей картины окружающей объективной действительности.

Понятие "знания" имеет такие значения: 1) понимание, приобретаемое фактическим опытом; 2) состояние информированности о том или ином владение информацией, диапазон информированности; 3) акт понимания: ясное восприятие истины; 4) то, что можно понять и держать в голове (энциклопедический словарь Webster). Наблюдается значительный интерес к технологиям аккумуляции знаний и автоматизации интеллектуального анализа информации с целью выявления новых знаний. Свидетельством этого является, в частности, попытки вслед за понятиями "информационное общество", ввести термины "менеджмент знаний", "экономика знаний".

Важнейшим ресурсом современного предприятия, способным значительно повлиять на повышение его конкурентоспособности являются корпоративные знания. Знания становятся весомым фактором производства наряду с ресурсами, капиталом, трудом.

Сегодня нас окружают огромные объемы информации. Количество информационных потоков постоянно возрастает, но мы оказываемся неспособными использовать их. Знания приобретают различных форм, и поэтому ими становится сложнее управлять.

Необходимо отметить разницу между неявными и явными знаниями. Неявные знания (их трудно определить) часто не формализуются и не поддаются анализу, не способствуют накоплению опыта, навыков и т.д. Неявными знаниями может обладать отдельный человек или группа людей. Явные знания пользуются четкими алгоритмами с соответствующими данными, сообщениями, словами и числами.

Корпоративные знания разделяют на внешние и внутренние. К первой группе относятся, например, знания о клиенте (самое важное знание для большинства предприятий), независимая аналитическая информация (маркетинговые отчеты и рейтинги, цены на международных фондовых биржах, динамика изменения американских фондовых индексов и т.п.).

Ко второй группе относят знания о главных процессы

Накопление лучшего опыта при выполнении основных задач; о товарах/услугах; оптимальные решения, соответствующие текущим потребностям пользователей; знания сотрудников

Выявление, накопление и использование интеллектуального капитала; имеющийся опыт; персональные знания, которые обеспечивают успешное сотрудничество; интеллектуальные активы (базы знаний)

Опыт ведения проектов (образцы лучших практик).

Управление знаниями - это совокупность процессов, которые связаны с созданием, распространением, обработкой и использованием знаний. Это технология поиска и получения новых знаний, их носителей, структуризации, систематизации, распространения и их генерации. Это не отдельный программный продукт, а комплексная стратегия управления государством, регионом, предприятием, орієно-вана на максимальное использование его интеллектуального потенциала.

Управление знаниями (УЗ, англ. - knowledge management)

Это стратегия предприятия, цель которой заключается в выявлении всей полезной информации, что есть на предприятии, изучении опыта и повышении квалификации сотрудников с целью улучшения качества обслуживания клиентов и сокращения времени реакции на динамику рынка. УЗ - это установленный в корпорации формальный порядок работы с информационными ресурсами для облегчения доступа к знаниям и повторного их использования с помощью современных ИКТ. При этом знания классифицируются и распределяются по категориям в соответствии с онтологии струк-турованих и полуструктурированных баз данных и баз знаний. Основная цель УЗ - сделать знания доступными и повторно используемыми на уровне всей корпорации.

Ресурсы знаний различаются в зависимости от отраслей хозяйства и применения, но традиционно они включают руководства, письма, новости, информацию о заказчике, сведения о конкурентах и данные производства.

Для применения систем УЗ используются разнообразные технологии: электронная почта; базы и хранилища данных; системы групповой поддержки; информационно-поисковые системы; корпоративные сети и Internet; экспертные системы и системы баз знаний; интеллектуальные системы и т.д. В системах искусственного интеллекта, базы знаний генерируются для экспертов и систем, базирующихся на знаниях, в которых компьютеры используют правила вывода для получения ответов на вопросы пользователя.

Традиционно разработчики систем УЗ ориентировались лишь на отдельные группы потребителей, в частности менеджеров, которые работают с исполнительными информационными системами (Executive Information System). Современные системы управления знаниями ориентированы на поддержание работы предприятий.

Предприятия сейчас переходят к использованию хранилищ данных, чтобы все сотрудники могли использовать распределенную информацию для своих знаний.

Хранилища данных подробно рассмотрены в разделе 7. Они отличаются от традиционных БД тем, что проектируются для поддержки процессов принятия решений, а не для эффективного сбора и обработки данных. При условии, что все данные хранятся в едином хранилище, изучение связей между отдельными элементами данных может быть точным, а результатом анализа становятся новые знания. Альтернативный подход, что называется разведкой знаний, применяется для поиска в данных дополнительных, скрытых там знаний.

Если хранилища данных содержат в основном количественные данные, то хранилища знаний ориентированы в основном на качественные данные. Системы управления знаниями генерируют знания широкого диапазона баз данных, хранилищ данных, бизнес-процессов, статей новостей, внешних баз, Web-страниц и др. Таким образом, хранилища знаний подобные виртуальных складов, где знания распределены среди большого количества серверов.

Знания можно добывать из бизнес-процессов, обзоров и других источников. Базы знаний (БЗ) могут быть спроектированы из расчета на ведение хронологии деятельности предприятия, что касается, например, работы с клиентами. БЗ могут использоваться для поддержки операций или генерации информации о бизнесе в целом. Базы знаний оптимальных решений накапливают знания в процессе использования различных тестов при поиске эффективных путей решения задач. После того, как организация получила знания о наилучшем решения, доступ к ним может быть открыт для сотрудников корпорации.

Разведка знаний является новым направлением, которое быстро развивается и использует методы искусственного интеллекта, математики и статистики для приобретения знаний из хранилищ данных. Г. Пятецкий-Шапиро и В. Фролей определяют срок "разведка знаний" как нетривиальная получение точной, ранее неизвестной и потенциально полезной информации из данных. Этот метод включает инструментарий и различные подходы к анализа как текста, так и цифровых данных.

Основная цель систем разведки знаний - переход от традиционного метода интуитивного принятия решений на основе неполной информации управления, базирующиеся на знаниях.

Разведка знаний в современных условиях осуществляется для достижения двух целей - снижения рисков и обеспечения безопасности операций, а также получения конкурентных преимуществ. Современная система разведки знаний позволяет не только осуществлять мониторинг информации, но и моделировать стратегию конкурентов, выявлять их партнеров, поставщиков, выяснять условия сотрудничества.

Основные задачи систем разведки знаний заключаются в поиске и обобщении информации о конкурентах, рынки, товары, тенденции развития бизнеса и т.д. Например, система Odie (On demand Information Extractor) постоянно сканирует около тысячи статей с последними новостями для получения знаний об изменениях в управлении. Есть также возможность использования функции, отслеживает напівструктурований текст для сбора информации о других типах событий, связанных с бизнесом.

Одним из важнейших и перспективных направлений в области формализации знаний, что дает возможность использования накопленных знаний для компьютерной обработки, являются онтологии, рассмотрены в главе 9.

Задачи систем управления знаниями (СУЗ) - накапливать структурированные, формализованные знания: закономерности и принципы, которые помогают решать реальные производственные задачи. Основная цель СУЗ - сделать знания доступными и повторно используемыми на уровне всей корпорации. Функции СУЗ: 1) сбор знаний; 2) хранение и обработка знаний; 3) доставка знаний. Онтология - это точное описание концептуализации. В СУЗ корпораций онтологические спецификации могут ссылаться на таксономию задач, которые определяют знания для системы. Онтология формирует словарь, который совместно используется в СУЗ для упрощения общения, запоминания и представления. Разработка и поддержка онтологий в масштабе целого предприятия требует постоянных усилий для ее развития. Онтология, в частности, необходима для того, чтобы пользователь мог работать с базами данных оптимальных решений, которые касаются широкого круга проблем предприятия, и распознавать, какое решение может ему быть полезным в конкретной ситуации. Поскольку предприятия поддерживают различные виды деятельности, то для одной СУЗ необходимо использование нескольких онтологий. Для транснациональных компаний онтология должна быть переведена на разных языках, чтобы информация, которая хранится в базах знаний, была доступна всем сотрудникам. Со временем отрасли промышленности придут к колаборативних групп или формы подписки на централизованное обслуживание общей онтологии. Кроме онтологии для использования знаний огромное значение имеют дополнительные описательные атрибуты. Примерами описательных атрибутов могут служить сотрудник, предприятие, статус информации. Теоретически все базы знаний хранят информацию о контакт или сотрудника, включая имя, дату контакта, роль контактирующей лица в генерации знаний. Много баз знаний сохраняют организационную информацию, например отчеты о том, в каком подразделении разработан проект или собрано знания. Статус информации также является типичным описательным атрибутом и может включать, например, признак состояния определенного элемента: планируемый, применяемый сегодня или устаревший. Это может быть также запись о том, информация предназначена только для внутреннего использования или может быть распространена За пределы организации.

Качество и актуальность знаний зависят от многих факторов, например от того, кто поставляет знания в систему. Поскольку качество знаний изменяется от источника к источнику, системы часто отбирают знания, чтобы они были полными и достоверными.

Фильтрация не всегда выполняется сотрудниками компании. Чаще всего используется фильтрация сообщений электронной почты по приоритетам и категориям. Кроме того, применяются различные средства, позволяющие отслеживать качество баз данных. Обычно оценка зависит от потребностей конкретных сотрудников, рабочих групп или интересов всего предприятия.

Базы знаний часто содержат огромное количество информации, поэтому поиск нужной информации становится экстремально критической функцией. Большинство современных методов поиска включают инструментальные средства, средства интеллектуального поиска и визуальные модели.

Широкий диапазон хорошо известных инструментальных средств поиска (Google, AltaVista, Excite, Infoseek, Lycos, WebCrawler, Yahoo!) использовано для информационной навигации сетью Internet. Все они могут быть адаптированы к внутрішньокор-поративних потребностей при работе с системами управления знаниями.

С помощью средств интеллектуального поиска можно найти нужные данные в информационной среде Internet или корпоративных сетях. Например, InfoFinder изучает интересы пользователей с наборами классифицированных ими сообщений или документов.

Основываясь на синтаксисе сообщений, InfoFinder пытается определить ключевые фразы, которые помогают понять задачи пользователя. Среди новых тенденций в сфере проектирования систем поиска эффективных систем управления знаниями можно выделить метод визуальных моделей. Два инструментарии - Perspecta и InXight - представляют различные методы визуализации знаний.

Компания Perspecta создает инт телектуальний контекст, используя метаинформацию, выделенную из исходных документов, включая структурированную информацию в БД и документах, или неструктурированные данные в офисных документах и Web-страницах,

Для неструктурированных документов Perspecta имеет специальное средство Document Analysis Engine, который выполняет лингвистический анализ и автоматически помечает документы. Сервер интеллектуального контекста анализирует замеченную информацию, идентифицирует взаимосвязи между документами и строит многоразмерный информационное пространство, используя специальный язык отметок (Information Space Markup Language). Для экономии ресурсов данные выгружаются клиенту с помощью информационного потокового протокола (Information Streaming Transport Protocol), который является расширением HTTP.

Компания InXight Software выпустила собственный средство визуализации - VizControl, что предлагает несколько форматов визуализации. Каждый из них развивает метод фокус-контекст. Данные выводятся на экран и в то же время сохраняется структура больших наборов данных.

Эксплуатация систем управления знаниями требует информационной культуры совместного использования знаний.

При использовании систем управления знаниями предприятия получают возможность обеспечить собственную конкурентоспособность, что упрощает повторное использование имеющихся знаний и дает возможность создавать новые знания с целью принятия качественных решений.

Для создания СУЗ на предприятиях используют такие технологии и системы, как базы знаний и хранилища данных, интеллектуальные информационно-поисковые системы, системы получения данных, экспертные системы и т.д. Примером использования СУЗ на предприятии является система поддержки обслуживания клиентов менеджерами - система управления отношениями (Relation Management System). СУЗ подают знания как в форме, удобной для нашего восприятия, так и в цифровом виде. В первом случае доступ к знаниям можно получить используя броузеры и системы интеллектуального поиска. Но иногда знания, доступные в машинном формате, могут быть спроектированы как базы знаний экспертных систем для поддержки принятия решений.

Модель представления знаний (МПЗ) - это система формализмов (понятий и правил), согласно которым информационная система подает знания в памяти ЭВМ и осуществляет операции над ними. МПЗ делятся на логические (индуктивные, исчисление предикатов и т.д.) и эвристические (сетевые, фреймові и продукционные).

МПЗ могут быть условно разделены на концептуальные и эмпирические. Концептуальная модель использует эвристический метод для решения проблемы. Она делает возможным распознавание проблемы, позволяет уменьшать время для ее предварительного анализа. Практическое использование концептуальной модели вызывает необходимость преобразования ее в эмпирическую. Знания могут быть накоплены в виде эмпирических моделей, как правило, описательного характера. Эти модели могут варьировать от простого набора правил до полного описания того, как лицо, принимающее решение, решает задачу.

МПЗ необходимые для создания специальных языков описания знаний и манипулирования ими, формализации процедур сопоставление новых знаний с уже имеющимися, для формализации механизмов логического вывода новых знаний из уже существующих.

Знание Об содержат описание субъектов, их окружение и отношения между ними. Знания определяются как основные закономерности, позволяющие человеку решать конкретные производственные, научные и другие социально-экономические задачи, т.е. факты, понятия, взаимосвязи, оценки, правила, фактические знания, а также стратегии принятия решений. Традиционные 1С включают алгоритмические знания, содержащихся в программах. Эти знания являются неотъемлемой частью программ и вводятся разработчиками программ заранее.

МПЗ часто бывает противоречивой, неполной и нечеткой и нуждается в формализации, которая осуществляется с использованием многозначительного логики, теории нечетких множеств, вероятностных и статистических методов.

Необходимость повышения эффективности функционирования предприятий, совершенствование систем управления привело к осознанию того, что ценностями организации являются не только ЕЕ активы, продукция, имущество, но также и ее знания, опыт, кваліфінація работников, культура, т.е. все то, что входит в понятие "интеллектуальный капитал".

Компания Gartner Group считает, что управление знаниями - это бизнес-процесс для управления интеллектуальными активами предприятия (рис 1.2), который связан со стратегией предприятия; требует организационной культуры и дисциплины, что поддерживает совместное использование знаний, сотрудничество специалистов и подразделений и стимулирует инновации; должно способствовать усовершенствованию бизнес-процессов и оптимизации производственных процессов.

Рис. 1.2. Виды функций знаний в СУЗ

Способность эффективно использовать и развивать знания, воплощать их в новые изделия и услуги превращается в важный фактор конкурентоспособности предприятия в условиях информационного общества.

УЗ обеспечивает интегрированный подход к созданию, сбору, организации и использованию информационных ресурсов предприятия и доступу к ним. Эти ресурсы включают БД, БЗ, электронные документы, описывающие правила и процедуры функционирования бизнес-процессов, явные знания и опыт работников.

Управление знаниями на предприятии состоит в оценке организационных процедур, людей, ресурсов и технологий и создании специализированных информационных систем.

УЗ включает цель управления, тактические цели (решение текущих задач предприятия), стратегические цели (повышение интеллектуального потенциала предприятия и его устойчивое развитие) и методологию управления, получения и распространения знаний.

Сегодня на стоимость большинства изделий и услуг прежде всего влияют "нематериальные активы", то есть те, что основываются на знаниях. К "нематериальных ценностей" эксперты относят информацию, бизнес-процессы, персональные способности специалистов и т.д.

Интеллектуальные активы предприятия увеличивают его конкурентоспособность и рыночную стоимость. Предприятие должно не только охранять свои патенты, авторские права, но выявлять и охранять знания своих специалистов, знания о производстве товаров/услуг, покупателей, конкурентов и т.д.

В процессе управления знаниями выделяют следующие его функции: создание - функция, результатом которой являются новые знания или модификации имеющихся знаний; выявление - функция, которая преобразует неявные знания в явные, то есть превращает индивидуальные знания в общедоступные; организации - функция классификации и категоризации знаний для навигации, запоминания, поиска и сопровождения знаний; доступа - функция передачи и распространения знаний между пользователями; использование - функция применения знаний для принятия решений.

Основными составляющими управления знаниями есть люди, которые получают, генерируют и передают знания; процессы что используются для распространения знаний; информационные системы и технологии обеспечивающих эффективную работу людей и процессов.

Базовые технологии СУЗ: инструментальные средства совместной работы людей, такие как программное обеспечение и системы управления документооборотом (groupware, workflow); системы, основанные на знаниях и прецедентах (Case-Based Reasoning); системы поиска, анализа и навигации знаний; системы, обеспечивающие взаимодействие ВД и БЗ путем естественно-языкового интерфейса.

До основных компонентов СУЗ относят: архитектуру СУЗ; средства общения пользователей с базами данных; систему поиска документов; систему выработки и принятия решений; систему получения знаний из данных; экспертные системы, объединяющие все перечисленные выше компоненты в систему управления знаниями.

Для предприятий является важной задача синхронного управления знаниями о микро - и макроэкономические показатели. Знания, которые должны быть представлены в экономической системе, могут отражать: структуру, форму, свойства, функции и возможные состояния производственной и распределительной подсистем; отношения между субъектами экономической деятельности, возможные события, в которых они могут участвовать; экономические законы и нормы; возможные эффекты действий и состояний, причины и условия возникновения рисковых событий и состояний; возможные намерения, цели, планы, соглашения и т.д.

Значение интеллектуального уровня развития населения и глубина знаний страны подчеркивается введением ООН в начале 90-х годов индекса развития человека, где наряду с продолжительностью жизни и ВВП на душу населения вводится уровень образования населения.

С этой точки зрения знания - это полный набор сведений для непосредственного решения задачи специалистами. Знание - это умение организовать процесс и направить его на достижение поставленной цели.

Свойства знаний: интерпретируемость - возможность их интерпретации, что реализуется только через работу программ с этими данными; структурированность - декомпозиция сложных объектов на более простые и установление связей между объектами классификации; связность - свойство воспроизводить закономерности фактов, явлений и причинно-следственные связи между ними; ситуативная совместимость знаний; активность - знания обеспечивают целенаправленное использование информации (неполнота знаний предопределяет их пополнения).

Информация и знания - это один из ценнейших ресурсов общества. Роль информационных ресурсов как важного ресурса развития производства, предпринимательства будет расти, поскольку они обеспечивают рост эффективности стратегического, тактического и оперативного управления на базе использования новейших технологий.

Информационные ресурсы. Информационные ресурсы снижают потребность в земле, труде и капитале, уменьшает расход сырья и энергии, применяются для развития новых видов производства.

К информационным ресурсам относят отдельные документы и массивы документов, документы в информационных системах (библиотеках, архивах, фондах, банках данных, базах знаний, других информационных системах). Информационные ресурсы являются объектами отношений физических, юридических лиц, государства.

Информационные ресурсы на машинных носителях - это специализированные информационные массивы в виде автоматизированных баз данных, а также информационные ресурсы Web-сайтов в сети Internet.

Информационные ресурсы могут быть государственными и негосударственными и как элемент имущества могут находиться в собственности граждан, органов государственной власти, органов местного самоуправления, предприятий. Можно рассматривать информационные ресурсы отдельного лица, подразделения, предприятия, страны, международной корпорации и т.д.

(IP)- это информация, которая имеет ценность в определенной и может быть использована человеком в экономической деятельности для достижения определенной цели.

Доступность информационного ресурса - это степень доступности данных и методов их обработки. Постоянство информационного ресурса отражает его способность реагировать на изменения исходных данных без нарушения необходимой точности.

Адекватность информационного ресурса - это степень соответствия реальной действительности. Неадекватная информация может образоваться при создании новой информации на основе неполных или недостоверных данных.

Правильность принятия решения потребителем информации зависит от того, насколько эта информация адекватна реальйому состояния объекта. В отличие от ресурсов, связанных с материальными предметами, информационные ресурсы являются неистощимыми и предполагают различные методы восстановления.

В информационной экономике информационные ресурсы являются основным источником добавленной стоимости.

Есть ряд особенностей, которые отличают информационные ресурсы от других видов ресурсов, а именно: они не имеют физического износа; по своей сути - нематериальные; их использование позволяет резко сократить потребление остальных видов ресурсов, что приводит к их экономии; процесс их создания и использования осуществляется с помощью ИКТ.

К особенностям ИР следует отнести то, что они влияют на эффективность производства без физического увеличения традиционных ресурсов, ускоряют процесс воспроизводства за счет уменьшения периодов производства и обращения.

Определение IP содержится в Законе Украины "О Национальной программе информатизации", которым "информационный ресурс - совокупность документов в информационных системах (библиотеках, архивах, банках данных и т.п.)".

Однако это определение не охватывает всего спектра ИР. Рассматривая ИР как составляющую информационной инфраструктуры, следует заметить, что это определение неконкретное, поскольку из него не ясно, о каких именно документах идет речь и относятся к ним, в частности, знания человека, способные повлиять на хозяйственные процессы и никак не документированы.

есть и другое мнение (А.В. Олейник, А.В. Соснин, Л.Е Німанський): "это отдельные документы и массивы документов, результаты интеллектуальной, творческой и информационной деятельности, базы и банки данных, все виды архивов, библиотеки, музейные фонды и другие, содержащие сведения и знания, зафиксированные на соответствующих носителях информации", являются объектами права собственности всех субъектов Украины и имеют потребительскую стоимость (политическую, экономическую, социокультурную, военную, историческую, рыночную,* информационную).

Информационный ресурс - организованная совокупность документированной информации, включающая базы данных и знаний, хранилища данных, файлы в информационных системах (библиотеки, архивы, документы делопроизводства и т.п.). К ним относятся рукописные, печатные и электронные издания, содержащие нормативную, распорядительную, управленческую и другую информацию по различным направлениям общественной деятельности (законодательство, политика, социальная сфера и т.д.).

Не всегда однозначно можно определить оптимальный размер необходимых ИР и их предельную цену соответственно обычных соотношений предельных издержек на получение информации и предельной выгоды от ее использования.

На макроуровне ценность информации возрастает с увеличением количества субъектов экономической деятельности, вовлеченных в ее пользование. При этом может расти цена, обусловлена увеличением платежеспособного спроса на информацию.

Выделяют организационные, научно-технические, экономические, маркетинговые, социальные, экологические ИР т.д. Важным вопросом развития теории ИР является методика их измерения, разработка критериев эффективности и оптимизации их использования.

Классификация информационных ресурсов. По территориальному признаку выделят такие IP: международные - глобальные, что не имеют территориальных границ; национальные - используются на территории отдельного государства и принадлежат ей; региональные - используются в пределах региона; локальные (местные, предприятий, организаций) - обусловлены спецификой организации системы формирования, хранения и использования ИР в распределенных информационных системах.

А. Хорошилов, С. Селетков мировые информационные ресурсы разделяют на такие: бизнес информацию; научно-техническую и специализированную информацию; массовую информацию для потребителей. Бизнес-информация подразделяется в свою очередь на следующие виды: бор жова и финансовая информация котировки ценных бумаг, валютные курсы, учетные ставки, рынок товаров и капиталов, предоставляемая биржами, специальными службами биржевой и финансовой информации, брокерскими компаниями и т.п.; статистическая информация - числовая, экономическая, демографическая, социальная информация в виде рядов динамики, прогнозных моделей и оценок, предоставляемая государственными службами, а также организациями, занятыми исследованиями, разработками и консалтингом; коммерческая информация о компаниях, фирмах, корпорациях, направлениях их работы, финансовом состоянии, ценах на продукцию и услуги, связях, операции, руководителей; бизнес-новости в сфере экономики и бизнеса.

В связи с тем, что биржевая и финансовая информация постоянно меняется, предоставлять ее нужно в режиме реального времени. Предоставление биржевой и финансовой информации должен быть более оперативным, чем коммерческой. Значение коммерческой информации в условиях рынка и конкуренции также очень важно. Эта информация используется непосредственно предпринимателями при решении следующих задач: выбор поставщиков, партнеров и размещение заказов; выход на рынок с новым товаром; поиск покупателей; слияние и покупка компаний; маркетинговые исследования анализа рынков.

Научно-техническая и специальная информация включает документальную библиографическую, реферативну и полнотекстовую информацию о фундаментальных и прикладных исследованиях, а также профессиональную информацию для юристов, врачей, инженеров и т.д.

Организации, которые работают на рынке информационных услуг, предлагают потребителям различные виды услуг, а именно:

а) доступ к предметно ориентированных баз, в том числе профессиональных, и хранилищ данных в интерактивном и периодическом режимах;

б) базы данных на жестких носителях - дискетах и компакт-дисках;

в) консультации предоставляются специалистами в области информационных ресурсов;

г) обучение доступа к информационным ресурсам и т.д. Поставщиками IP выступают коммерческие структуры,

государственные и общественные организации, частные лица, которые представляются информационными корпорациями, агентствами, службами, центрами, специализированными сайтами.

Например, в роли информационных центров могут выступать: центры, где создаются и хранятся базы данных, а также производится постоянное накопление и редактирование информации; центры, распределяющие информацию на основе разных баз данных; службы телекоммуникации и передачи данных; специальные службы, куда попадает информация по конкретной сфере деятельности для ее анализа, обобщения, прогнозирования, например консалтинговые фирмы, банки, биржи; коммерческие фирмы; информационные брокеры и т.д.

Мощным источником IP на сегодня является всемирная сеть Internet. По способам представления информации могут быть выделены следующие виды источников информации в Internet:

1) Web - сайты (порталы), на которых через ссылки на web-страницы пользователи получают доступ к информационным ресурсам;

2) телеконференции - важный источник информации; они делятся на рубрики по определенной тематике;

3) базы данных или хранилища данных, - охватывают мощные объемы различной информации;

По форме собственности информационные ресурсы бывают:

1) национальные - ресурсы независимо от их содержания, формы, времени и места создания, формы собственности, предназначенные для удовлетворения потребностей гражданина, общества, государства, включающие в свою очередь:

2) государственные - объект права государственной собственности;

3) коммунальные - объект права коммунальной собственности;

4) частные - объект права частной собственности.

По возможностям использования информационные ресурсы являются:

1) одноразовые - используются при получении в течение короткого срока для одноразового принятия решения;

2) постоянного использования - приобретаются один раз и повторно используются;

3) периодические - поступают через определенный промежуток времени и используются однократно.

Одноразовые ИР используются для решения конкретно поставленной задачи в ограниченный период времени, поэтому их создание может потребовать дополнительного финансирования. Например, информация о состоянии рынка на момент выпуска новой продукции может быть сформирована специалистами предприятия, а может быть куплена у специализированного предприятия, однако эта информация будет использована единовременно только при принятии решения об условиях выхода на рынок в указанный период.

В процессе организации сферы обработки периодических ИР следует учесть, что на основе первичных ИР формируется большое количество аналитической информации, необходимой для принятия решений менеджерами различных функциональных участков на всех уровнях управления.

Относительно систем управления информация бывает: входной - получаемую извне; выходной - поставляется предприятием в окружающую среду; внутренней - производится и используется в пределах предприятия, подразделения.

Основной задачей этого критерия классификации является распределение ролей по созданию и управлению ИР и информационными потоками.

в Зависимости от этапов жизненного цикла ИР бывают:

а) разрабатываемые - характеризуются высоким уровнем текущих расходов;

б) первичные - распространяются впервые, в течение определенного промежутка времени, характеризуются высокой цене, обусловленной затратами на разработку;

в) тиражируемые - используются при повторном распространении, характеризуются низким уровнем затрат на производство копий, функциональные характеристики информационных ресурсов определяют уровень цены;

г) архивные - хранятся и используются в производственном процессе нерегулярно.

Особую актуальность этот классификационный критерий приобретает в условиях, когда ИР является информационным продуктом.

Информационный продукт - документированная информация, подготовленная в соответствии с потребностями пользователей и представленная в виде товара. Информационными продуктами являются программные продукты, базы и банки данных и т.д. Продуктом информационной системы является ИР, для которых характерны некоторые черты классического материального товара.

Стадия жизненного цикла продукта определяет материальные и временные затраты на его производство, состав работ, возможный эффект от использования на конкретный момент времени, состояние в производственной системе. На каждом этапе жизненного цикла ИР необходимы индивидуальные подходы к управлению.

По степени прагматизма они делятся на: обязательные - ресурсы, без которых невозможно принять решение; желательные - способствуют повышению качества принимаемых решений, снижая уровень неопределенности; избыточные - существенно не влияют на принятое решение или затрудняют принятие решения за чрезмерно большой объем информации. Избыточные ИР приводят к снижению эффективности их использования.

Рост влияния ИКТ на экономическую деятельность предприятий привело к созданию на предприятиях Украины подразделений, в функции которых входит управление информационными потоками как внутри организации, так и за ее пределами, - отделов информационных технологий (информационно-аналитического обеспечения), роль которых будет возрастать.

По стоимости получения ИР являются: платные - требуют целевого вложения средств; бесплатные - получают как вспомогательный продукт деятельности предприятия или распространяются бесплатно.

Эта классификационный признак обусловлена необходимостью управления финансированием создания, обеспечения и пользования ИР, особое внимание необходимо уделить вопросу о ценности информации.

По способу получения IP бывают: специализированные - их получение планируется заранее; могут быть заказаны в сторонних организациях или подразделениях предприятия и полученные за определенный период; вспомогательные (неспециализированные) - полученные как дополнительный продукт в процессе хозяйственной деятельности предприятия или из окружающей среды; их получение предусматривается заранее и проводится целенаправленно по необходимости; случайные - их получение заранее не предполагается и не планируется.

причастностью к субъекту управления ИР являются: функциональные - формирование, обработка и использование которых предполагается перечнем работ, который выполняется в соответствии с рабочими характеристиками; дополнительно - формирование, обработка и использование которых предполагается перечнем работ, выполняемых в соответствии с дополнительными рабочими характеристиками.

Последние два критерия характеризуют ИР учитывая их создания и предназначены для выделения основной и вторичной информации с учетом ресурсов, затраченных на ее получение.

За отражением на материальных носителях ИР бывают электронные; на жестких носителях (на бумаге, дискете, диске, флешах и т.д.); традиционные. Проводятся исследования с принципиально новых видов носителей: голографических, молекулярных, кристаллографических и т.д. Очень быстро совершенствуются технологии связи, рассчитанные на передачу через интегральные каналы различных видов информации (данные, звук, изображение), полученные с различных носителей.

По способу использования ИР бывают: для узкого пользования, ценность которых растет при монопольном володійні; для широкого пользования, увеличивают ценность при их распространении.

Согласно Закону Украины "Об информации" (ст. 53), "к информационным ресурсам Украины входит вся принадлежащая ей информация, независимо от содержания, форм, времени и места создания", формы собственности, предназначенных для удовлетворения потребностей гражданина, общества, государства (рис. 1.3).

ИР, поданные с помощью электронных носителей, приобретают качественно нового состояния, становятся доступными для оперативного воспроизводства необходимой информации и превращаются в важнейший фактор социально-экономического развития общества.

Формирование ИР и их системное использование становятся объектом политических и экономических интересов как на национальном, так и на международном уровнях. Огромные средства выделяются ежегодно на разработку технологий поддержки ИР.

Следует определить проблемы обеспечения информационными ресурсами управления экономическими процессами, национальной безопасностью, социальной и общественно-политической сферами. Информационные ресурсы в управлении экономическими процессами охватывают: общегосударственный уровень, отраслевой уровень, региональный уровень, уровень субъектов экономической деятельности. Задачи и цели управления на каждом из уровней определяют состав и объем необходимых ИР и способы их использования.

общегосударственном уровне управления решаются задачи макроэкономического мониторинга, анализа и прогнозирования; обеспечение экономической безопасности; контроля за деятельностью органов государственной, региональной, местной власти. Мониторинг за хозяйственной деятельностью предприятий требует оперативного доступа к соответствующим IP. Система контроля за деятельностью органов государственного, местного и отраслевого управления обеспечивает анализ качества выполнения возложенных на них функций, расходование бюджетных средств, выявление нарушений.

отраслевом уровне управления решаются задачи обеспечения научно-технического прогресса, повышение производительности труда, качества продукции, роста объема производства. Научно-техническим, маркетинговым и нормативно-справочным типами ИР обеспечивается решения этих задач.

региональном уровне управления и требования к информационным ресурсам аналогичные задачей общегосударственного уровня.

ИР сфере национальной безопасности должны предотвращать таким угрозам национальной безопасности: кризисы в важных отраслях экономики (энергетике, транспорте, банковской системе и т.д.); социальным невзгодам, обусловленных ростом безработицы и падением жизненного уровня; прихода к власти криминальных группировок; перехода под контроль иностранного капитала важной части национальных ресурсов; разрушение национальной науки и культуры, снижению образовательного и культурного уровня населения, распространению идеологии насилия, различных сектантских религиозных течений; оттока за границу финансовых, интеллектуальных и информационных ресурсов; банкротство на государственном уровне, вызванного резким ростом внутреннего и внешнего долга; потери стратегических интересов на международной арене.

Информационные ресурсы в управлении социальной и общественно-политической сферами должны обеспечивать решение следующих задач:

1) социальное регулирование и уменьшение социальной расслоенности и напряженности в обществе;

2) социальная защита населения (пенсионное, социальное страхование, страхование на случай безработицы, страхование от несчастных случаев на производстве);

3) анализ и управление общественным мнением;

4) защита национального единого информационного пространства;

5) развитие культурно-образовательного уровня населения. Основным ресурсом общественной системы являются люди. Основное

назначение информационного ресурса в этой сфере - обеспечить социальную защиту, а также необходим для развития общества культурный, образовательный и политический уровень населения. Основными источниками информации о состоянии ИР человека являются: данные индивидуального учета в системе государственного социального страхования; данные переписи населения; выборочное обследование домохозяйств; опросы общественного мнения; социальные данные (уровень потребления, доходов и сбережений по категориям населения, индексы цен потребления, прожиточный минимум, стоимость корзины потребления).

Исследование сущности ИР на макроуровне помогает систематизировать их основные свойства, к которым относятся: простота тиражирования и распространения; актуальность; отсутствие количественных ограничений; фиксированность; вимірюваність; неизменность при использовании; действенность (способность достигать материальных изменений); репрезентативность; содержательность; достаточность; своевременность; точность; достоверность; структурированность; системность и т.д.

Под информационными ресурсами на микроуровне понимают информацию, которая является ценностью для предприятия и оценивается, как и другие материальные ресурсы. Если рассматривать IP на микроуровне, то они являются непосредственным продуктом интеллектуальной деятельности квалифицированной части трудоспособного населения страны.

Иначе говоря, ИР отождествляются, по сути, со всей полезной информацией, что ее производит общество или мировое сообщество.

Основу интеллектуальных ИР составляют результаты творческой деятельности, научных исследований и опытно-конструкторских разработок (НИОКР), которые позволяют создавать наукоемкие изделия, использовать технические и научные идеи, зафиксированные в различных документах и изданиях. Как особую часть выделяют активные ИР, т.е. информация, доступная для автоматизированного поиска, хранения, обработки (программы, базы данных, базы знаний, хранилища данных, документы и т.д) и для широкого пользования.

Эффективность использования ИР определяется отношением их активной части до общего объема информационных ресурсов.

В информационном обществе ИР рассматривается как важный фактор качественных изменений в жизни общества. При этом вполне в соответствии с реалиями современной цивилизации выделяют два варианта эксплуатации ИР: с одной стороны, использование информатизации в промышленности и социальной сфере, а с другой - переход к высокоорганизованных постиндустриальных методов осуществления самих информационных процессов.

Синтаксическая мера информации

В качестве синтаксической меры количество информации представляет объем данных.

Объем данных V d в сообщении «в» измеряется количестве символов (разрядов) в этом сообщении. Как мы упоминали, в двоичной системе счисления единица измерения - бит. На практике наряду с этой «самой мелкой» единицей измерения данных чаще применяется более крупная единица - байт, равная 8 бит . Для удобства в качестве измерителей используются кило- (10 3), мега- (10 6), гига- (10 9) и тера- (10 12) байты и т.д. В знакомых всем байтах измеряется объем кратких письменных сообщений, толстых книг, музыкальных произведений, изображений, а также программных продуктов. Понятно, что эта мера никак не может характеризовать того, что и зачем несут эти единицы информации. Измерять в килобайтах роман Л.Н. Толстого «Война и мир» полезно, например, чтобы понять, сможет ли он разместиться на свободном месте твердого диска. Это столь же полезно, как измерять размер книги - ее высоту, толщину и ширину, чтобы оценить, поместится ли она на книжной полке, или взвешивать ее на предмет того, выдержит ли портфель совокупную тяжесть

Итак. одной синтаксической меры информации явно недостаточно для характеристики сообщения: в нашем примере с погодой в последнем случае сообщение приятеля содержало ненулевой объем данных, но в нем не было нужной нам информации. Заключение о полезности информации следует из рассмотрения содержания сообщения. Для измерения смыслового содержания информации, т.е. ее количества на семантическом уровне, введем понятие «тезаурус получателя информации».

Тезаурус - это совокупность сведений и связей между ними, которыми располагает получатель информации. Можно сказать, что тезаурус - это накопленные знания получателя.

В очень простом случае, когда получателем является техническое устройство - персональный компьютер, тезаурус формируется «вооружением» компьютера - заложенными в него программами и устройствами, позволяющими принимать, обрабатывать и представлять текстовые сообщения на разных языках, использующих разные алфавиты, шрифты, а также аудио- и видеоинформацию из локальной или всемирной сети. Если компьютер не снабжен сетевой картой, нельзя ожидать получения на него сообщений от других пользователей сети ни в каком виде. Отсутствие драйверов с русскими шрифтами не позволит работать с сообщениями на русском языке и т.д.

Если получателем является человек, его тезаурус - это тоже своеобразное интеллектуальное вооружение человека, арсенал его знаний. Он также образует своеобразный фильтр для поступающих сообщений. Поступившее сообщение обрабатывается с использованием имеющихся знаний с целью получения информации. Если тезаурус очень богат, то арсенал знаний глубок и многообразен, он позволит извлекать информацию из практически любого сообщения. Маленький тезаурус, содержащий скудный багаж знаний, может стать препятствием для понимания сообщений, требующих лучшей подготовки.


Заметим, однако, что одного понимания сообщения для влияния на принятие решения мало - надо, чтобы в нем содержалась нужная для этого информация, которой нет в нашем тезаурусе и которую мы в него хотим включить. В случае с погодой в нашем тезаурусе не было последней, «актуальной» информации о погоде в районе университета. Если полученное сообщение изменяет наш тезаурус, может измениться и выбор решения. Такое изменение тезауруса и служит семантической мерой количества информации своеобразной мерой полезности полученного сообщения.

Формально количество семантической информации I s , включаемой в дальнейшем в тезаурус, определяется соотношением тезауруса получателя S i , и содержания передаваемой в сообщении «в» информации S. Графический вид этой зависимости показан на рис.1.

Рассмотрим случаи, когда количество семантической информации I s равно или близко к нулю:

При S i = 0 получатель не воспринимает поступающую информацию;

При 0 < S i < S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

При S i -» ∞получатель имеет исчерпывающие знания и поступающая информация не может пополнить его тезауруса.

Рис. Зависимость количества семантической информации от тезаурса получателя

При тезаурусе S i > S 0 количество семантической информации I s , получаемое из вложенной сообщение β информации S вначале быстро растет с ростом собственного тезауруса получателя, а затем - начиная с некоторого значения S i - падает . Падение количества полезной для получателя информации происходит оттого, что багаж знаний получателя стал достаточно солидным и удивить его чем-то новым становится все труднее.

Это можно проиллюстрировать на примере студентов, изучающих экономическую информатику и читающих материалы сайтов по корпоративным ИС. Вначале при формировании первых знаний об информационных системах чтение мало что дает - много непонятных терминов, аббревиатур, даже заголовки не все понятны. Настойчивость в чтении книг, посещение лекций и семинаров, общение с профессионалами помогают пополнить тезаурус. Со временем чтение материалов сайта становится приятным и полезным, а к концу профессиональной карьеры - после написания многих статей и книг - получение новых полезных сведений с популярного сайта будет случаться намного реже.

Можно говорить об оптимальном для данной информации S тезаурусе получателя, при котором им будет получена максимальная информация Is, а также об оптимальной информации в сообщении «в» для данного тезауруса Sj. В нашем примере, когда получателем является компьютер, оптимальный тезаурус означает, что его аппаратная часть и установленное программное обеспечение воспринимают и правильно интерпретируют для пользователя все содержащиеся в сообщении «в» символы, передающие смысл информации S. Если в сообщении есть знаки, которые не соответствуют содержимому тезауруса, часть информации будет утрачена и величина I s уменьшится.

С другой стороны, если мы знаем, что получатель не имеет возможности получать тексты на русском (его компьютер не имеет нужных драйверов), а иностранных языков, на которых наше сообщение может быть послано, ни он, ни мы не изучали, для передачи необходимой информации мы можем прибегнуть к транслитерации - написанию русских текстов с использованием букв иностранного алфавита, хорошо воспринимаемого компьютером получателя. Так мы приведем в соответствие нашу информацию с имеющимся в распоряжении получателя тезаурусом компьютера. Сообщение будет выглядеть некрасиво, но всю необходимую информацию получателю удастся прочитать.

Таким образом, максимальное количество семантической информации Is из сообщения β получатель приобретает при согласовании ее смыслового содержания S c тезаурусом Si, (при Si = Sj opt). Информация из одного и того же сообщения может иметь смысловое содержание для компетентного пользователя и быть бессмысленной для пользователя некомпетентного. Количество семантической информации в сообщении, получаемом пользователем, является величиной индивидуальной, персонифицированной - в отличие от синтаксической информации. Однако измеряется семантическая информация так же, как синтаксическая, - в битах и байтах.

Относительной мерой количества семантической информации служит коэффициент содержательности С, который определяется как отношение количества семантической информации к ее объему данных V d , содержащихся в сообщении β:

С = Is / Vd

Лекция 2 по дисциплине «Информатика и ИКТ»

Синтаксическая мера информации

Рис. 1.1. Меры информации

Синтаксическая мера оперирует объемом данных и количеством информации I a , выраженной через энтропию (понятие неопределенности состояния системы).

Семантическая мера оперирует количеством информации, выраженной через ее объем и степень содержательности.

Прагматическая мера определяется ее полезностью, выраженной через соответствующие экономические эффекты.

Синтаксическая мера информации

Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.

На сегодняшний день наиболее известны следующие способы количественного измерения информации: объемный, энтропийный, алгоритмический.

Объемный является самым простым и грубым способом измерения информации. Соответствующую количественную оценку информации естественно назвать объемом информации.

Объем информации – это количество символов в сообщении. Поскольку одно и то же число может быть записано многими разными способами, т. е. с использованием разных алфавитов, например двадцать один – 21– XXI– 11001, то этот способ чувствителен к форме представления (записи) сообщения. В вычислительной технике вся обрабатываемая и хранимая информация вне зависимости от ее природы (число, текст, отображение) представлена в двоичной форме (с использованием алфавита, состоящего всего из двух символов "0" и "1").

В двоичной системе счисления единица измерения – бит (bit – binary digit – двоичный разряд).

В теории информации бит – количество информации, необходимое для различения двух равновероятных сообщений; а в вычислительной технике битом называют наименьшую "порцию" памяти, необходимую для хранения одного из двух знаков "0" и "1", используемых для внутримашинного представления данных и команд. Это слишком мелкая единица измерения, на практике чаще применяется более крупная единица – байт, – равная 8 бит, необходимых для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера (256 = 2 8).

Широко используются также еще более крупные производные единицы информации:

1 килобайт (кбайт) = 1024 байт = 2 10 байт;

1 Мегабайт (Мбайт) = 1024 кбайт = 2 20 байт;

1 Гигабайт (Гбайт) = 1024 Мбайт = 2 30 байт.

В последнее время в связи с увеличением объемов обрабатываемой информации входят в употребление следующие производные единицы:

1 Терабайт (Тбайт) = 1024 Гбайт = 2 40 байт;

1 Петабайт (Пбайт) = 1024 Тбайт = 2 50 байт.

В десятичной системе счисления единица измерения – дит (десятичный разряд).

Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 1011 1011 имеет объем данных V Д = 8 бит.

Сообщение в десятичной системе в виде шестиразрядного числа 275 903 имеет объем данных V Д = 6 бит.

В теории информации и кодирования принят энтропийный подход к измерению информации. Получение информации о какой-либо системе всегда связано с изменением степени неосведомлен-ности получателя о состоянии этой системы. Этот способ измерения исходит из следующей модели.

Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе α. После получения сообщения b получатель приобрел некоторую дополнительную информацию I(b), уменьшившую его неосведомленность. Эта информация в общем случае недостоверна и выражается вероятностями, с которыми он ожидает то или иное событие. Общая мера неопределенности (энтропия) характеризуется некоторой математической зависимостью от совокупности этих вероятностей. Количество информации в сообщении определяется тем, насколько уменьшится эта мера после получения сообщения.

Так, американский инженер Р. Хартли (1928 г.) процесс получения информации рассматривает как выбор одного сообщения из конечного наперед заданного множества из N равновероятных сообщений, а количество информации i, содержащееся в выбранном сообщении, определяет как двоичный логарифм N (формула Хартли):

Допустим, нужно угадать одно число из набора чисел от единицы до ста. По формуле Хартли можно вычислить, какое количество информации для этого требуется: , т. е. сообщение о верно угаданном числе содержит количество информации, приблизительно равное 6,644 единицам информации.

Другие примеры равновероятных сообщений:

1) при бросании монеты "выпала решка", "выпал орел";

2) на странице книги "количество букв четное", "количество букв нечетное".

Нельзя ответить однозначно на вопрос, являются ли равновероятными сообщения "первой выйдет из дверей здания женщина" и "первым выйдет из дверей здания мужчина". Все зависит от того, о каком именно здании идет речь. Если это, например, станция метро, то вероятность выйти из дверей первым одинакова для мужчины и женщины, а если это военная казарма, то для мужчины эта вероятность значительно выше, чем для женщины.

Для задач такого рода американский ученый Клод Шеннон предложил в 1948 г. другую формулу определения количества информации, учитывающую возможную неодинаковую вероятность сообщений в наборе (формула Шеннона):

где – вероятность того, что именно i-е сообщение выделено в наборе из N сообщений.

Легко заметить, что если вероятности … равны, то каждая из них равна и формула Шеннона превращается в формулу Хартли.

Помимо двух рассмотренных подходов к определению количества информации, существуют и другие. Важно помнить, что любые теоретические результаты применимы лишь к определенному кругу случаев, очерченному первоначальными допущениями.

В алгоритмической теории информации (раздел теории алгоритмов) предлагается алгоритмический метод оценки информации в сообщении. Любому сообщению можно приписать количественную характеристику, отражающую сложность (размер) программы, которая позволяет ее произвести.

Коэффициент (степень) информативности (лаконичности) сообщения определяется отношением количества информации к общему объему полученных данных:

, причем 0 < Y < 1.

С увеличением Y уменьшаются объемы работ по преобразованию информации (данных) в системе. Поэтому необходимо стремиться к повышению информативности, для чего разрабатываются специальные методы оптимального кодирования информации.

1.4.2.2 Семантическая мера информации

Семантика – наука о смысле, содержании информации.

Для измерения смыслового содержания информации, т. е. ее количества на семантическом уровне, наибольшее признание получила тезаурусная мера, связывающая семантические свойства информации со способностью пользователя принимать поступившее сообщение. Одно и то же информационное сообщение (статья в газете, объявление, письмо, телеграмма, справка, рассказ, чертеж, радиопередача и т. п.) может содержать разное количество информации для разных людей в зависимости от их предшествующих знаний, уровня понимания этого сообщения и интереса к нему.

Для измерения количества семантической информации используется понятие "тезаурус пользователя", т. е. совокупность сведений, которыми располагает пользователь или система.

В зависимости от соотношений между смысловым содержанием информации S и тезаурусом пользователя S p изменяется количество семантической информации I c , воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус. Характер такой зависимости показан на рисунке 1. 2.

Рис. 1. 2. Зависимость количества семантической информации, воспринимаемой потребителем, от его тезауруса I C = f(S p)

Рассмотрим два предельных случая, когда количество семантической информации I C равно 0:

При пользователь не воспринимает, не понимает поступающую информацию;

При пользователь все знает и поступающая информация ему не нужна.

Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания S со своим тезаурусом (), когда поступающая информация понятна пользователю и несет ему ранее неизвестные (отсутствующие в его тезаурусе) сведения.

Следовательно, количество семантической информации и новых знаний в сообщении, получаемое пользователем, является величиной относительной.

Относительной мерой количества семантической информации может служить коэффициент содержательности С, определяемый как отношение количества семантической информации к ее объему.



© 2024 beasthackerz.ru - Браузеры. Аудио. Жесткий диск. Программы. Локальная сеть. Windows