Новости

Все новости 2011

Производительность и издержки информационной системы: теоретический подход и практические выводы

21.04.2011

Дзюба С.А.,
к.т.н.,
доцент Иркутского государственного технического университета

Обычно, говоря об эволюции предприятия, подразумевают, что она носит прогрессивный характер, если направлена в сторону роста фирмы. Это позволяет организации мобилизовать себе на службу эффект экономии от масштаба, выражающийся в снижении предельных издержек за счёт унификации и стандартизации операций, позволяющей их автоматизировать. Это касается не только производственных функций, но и рутинных процедур учёта и управления. Поэтому от информационной системы (ИС) как средства их автоматизации ожидают получить те же выгоды, как от ткацкого станка или паровой машины. Однако уже давно было замечено, что экономия управленческого труда как прямой ожидаемый экономический эффект зачастую проявляется крайне слабо, в отличие косвенного эффекта, выражающегося в общем улучшении управления. А последнее не поддаётся корректной оценке [1].
Эту закономерность можно объяснить, если полагать, что рост предприятия встречает сопротивление в виде сопровождающей его потери управляемости, которая носит экспоненциальный, запретительный характер, почему и получила название «запрета Коуза». Система управления предприятием и информационная система как её инструментальная часть позволяют понизить показатель этой экспоненты, переводя её на более пологую траекторию, но не дают совсем устранить тенденцию к потере управляемости. Поскольку сглаживание запрета Коуза является основным результатом функционирования ИС, то для оценки её эффективности достаточно опираться на сопоставление её производительности и издержек [2].
Мной эффективность ИС рассматривается через основы принципов, делающих такую методику оценки содержательной при практическом применении.

Зачем нужна энтропия?

С точки зрения теории информации, ИС как среда передачи сообщений между взаимодействующими элементами системы управления характеризуется величиной пропускной способности, формально выражаемой в виде энтропии:
,                                 ( 1 ),
где X – множество состояний системы, на котором определена случайная величина x с вероятностями реализации : ,  – номера состояний. Прежде чем опираться на это пугающее понятие, хотелось бы ответить на вопрос, насколько оправдано его привлечение в качестве меры производительности ИС.
С точки зрения физики, энтропию методологически правомерно использовать при описании систем с большим количеством состояний, когда само их содержание для решения задачи не так уж и важно. В данном случае в [2] предприятие действительно рассматривается как множество состояний без углубления в их конкретику. Разумеется, обоснованием обращения к методологии физики являются не поверхностные аналогии, которые часто не приносят никаких результатов и вызывают справедливую критику [3], а её настойчивое проникновение естественно-научной методологии в теоретико-экономическую и в теоретико-информационную сферы, опирающееся на единство фундаментальных естественно-научных основ.
Наступление физики происходит двумя фронтами. С одной стороны, это теория самоорганизации систем, опирающаяся на результаты Ильи Пригожина (в качестве типичного представителя можно привести [4], там же и список литературы). Основной заслугой этого направления является обоснование принципиальной неравновесности сложных систем и неприменимости детерминистских методов описания действительности. В то же самое время синергетика так и не родила (есть подозрение, что и не родит) конструктивной исследовательской программы, в силу претензии на универсализм, вынуждающий даже при попытке решения конкретных задач подниматься до философского уровня, когда важным становится всё сразу.
Вторым фронтом выступает эконофизика. Мэйнстрим экономической теории (а в особенности математическо-экономической, как её формализации) пролегает в области исследования репрезентативного агента, стараясь ответить на вопрос: «Как изменение его стратегии при заданной среде повлияет на его эффективность и распределение ресурсов?» Эконофизика «переступает» через репрезентативного агента и сводит его до роли винтика в системе, где от его личной стратегии вообще ничего не зависит, а закономерности проявляются только на уровне массового поведения. Этот ключевой принцип взят из физики, где между взаимодействием отдельных молекул и ими же, но в составе газа, существуют качественные различия, не позволяющие рассматривать эти задачи как вытекающие одна из другой. Можно сказать, что матэкономическая теория и эконофизика соотносятся друг с другом, как классическая и статистическая механика [5] .
Потому нет ничего удивительного в том, что управление рассматривается как алгоритм упорядочивания состояний системы (в данном случае, фирмы). Тогда его способность осуществлять эту функцию как раз и определяется энтропией (1). В массовом сознании и даже в научной среде репутация термина «энтропия» несколько подпорчена тем, что он устойчиво ассоциируется с хаосом и воспринимается как явление, с которым необходимо бороться. В действительности энтропия – это специфическая мера мощности множества [6].

а)                                      б)                                   в)
Рисунок 1 . Иллюстрация связи частотной структуры состояний и величины энтропии. Частотные диаграммы состояний расположены по убыванию энтропии. Для визуальной сопоставимости масштабов на рис. 1 в) «верхушки» столбцов 1 и 2 находятся за границей диаграммы.
В самом простейшем случае мощность множества – это количество его элементов. Энтропия также выражает количество элементов, но ещё и учитывает их структуру, выраженную в виде удельного веса каждого элемента. Если все веса одинаковы (рис. 1а), а для (1) это будет означать , где M – это количество элементов множества состояний Х, то это свойство проявляется наиболее выпукло, поскольку тогда (1) упрощается до:
,                                                   (2 ),
известное как количество информации Хартли. Логарифм как основа выражения энтропии появился не случайно, поскольку только эта функция обеспечивает очевидное свойство, что два радиотелеграфных ключа способны передать в два раза больше информации, чем один. Уже только одно это даёт важное понимание того, почему внедрение любой системы управления или ИС поначалу даёт значительный эффект, который в дальнейшем растёт всё медленней и медленней, поскольку при малых M логарифм растёт быстрее, чем при больших.
Если веса состояний не одинаковы (рис. 1б и 1в), то начинает проявляться другое свойство энтропии, поскольку она становится меньше, чем в равномерном случае, при том же количестве состояний M. Это происходит вследствие того, что веса одних состояний «тают» (на рис. 1 это соответствует старшим номерам состояний), но из-за нелинейности логарифма это лишь частично компенсируется приростом весов других состояний. Получается, что энтропия учитывает не только количество элементов, но и их удельные веса, которые могут даже иметь значение 0, как состояния 7-10 на рис. 1в, что одновременно просто соответствует уменьшению M. Другими словами, уменьшение веса элемента энтропия отражает как его частичное «исчезновение».
Выражение (1) есть лишь частный случай более общего понятия количества информации в системе y относительно системы x:
,                                 (3 ),
где  – условная энтропия  (4 ), определённая через соответствующие условные вероятности. Здесь во вложенной сумме узнаётся (1), а во внешней – вычисление математического ожидания. Ещё основоположник этой теории Клод Шеннон определил, что в выражении (3) условная энтропия «отвечает» за «шумы» в самом широком смысле этого слова [7].

Рисунок 2 . Иллюстрация условной энтропии
Представим себе, что, как и ранее, система x выражена взвешенным набором состояний . На рис. 2 это демонстрирует самая левая гистограмма. При этом каждому реализованному состоянию из x соответствуют некоторые состояния из Y. Например, сообщению  всегда соответствует . На рис. 2 это иллюстрируется стрелкой к самой правой гистограмме. Можно также сказать, что «9´9» понимается исключительно (с вероятностью ) как «81». Для этого состояния из X обеспечивается энтропия на Y, равная нулю. Если бы точно также было и для всех остальных , то  как их математическое ожидание. Это позволяло бы сказать, что по x мы можем точно узнать всю таблицу умножения.
Но представим теперь, что, как в анекдоте про «правильного» бухгалтера, состояние  иногда понимается как , а иногда как , а иногда как . На рис. 2 это иллюстрируется стрелкой к средней гистограмме. В силу (4) это обеспечивает , что в (3) ведёт к уменьшению количества информации. Действительно, правильно таблицу умножения теперь уже не восстановишь.
Столь подробное и популярное объяснение базовых понятий потребовалось для того, чтобы подвести к тому, что для изложения и использования всех этих понятий не обязательно прибегать к теоретико-вероятностному представлению. В [8] А.Н. Колмогоров образно иллюстрирует это так «Реальные объекты, подлежащие нашему изучению, очень (неограниченно?) сложны, но связи между двумя реально существующими объектами исчерпываются при более простом схематизированном их описании. Если географическая карта даёт нам значительную информацию об участке земной поверхности, то всё же микроструктура бумаги и краски, нанесённой на бумагу, никакого отношения не имеет к микроструктуре изображённого участка земной поверхности» Другими словами, всё зависит от того, какие системы взять за x и y.
От этих рассуждений остаётся один шаг до того, что веса состояний не обязаны быть наблюдаемыми частотами в серии испытаний. В поздних работах по теории информации А.Н. Колмогоров настоятельно продвигал эту точку зрения. В частности, он определял алгоритмическую энтропию как длину минимального алгоритма в некотором языке, реализующего заданное сообщение. Например, для последовательности из 60-ти символов «а» эту задачу решает алгоритм, который можно записать как 60«а». Возвращаясь к исходной точке рассуждения, теперь с большим пониманием можно говорить, что система управления – это есть некий алгоритм, «мощность» которого, в определённом смысле, определяется его энтропией.

Компоненты производительности информационной системы

В [2] для простоты рассуждений пропускная способность (производительность) ИС выражалась мерой разнообразия её состояний, то есть энтропией в виде (1). Теперь разовьём это упрощённую трактовку, опираясь на (3) применительно к очень важной идее, рождённой в те же 1960-е годы, о представлении пропускной способности ИС как суперпозиции синтаксической, семантической и прагматической компонент (каналов) [8]. Этот подход, не получив адекватной формализации, остался только на уровне концептуальных понятий. Если же опереться на количество информации в форме (3), то формализация станет простой и логичной. Здесь также следует учитывать, что неоднозначность передачи информации, выражаемая условной энтропией, «работает» в обе стороны в смысле известного свойства:
,         (5)
В синтаксическом канале производится преобразование данных одной программной системы в другую, или бумажных документов в электронные, – всё это перевод с языка x на язык y. Принцип соблюдения целостности данных требует, чтобы  и тогда синтаксическая производительность выражается шенноновским количеством информации (1). Если же вследствие ошибок округления, или программных сбоев , то это в точности соответствует теореме К.Шеннона о вычитании энтропии шума из пропускной способности канала.
В семантическом канале рассматриваются объекты: фирма x=Ф и информационная система y=ИС как её логическое отображение. Тогда пропускная способность семантического канала  есть не что иное, как качество информации в информационной системе. Действительно, если событию объекта Ф «товар прибыл на склад» в разных конкретных случаях могут соответствовать события из ИС «товар прибыл», «товар не прибыл» или «товар прибыл, но не тот», то это приводит к росту . Если же в ИС такое событие вообще не предусмотрено, но это понижает .
Более тонкое понимание семантики системы заключается в том, что реальные индивидуализированные объекты из Ф подвергаются в ИС систематизации и стандартизации. После такого «обтёсывания» номенклатурный справочник, например, в уже не полно отражает потребительские качества товаров, справочник клиентов даёт лишь очень схематичный образ покупателя. Это «работает» на понижение , но требуется для повышения синтаксической производительности системы, поскольку если не уложить данные в «причёсанные» реляционные структуры, то никакой массовой обработки произвести невозможно. Важный вывод заключается в том, что увеличение семантической пропускной способности препятствует росту синтаксической производительности и наоборот. Поэтому одна из самых важнейших задач при воплощении ИС – это нахождение баланса между ними, причём, чем крупнее фирма, тем сильнее приходится сдвигать его в сторону синтаксической составляющей. Не стоит, исходя из этого, строить иллюзий относительно мифической гибкости крупных ERP систем. Залог их высокой производительности – это перемалывание огромного потока единообразных данных.
Прагматическая компонента П представляет собой набор показателей и индикаторов, которые должны сигнализировать о таких состояниях, которые требуют принятия решений. Это своего рода набор симптомов, по которым необходимо диагностировать здоровье или болезнь. Поэтому  – это количество информации о фирме, которым оперируют лица, принимающие решения. Чем проще «сконструирован» симптом, чем сильнее он агрегирован, тем больше оснований ожидать . Например, по состояниям фирмы, которые можно охарактеризовать как «Хорошая работа снабжения», такой «симптом», как прибыль может принимать как высокие, так и низкие значения, поскольку на него влияют ещё и многие другие факторы. Поэтому высокая агрегированность показателей позволяет принимать только самые общие решения, которые невозможно реализовать без детализации.
С другой стороны, чрезмерно детализированные представления могут утратить прагматическое содержание, поскольку уже не выражают ни проблему, ни способ её решения. В этом смысле такой прагматический элемент тоже является неоднозначным. Значит, в прагматической компоненте ИС идёт борьба не столько за широту набора средств , сколько за их однозначность, то есть за снижение .
Логическая структура этих каналов-пространств ИС такова, что они образуют последовательное «соединение». Это означает, что если пропускная способность любого из них равна нулю, то и у всей системы она будет равна нулю. Или, что то же самое, производительность всей ИС будет определяться самым «узким» из этих каналов. Действительно, если перестанет осуществляться компьютерная обработка данных, то при сколь угодно большой семантической и прагматической пропускной способности, производительность ИС будет равна нулю. Точно также низкое качество данных (малая семантическая пропускная способность) полностью обесценивает синтаксическую и прагматическую «мощь».

Информационные издержки

Увеличение производительности ИС требует роста информационных издержек. В [2] было показано, что их предельная эффективность снижается. Это означает, что равномерно растущему уровню издержек C будет соответствовать постепенно уменьшающийся рост пропускной способности H, который теперь будет рассматриваться как функция издержек (рис. 3). Рассмотрим более подробно вытекающие из этого закономерности, которые следует учитывать при оценке эффективности.
1. Кривая H представляет собой максимально возможную величину пропускной способности при заданном уровне информационных издержек, то есть соответствует случаю, когда , а . Реальный же уровень пропускной способности может соответствовать точке из подграфика этой границы эффективности, например, точке А рис. 3.

3 . Зависимость пропускной способности I информационной системы от величины информационных затрат C. Штриховая прямая H* отражает теоретический максимум пропускной способности (2). Кривые с индексом «2» соответствуют более крупной фирме, чем с индексом «1».
2. Кривая H ограничена сверху величиной  (2), где M – количество состояний системы, которое зависит от размера фирмы. Если фирма растёт то вместе с  «подтягивается» и граница эффективности . На рис. 3 точка А для случая  обеспечивает относительно более высокую пропускную способность, чем для случая , хотя её абсолютное значение не меняется. Другими словами, рост фирмы вызывает «проседание» производительности ИС: то, что было хорошо для малой фирмы, будет уже менее удовлетворительно для подросшей. Зато, теперь ИС есть, куда расти! Так, если в случае  точка Г была принципиально недостижимой, для  она уже принадлежит подграфику.
3. Под величиной издержек C нужно понимать капитализированную стоимость ИС. Поэтому каждый последующий шаг развития будет направлен в положительном направлении оси. Разумеется, в практику оценки можно внести и понятие декапитализации. Например, траектории АБ соответствует «не сработавший» проект улучшения, поэтому дальнейшее движение можно снова начинать из точки А. В состав C следует включать затраты не только на приобретение технологий и услуг внешних контрагентов, но и собственных работников, но только в части задействования их ресурсов в проектах развития ИС. Текущие (периодические) информационные издержки здесь не стоит «примешивать», хотя их отношение с производительностью принципиально имеет такой же характер, как на рис. 3. Поэтому при необходимости их можно калькулировать самостоятельно.
4. Оценка эффективности ИС опирается на соотношение производительности H и издержекC. При этом нет необходимости (да и возможности) вычислять значение H как величину энтропии. К примеру, формируется годовой бюджет развития ИС. Он предполагает реализацию набора решений по увеличению её пропускной способности. Самое сложное в этом – перестроить мышление, объяснить, что эти решения заключаются не только в приобретении технических средств и программного обеспечения (росте синтаксической производительности), но и в преобразовании непонятных отчётов в понятные, в обеспечении буксующих процессов управления информацией, делающей их более прозрачными. Понятия энтропии и количества информации в этом случае только помогают более правильно понимать, что именно подвергается улучшению и насколько значительно.
Все полученные решения можно ранжировать по степени важности задач, которые они решают. Это и будут сравнительные оценки прироста пропускной способности . Именно они в дальнейшем и потребуются, а не сама величина H. Не важно также, в каких единицах измерения будет произведена оценка. Требуется только, чтобы в этих единицах варианты решений были сравнимы между собой.
5. Каждому решению сопоставляются издержки  по его реализации. После этого важен даже не столько отбор тех решений, где эффективность как отношение  максимальна, сколько более внимательное изучение тех решений, где эти отношения самые большие и самые маленькие, поскольку эти оценки с большой вероятностью содержат ошибки. Действительно, на рис. 3 самая высокая эффективность соответствует траектории АГ. Для фирмы с границей эффективности  такое улучшение невозможно в принципе. Очень эффективные решения могут возникать только из плохой стартовой позиции, как в точке А. Стартуя из точки В, таких решений получить невозможно. Конечно, напрямую вычислить положение стартовой точки тоже нельзя, но «почувствовать» её можно, поскольку чем более зрелой и совершенной является ИС, тем сильнее будет объективное сопротивление её дальнейшим улучшениям.
Что касается неэффективных или малоэффективных решений, то здесь ошибки следует искать в способах решения задач. Скорее всего обнаружится, что небольшие улучшения ИС предполагается осуществить посредством слишком сложных механизмов. Как правило, последствия таких решений будут хуже ожидаемых, близко к траектории АБ. Тогда лучше упростить и удешевить способ реализации, либо вообще отказаться от таких решений.
6. Снижающаяся предельная производительность как свойство ИС приводит к тому, что чем больше будет бюджет её развития, тем менее эффективные решения будут в него включены. Поэтому щедрый бюджет ни в коем случае не является залогом успеха. Теория говорит о том, что оптимальная его величина должна составлять некую фиксированную долю от объёма продаж [10]. Следовательно, и расти он должен с тем же темпом, что и продажи. Практика определяет эту долю величиной 1-3%.
Использование этих правил позволит не только более точно и логично оценивать эффективность ИС, но и поможет успешно преобразовать эти оценки в более привычный вид для лиц, принимающих решения, экономическое мышление которых требует традиционного сопоставления издержек и экономического эффекта.

Литература

  • Кручинин И.А. Экономическая эффективность АСУ. М.: Знание, 1972. 48 с.
  • Дзюба С.А. Эффективность системы управления: информационный подход. // Менеджмент в России и за рубежом, 2010, №4.
  • Вишнёв С.М. Экономические параметры. М.: Наука, 1968. 190 с.
  • Катунина И.В. Системно-синергетическая концепция организационного развития. // Менеджмент в России и за рубежом, 2009, №5. с. 9-15.
  • Полуян П.В. Эконофизика и теоретические аспекты политической экономии. // ЭКО, 2009, №11. с. 57-76
  • Колмогоров А.Н. ε-энтропия и ε-ёмкость множеств в функциональных пространствах // Теория информации и теория алгоритмов. М.: Наука, 1987. с. 119-198. (1959)
  • Шеннон К. Математическая теория связи \\ Шеннон К. Работы по теории информации и кибернетике. М.: Изд-во иностранной литературы,1963. с. 243-332. (А Mathematical Theory of Communications. Bell System Techn. Journal, 1948, 27 №3, №4)
  • Колмогоров А.Н. Три подхода к понятию «количество информации» // Теория информации и теория алгоритмов. М.: Наука, 1987. с. 29-58. (1957)
  • Жеребин В.М. Экономическая информатика. // Экономическая информатика. Под ред. Жеребина В.М. М.: Наука, 1977. с.5-33.
  • Попов Е.В., Коновалов А.А. Информационные издержки предприятия: проблемы оценки и оптимизации // ЭКО. 2009, №11. с. 108-117

Рекомендую также подборку статей в «Вопросах экономики» №11 за 2009 г.

Замечание в скобках принадлежит А.Н.Колмогорову.



Все права принадлежат Издательству «Финпресс» Полное или частичное воспроизведение или размножение каким-либо способом материалов допускается только с письменного разрешения Издательства «Финпресс».