Динамические объекты управления большой размерности. Проблема размерности в динамическом программировании. Для определения элементов матриц, имеем систему алгебраических уравнений

СПИСОК ЛИТЕРАТУРЫ

1. Попов Э.В. Экспертные системы реального времени [Электронный ресурс] // Открытые системы - 1995. - № 2. - Электрон. дан. - Режим доступа: http://www.osp.ru/text/302/178608/

2. Crossland R., Sims W.J.H., McMahon C.A. An object-oriented modeling framework for representing uncertainty in early variant design. // Research in Engineering Design - 2003. - № 14. -С. 173-183.

3. Landmark Graphics ARIES [Электронный ресурс] - Электрон. дан. - 2006. - Режим доступа: http://www.geographix.com/ps/vi-ewpg.aspx?navigation_id=1273

4. Schlumberger Merak [Электронный ресурс] - Электрон. дан. -2006. - Режим доступа: http://www.slb.com/content/servi-ces/software/valuerisk/index.asp

5. Gensim G2 [Электронный ресурс] - Электрон. дан. - 2006. -Режим доступа: - http://www.gensym.com/?p=what_it_is_g2

6. Thurston D.L., Liu T. Design Evaluation of Multiple Attribute Un-

der Uncertainty // Systems Automation: Research and Applications.

1991. - V. 1. - № 2. - P. 93-102.

7. Paredis C.J.J., Diaz-Calderon A., Sinha R., Khosla P.K. Composab-le Models for Simulation-Based Design // Engineering with Computers. - 2001. - № 17. - P. 112-128.

8. Силич М.П. Системная технология: объектно-ориентированный подход. - Томск: Том. гос. ун-т систем управления и радиоэлектроники, 2002. - 224 с.

9. Силич М.П., Стародубцев ГВ. Объектная модель выбора инвестиционных проектов разработки нефтегазовых месторождений. // Автоматизация, телемеханизация и связь в нефтяной промышленности. - 2004. - № 11. - С. 16-21.

10. Хабибулина Н.Ю., Силич М.П. Поиск решений на модели функциональных отношений // Информационные технологии

2004. - № 9. - С. 27-33.

11. Jess Rete Algorithm [Электронный ресурс] - Электрон. дан. -

2006. - Режим доступа: http://www.jessru-

les.com/jess/docs/70/rete.html

ИСПОЛЬЗОВАНИЕ УПРАВЛЕНИЙ ИЗБЫТОЧНОЙ РАЗМЕРНОСТИ ДЛЯ АВТОНОМИЗАЦИИ УПРАВЛЯЕМЫХ ВЫХОДОВ МНОГОМЕРНЫХ ОБЪЕКТОВ РЕГУЛИРОВАНИЯ

А.М. Малышенко

Томский политехнический университет E-mail: [email protected]

Систематизированы сведения о влиянии управлений избыточной размерности на автономизируемость выходов стационарных линейных динамических объектов, предложены алгоритмы синтеза обеспечивающих подобный эффект прекомпенсаторов и обратных связей по состоянию и выходу.

Введение

Проблема автономного (независимого) управления составляющими управляемого выхода объекта относится к числу особо важных в практическом плане задач при синтезе систем автоматического управления (САУ), пожалуй, для большинства многомерных по выходу объектов управления. Она нашла свое отражение во многих публикациях, в том числе и монографиях, в частности в .

Более детально проработаны вопросы автоно-мизации для линейных стационарных многомерных объектов. Чаще всего ставятся и решаются задачи автономизации (развязки) каждого из выходов объекта, причем не обладающего избыточной размерностью т вектора управления (ИРВУ). В связи с недостижимостью в принципе подобного решения для многих объектов указанного типа, эта задача модифицирована в более общую задачу построчной развязки, определяемую как задача Моргана , когда для объекта с р выходами необходимо определить р множеств из т>р управлений и соответствующий закон управления, при которых каждое из множеств влияет только на один выход. Тем самым решение определяется в классе САУ с избыточной размерностью вектора управления по

сравнению с размерностью вектора управляемых переменных.

Наряду с вышеуказанными постановками, задачи автономизации сформулированы и как задачи поблочной автономизации (развязки), когда обеспечивается независимость лишь между выходными координатами, входящими в разные их блоки, но не внутри этих блоков (групп), а также каскадной автономизации. В последнем случае зависимость выходных координат между собой носит «цепочный» характер (каждая последующая зависит только от предыдущих, но не последующих в установленном для них ряде). И в этих случаях решение задач автономизации часто требует избыточности в размерности вектора управления по сравнению с числом управляемых переменных.

Условия разрешимости задач автономизации

Решения задач автономизации обычно находятся в классе линейных прекомпенсаторов либо линейных статических или динамических обратных связей, причем для этих целей применяется как аппарат передаточных матриц (чаще всего), так и методы пространства состояний, структурный и геометрический подходы. Два последних

подхода удачно дополняют первые, так как фактически только с их помощью удалось установить большинство известных условий разрешимости задач автономизации [б], дать более глубокие интерпретации их решений.

При использовании для автономизации (развязки) выходов линейного многомерного объекта прекомпенсатора, т. е. регулятора, реализующего жесткое управление в функции задания ¡d(t) без обратной связи, его передаточная матрица Wy(s) выбирается из условия

Wœ(s) = Wo(s) -W y(s), (1)

где Wo(s) - передаточная матрица объекта управления, а Wx(s) - желаемая передаточная матрица синтезируемой системы, удовлетворяющая условиям ее развязки по выходам.

Используемой для этих целей линейной статической обратной связи соответствует алгоритм управления

u(t) = F x(t) + G /u(t), (2)

а динамической -

u (s) = F (s) x(s) + G fi(s). (3)

Указанные обратные связи реализуемы как с регулярным (матрица G обратима), так и с нерегулярным преобразованием задания ¡d(t) системы.

Согласно вышеуказанные динамические обратные связи могут быть определены как частный случай динамических расширений, дополняющих объект, описываемый системой уравнений в форме «вход-состояние-выход» вида

x (t) = Ax (t) + Bu (t), y(t) = C x (t),

ua (t) p _ xa (t)_

где ха (/) = иа (/), или обобщенным операторным уравнением

и (5) = Г(5) х(5") + О(5) ¡л(5).

Управление объектом с моделью вида по алгоритму (2) дает итоговую передаточную матрицу системы

Ж^) = С (51 - (А + В Г (5))) ~1ВО =

Ж0(5) . (1 - Г(5)(51 - А) -1 В)-1 О = Ж0(5) . Н(5), (4)

где Wo(s)=C(sI-AylB и #(£) - соответственно, передаточные матрицы объекта и прекомпенсатора, эквивалентного по эффекту обратной связи; I -единичная матрица размерности нхн.

Используемое в геометрическом подходе каноническое преобразование Морза g=(T,F,G,R,S) с обратимыми T,G,S передаточной матрицы Wo(s) объекта "Lo(C,A,B)

(A, B, C) ^ (T A + BF + R C)T,T ~lBG, SCT)

сводит Wo(s) к ее бикаузальным преобразованиям слева и справа вида

W0(s) ^ Bi(s)-W0(s)-B2(s), (5)

где B1(s) = S_1;

B 2(s) = -G.

Из (4) и (5) следует, что регулярные статическая

(2) и динамическая (3) обратные связи могут интерпретироваться как бикаузальные прекомпенса-ции, т. е. могут быть заменены эквивалентными им по эффекту бикаузальными прекомпенсаторами. По отношению ко второй справедливо и обратное утверждение, однако бикаузальный прекомпенса-тор H(s) реализуем согласно в виде эквивалентной линейной статической обратной связи лишь для объекта с Wo(s) минимальной реализации, причем тогда и только тогда, когда Wo(s) и H-1(s) - полиномиальные матрицы.

Из (5) можно также сделать вывод, что бикау-зальные прекомпенсаторы и соответствующие им регулярные статическая и динамическая обратные связи не могут изменить структуру системы на бесконечности и обусловленные ею свойства, в частности минимальные инерционности (запаздывания) автономных каналов управления. Эти изменения могут быть достигнуты лишь в классе нерегулярных алгоритмов управления.

Условия разрешимости задач автономизации связаны со структурными свойствами управляемых объектов, описываемыми их списками инвариантов. Причем, необходимый для этого набор определяется тем, какой алгоритм (компенсатор) планируется использовать для этих целей. Согласно для определения реализуемых развязывающих динамических обратных связей достаточно информации о вход-выходной структуре объекта, заложенной в его передаточной матрице или в минимальной части описания в пространстве состояний. Разрешимость этой задачи с использованием статической обратной связи по состоянию устанавливается по внутренней структуре объекта управления, в частности на основе исследования его системных матриц Розенброка или Кронекера или канонической декомпозиции Морза .

Построчно развязывающий выходы объекта пре-компенсатор согласно может быть определен из (1) тогда и только тогда, когда m>p, а матрицы [ Wo(s) : W(s)] и Wo(s) имеют одинаковую структуру формы Смита-Макмиллана на бесконечности.

Если передаточная матрица объекта имеет полный строчный ранг (необходимое условие построч-

ной развязки, обеспечиваемое лишь при т>р), то развязку может обеспечить прекомпенсатор с передаточной матрицей

где Wnoб(s) - обратная справа к W0(s) матрица, а к -такое целое число, которое делает Wn(s) собственной матрицей.

В доказано, что развязка с помощью регулярной статической обратной связи (2) возможна тогда и только тогда, когда возможна развязка с помощью регулярной динамической обратной связи

(3). В свою очередь, согласно , последнее возможно тогда и только тогда, когда бесконечная структура передаточной матрицы объекта является объединением бесконечных структур ее строк.

Регулярность обратных связей фактически предполагает отсутствие у объекта избыточности в размерности вектора управления (т=р). Поэтому, если развязка в этом случае не достижима, а управляемый объект имеет потенциальную ИРВУ, то для достижения автономности управления каждой из выходных величин целесообразно воспользоваться этой избыточностью либо какими-то конструктивными изменениями объекта управления предварительно добиться у него ИРВУ. Следует также иметь в виду, что и в ситуациях, когда т>р, регулярная обратная связь может не привести к желаемому результату, в то время как в классе нерегулярных прекомпенсаторов или тех же обратных связей он может быть получен. Например, у объекта с передаточной матрицей

Нерегулярным обратным связям соответствуют просто каузальные (строго собственные) преком-пенсаторы. Поэтому образуемые ими с объектом управления системы в общем случае не будут сохранять на бесконечности структуру управляемого объекта. Этим, в частности, можно воспользоваться для обеспечения устойчивости синтезируемой системы. Напомним, что еще в было доказано, что с помощью регулярной обратной связи развязка и устойчивость системы могут быть одновременно достигнуты тогда и только тогда, когда у объекта не существует неустойчивых инвариантных нулей взаимосвязи. Последними называют такие инвариантные нули £0(С,А,Б), которые не являются одно-

временно и инвариантными нулями строчных подсистем £;(С,А,Б). Здесь с, /е 1,р - /-я строка матрицы С объекта. Эти нули по условиям развязки обусловливают ограничения на выбор полюсов синтезируемой системы. При этом множество фиксированных (не допускающих произвольного назначения) полюсов развязанной по выходам системы должно обязательно включать все инвариантные нули взаимосвязи.

Таким образом, алгоритм управления в случае правых инвариантных нулей взаимосвязи в объекте необходимо выбирать из условия, что он способен будет внести необходимую по условиям устойчивости коррекцию в структурные свойства системы. Таковыми, как показано выше, и могут быть алгоритмы с нерегулярной обратной связью, реализуемые фактически в классе систем с ИРВУ.

Полного решения задачи развязки с помощью обратной связи для объектов с правыми инвариантными нулями взаимосвязи до сих пор не получено. В частности, для ее реализации со статической обратной связью необходимо, как следует из , сделать структуру максимального подпространства управляемости, содержащегося в КегС, достаточно богатой для возрастания бесконечной структуры до списка существенных порядков объекта. Последние характеризуют степень зависимости на бесконечности между отдельными выходами и всеми остальными и могут быть вычислены по формуле:

пгв =ХПг -Х Пг г=1 г=1

выходы не развязываемы с помощью регулярных обратных связей, но развязываемы статическим прекомпенсатором с передаточной матрицей

Здесь п - порядок бесконечного нуля системы s¡ в форме Смита-Макмиллана передаточной матрицы объекта. Первая сумма в (6) определяется для системы £0(С,А,Б) в целом, а вторая - для ЦС;,А,Б), где С / - матрица С без /-й строки. Указанные здесь существенные порядки определяют минимальную бесконечную структуру, которая может быть получена у развязанной системы.

Для динамической нерегулярной обратной связи в установлено лишь условие развязки, сводящееся к тому, что избыточность размерности вектора управления (т-р) должна быть больше или равна дефициту столбцового ранга в бесконечности матрицы интерактора W0(s), а последняя должна иметь полный строчный ранг. Указанный интерактор передаточной матрицы объекта W0(s) -это матрица, обратная к эрмитовой форме W0(s). Попутно заметим, что /-й существенный порядок объекта может быть определен через интерактор его передаточной матрицы и равен полиномиальной степени его -го столбца.

Общих решений для синтеза алгоритмов управления в классе САУ с ИРВУ даже для линейных объектов, которые обеспечивают автономизацию

их выходов, до сих пор не получено. Использование управлений избыточной размерности при решении задач построчной развязки (автономизации выходов) объекта является фактически необходи-

мым условием в тех случаях, когда управляемый объект не удовлетворяет условиям разрешимости этой задачи в классе бикаузальных прекомпенсато-ров и соответствующих им обратных связей.

СПИСОК ЛИТЕРАТУРЫ

1. Уонэм М. Линейные многомерные системы управления. - М.: Наука, 1980. - 375 с.

2. Rosenbrock H.H. State-space and multivariable theory. - London: Nelson, 1970. - 257 p.

3. Мееров М. В. Исследование и оптимизация многосвязных систем управления. - М.: Наука, 1986. - 233 с.

4. Малышенко А.М. Системы автоматического управления с избыточной размерностью вектора управления. - Томск: Изд-во Томского политехн. ун-та, 2005. - 302 с.

5. Commault C., Lafay J.F., Malabre M. Structure of linear systems. Geometric and transfer matrix approaches // Cybernetika. - 1991.

V. 27. - № 3. - P. 170-185.

6. Descusse J., Lafay J.F., Malabre M. Solution of Morgan’s problem // IEEE Trans. Automat. Control. - 1988. - V. aC-33. -P. 732-739.

7. Morse A.S. Structural invariants of linear multivariable systems // SIAM J. Control. - 1973. - № 11. - P. 446-465.

8. Aling H., Schumacher J.M. A nine fold canonical decomposition for linear systems // Int. J. Control. - 1984. - V. 39. - P 779-805.

9. Hautus M.L.J., Heymann H. Linear feedback. An algebraic approach // SIAM J. Control. - 1978. - № 16. - P. 83-105.

10. Descusse J., Dion J.M. On the structure at infinity of linear square decouplable systems // IEEE Trans. Automat. Control. - 1982. -V. AC-27. - P. 971-974.

11. Falb PL., Wolovich W. Decoupling in the design and synthesis of multi-variable systems // IEEE Trans. Automat. Control. - 1967. -V. AC-12. - P 651-669.

12. Dion J.M., Commault C. The minimal delay decoupling problem: feed-back implementation with stability // SIAM J. Control. -1988. - № 26. - P. 66-88.

УДК 681.511.4

АДАПТИВНЫЕ ПСЕВДОЛИНЕЙНЫЕ КОРРЕКТОРЫ ДИНАМИЧЕСКИХ ХАРАКТЕРИСТИК СИСТЕМ АВТОМАТИЧЕСКОГО РЕГУЛИРОВАНИЯ

М.В. Скороспешкин

Томский политехнический университет E-mail: [email protected]

Предложены адаптивные псевдолинейные амплитудный и фазовый корректоры динамических свойств систем автоматического регулирования. Проведено исследование свойств систем автоматического регулирования с адаптивными корректорами. Показана эффективность применения псевдолинейных адаптивных корректоров в системах автоматического регулирования с нестационарными параметрами.

В системах автоматического регулирования объектами, свойства которых изменяются с течением времени, необходимо обеспечить целенаправленное изменение динамических характеристик регулирующего устройства. В большинстве случаев это осуществляется изменением параметров пропорционально-интегрально-дифференциальных регуляторов (ПИД-регуляторов). Такие подходы описаны, например, в , однако реализация этих подходов связана либо с идентификацией, либо с использованием специальных методов, основанных на вычислениях по кривой переходного процесса. Оба эти подхода требуют значительного времени на подстройку.

В настоящей работе приводятся результаты исследования свойств систем автоматического регулирования с ПИД-регулятором и последовательными адаптивными амплитудным и фазовым псев-долинейными корректорами динамических характеристик. Такой способ адаптации характеризуется

тем, что в процессе работы системы регулирования параметры регулятора не меняются и соответствуют настройке, предшествующей запуску системы в работу. В процессе работы системы регулирования, в зависимости от типа используемого корректора, меняется коэффициент передачи корректора или создаваемый им фазовый сдвиг. Эти изменения происходят только в тех случаях, когда возникают колебания регулируемой величины, связанные с изменением свойств объекта управления или из-за воздействия на объект управления возмущений. А это позволяет обеспечить устойчивость системы и повысить качество переходных процессов.

Выбор псевдолинейных корректоров для реализации адаптивной системы объясняется следующим. Корректоры, используемые для изменения динамических свойств систем автоматического регулирования, можно разбить на три группы: линейные, нелинейные и псевдолинейные . Основной недостаток линейных корректоров связан с

В рассмотренных примерах (задача о загрузке рюкзака и задача о надежности) для описания состояний системы использовалась только одна переменная, одной переменной задавалось и управление. В общем случае в моделях динамического программирования состояния и управления могут быть описаны с помощью нескольких переменных, образующих вектора состояния и управления.

Увеличение количества переменных состояния вызывает рост числа возможных вариантов решения, ассоциированных с каждым из этапов. Это может привести к так называемой проблеме «проклятие размерности», которая является серьезным препятствием при решении задач динамического программирования средней и большой размерности.

В качестве примера рассмотрим задачу о загрузке рюкзака, но уже при двух ограничениях (например, ограничение по весу и по объему):

где , . Поскольку в задаче имеется два вида ресурсов , то необходимо ввести два параметра состояния и . Обозначим , , . Тогда ограничения (1) можно привести к виду:

где . В рекуррентных уравнениях метода динамического программирования для задачи о «ранце» с двумя ограничениями (1):

каждая из функций , является функцией двух переменных. Если каждая из переменных , может принимать 10 2 значений, то функцию приходится табулировать в 10 4 точках. В случае трех параметров при тех же предположениях требуется вычислять 10 8 степени значений функций .

Итак, наиболее серьезным препятствием практического применения динамического программирования оказывается число параметров задачи.

Задача управления запасами.

Задача управления запасами возникает, когда необходимо создать запас материальных ресурсов или предметов потребления с целью удовлетворения спроса на заданном интервале времени (конечном или бесконечном). В любой задаче управления запасами требуется определять количество заказываемой продукции и сроки размещения заказов. Спрос можно удовлетворить путём однократного создания запаса на весь рассматриваемый период времени или посредством создания запаса для каждой единицы времени этого периода. Первый случай соответствует избыточному запасу по отношению к единице времени, второй – недостаточному запасу по отношению к полному периоду времени.

При избыточном запасе требуется более высокие удельные (отнесённые к единице времени) капиталовложения, но дефицит возникает реже и частота размещения заказов меньше. С другой стороны, при недостаточном запасе удельные капитальные вложения снижаются, но частота заказов и риск дефицита возрастают. Для любого из указанных крайних случаев характерны значительные экономические потери. Таким образом, решения относительно размера заказа и момента его размещения могут основываться на минимизации соответствующей функции общих затрат, включающих затраты, обусловленные потерями от избыточного запаса и дефицита.



Эти затраты включают в себя:

1. Затраты на приобретение, которые становятся особо важным фактором, когда цена единицы выражается в виде оптовых скидок в тех случаях, когда цена единицы продукции убывает с возрастанием размера заказа.

2. Затраты на оформление заказа представляют собой постоянные расходы, связанные с его размещением. При удовлетворении спроса в течении заданного периода времени путём размещения более мелких заказов (более часто) затраты возрастают по сравнению со случаем, когда спрос удовлетворяется посредством размещения более крупных заказов (и следовательно, реже).

3. Затраты на хранение запаса, которые представляют собой расходы на содержание запаса на складе (процент на инвестированный капитал, амортизационные расходы и эксплуатационные расходы), обычно возрастают с увеличением уровня запасов.

4. Потери от дефицита, обусловленные отсутствием запаса необходимой продукции. Обычно они связаны с экономическими санкциями со стороны потребителей, потенциальными потерями прибыли. На рис.1 иллюстрируется зависимость рассмотренных видов затрат от уровня запаса продукции. На практике какую-либо компоненту затрат можно не учитывать, если она не составляет существенную часть общих затрат. Это приводит к упрощению моделей управления запасами.


Типы моделей управления запасами.

Большое разнообразие моделей управления запасами определяется характером спроса на продукцию, который может быть детерминированным или вероятностным. На рис.2 приведена схема классификации спроса, принимаемая в моделях управления запасами.

Детерминированный статический спрос предполагает, что интенсивность потребления остаётся неизменной во времени. Динамический спрос - спрос известен, но изменяется в зависимости от времени.

Наиболее точно характер спроса может быть описан посредством вероятностных нестационарных распределений. Однако с математической точки зрения модель значительно усложняется, особенно при увеличении рассматриваемого периода времени.

По существу классификацию на рис.2 можно считать представлением различных уровней абстракции описания спроса.

На первом уровне предполагается, что распределение вероятностей спроса стационарно во времени, т.е. в течение всех исследуемых периодов времени используется одна и та же функция распределения вероятностей. При таком предположении влияние сезонных колебаний спроса в модели не учитывается.

На втором уровне абстракции учитываются изменения спроса от одного периода к другому. Однако при этом функции распределения не применяются, а потребности в каждом периоде описываются средней величиной спроса. Это упрощение означает, что элемент риска в управлении запасами не учитывается. Но оно позволяет исследовать сезонные колебания спроса, которые вследствие аналитических и вычислительных трудностей нельзя учесть в вероятностной модели.

На третьем уровне упрощения предполагается, что спрос в течении любого периода равняется среднему значению известного спроса по всем рассматриваемым периодам, т.е. оценить его постоянной интенсивностью.

Характер спроса является одним из основных факторов при построении модели управления запасами, но имеются и другие факторы, влияющие на выбор типа модели.

1. Запаздывание поставок. После размещения заказа он может быть поставлен немедленно или потребуется некоторое время на его выполнение. Интервал времени между моментом размещения заказа и его поставкой называется запаздыванием поставки. Эта величина может быть детерминированной или случайной.

2. Пополнение запаса. Процесс пополнения запасов может осуществляться мгновенно или равномерно во времени.

3. Период времени определяет интервал, в течение которого осуществляется регулирование уровня запаса. В зависимости от отрезка времени, на котором можно надёжно прогнозировать запас, рассматриваемый период принимается конечным или бесконечным.

4. Число пунктов накопления запасов. В систему управления запасами может входить несколько пунктов хранения запаса. В некоторых случаях эти пункты организованы таким образом, что один выступает в качестве поставщика для другого. Эта схема иногда реализуется на различных уровнях так, что пункт – потребитель одного уровня может стать пунктом – поставщиком на другом. В этом случае имеется система управления с разветвлённой структурой.

5. Число видов продукции. В системе управления запасами может фигурировать более одного вида продукции. Этот фактор учитывается при условии наличия некоторой зависимости между видами продукции. Так, для различных изделий может использоваться одно и тоже складское помещение или же их производство может осуществляться при ограничениях на общие производственные фонды.

Детерминированные модели управления запасами.

1.Детерминированная обобщённая модель определения оптимального размера партии продукции при допущении дефицита.

Рассматривается система управления запасами, когда продукция поступает на склад непосредственно с производственной линии с постоянной интенсивностью единиц продукции в единицу времени. При достижении некоторого уровня объёма запаса Q производство продукции прекращается. Возобновление производства и поставки продукции на склад осуществляется в момент, когда неудовлетворённый спрос достигнет некоторого значения G. Расходование запаса осуществляется с интенсивностью . Известны значения следующих параметров: - стоимость хранения единицы товара на складе в единицу времени; -стоимость организации заказа (одной партии продукции); - убытки от неудовлетворенного спроса (штраф). Требуется найти оптимальный объём партии продукции и интервал времени между точками возобновления поставки по критерию минимума общих затрат от функционирования системы управления запасами.

Графически условия задачи показаны на рис.3.

Из рисунка видно, что пополнение и расходование запаса осуществляются одновременно в течение интервала каждого цикла. Накопленный запас Q полностью расходуется в течение интервала . В течение интервала спрос не удовлетворяется, а накапливается. Неудовлетворённый спрос G покрывается в интервале .

Величина называется полным циклом управления запасом. - предельный запас продукции, G – предельный дефицит продукции.

Очевидно текущий уровень запаса продукции определяется по формуле:

Из треугольника OAB следует:

Аналогично можно определить , и (2)

Из подобия треугольников OAC и CEF можно записать Из равенства следует, что (3)

Выражение (3) с учётом (1) перепишется:

Тогда общая сумма затрат на пополнение, хранение запаса продукции и возможный штраф за неудовлетворительный спрос будет определяться выражением:

Если привести затраты в единицу времени, то выражение для удельных затрат будет иметь вид:

Таким образом, есть функция двух аргументов Q и T, оптимальные значения которых определяются как решение задачи:

Для того, чтобы найти минимум функции двух аргументов, необходимо и достаточно решить систему уравнений:

Это следует из факта, что функция является вогнутой функцией относительно своих аргументов. Решение системы уравнений (5) даёт следующие неотрицательные корни:

Минимум общих затрат в единицу времени составит:

Можно рассмотреть частные случаи.

1. Дефицит продукции не допускается. Решение задачи в этом случае получается из формулы (6)-(8), если положить штраф Тогда С 1 /С 3 =0 и оптимальные значения искомых величин будут:

Этому случаю соответствует график изменения уровня запаса во времени:

2. Пополнение запаса осуществляется мгновенно. В этом случае полагается и соответственно

График изменения уровня запаса имеет вид:

3. Дефицит не допускается, запасы пополняются мгновенно, т.е. . Тогда следует:

Эти формулы называются формулами Уилсона, а величина - экономическим размером партии.

График изменение уровня запаса имеет вид:


Динамические модели управления запасами.

В предыдущих лекциях были рассмотрены статические задачи управления запасами за один период. В ряде таких задач были получены аналитические выражения для оптимального уровня запаса.

В случае, если рассматривается функционирование системы за n периодов, причем спрос непостоянен, приходят к динамическим моделям управления запасами. Эти задачи, как правило, не поддаются аналитическому решению, однако оптимальные уровни запасов на каждый период можно вычислить, применив метод динамического программирования.

Рассматривается задача управления запасами, когда спрос за j-ый период (j=1,n) определяется величиной . Пусть – уровень запаса в начале j-го периода, а - объем пополнения запаса в этом периоде. Пополнение запасов осуществляется мгновенно в начале периода, дефицит продукции не разрешается. Графически условия задачи показаны на рис.1.

Пусть - общие затраты на хранение и пополнение на j-том периоде. Значение задано, а , т.к. в конце функционирования систем запас не нужен.

Требуется определить оптимальные объемы заказов в каждом периоде по критерию минимума суммарных затрат.

Математическая модель задачи будет иметь вид

здесь необходимо определить , которые удовлетворяли бы ограничениям (2)-(6) и минимизировали целевую функцию (1).

В этой модели целевая функция сепарабельная, ограничения (2) имеют рекуррентный вид. И эта особенность модели наталкивает на мысль о возможности применения для ее решения метода динамического программирования. Модель (1)-(6) отличается от стандартной модели динамического программирования наличием условия это условие можно преобразовать следующим образом. Из (2) и (3) следует, что , или можно записать

Тогда из (7) с учетом (4) определяется область возможных значений : или окончательно:

Таким образом, условие (3)-(4) заменяется условием (8), и модель (1),(2),(5)-(6),(8) имеет стандартный вид для метода динамического программирования.

В соответствии с методом динамического программирования решение этой задачи состоит из следующих этапов:

Иследует из ограничения (12)-(14).(j=2,n).

Проводится обратное движение алгоритма, в результате находятся оптимальные значения искомых переменных и . Минимальное значение целевой функции (1) определяется величиной

Задача динамического наблюдения , которая сначала называлась задачей асимптотического наблюдения , в существующем виде сформулирована американским ученым Д. Люенбергером в 1971 году. Термины «динамическое наблюдение» или «асимптотическое наблюдение» не полностью отражают существо проблемы, которая состоит в решении задачи восстановления вектора состояния динамического объекта (процесса) в специально создаваемой динамической среде на основе доступной информации . Следует заметить, что доступная информация может быть представлена в двух формах: в форме результатов непосредственных измерений и модельной форме динамической среды , генерирующей экзогенное воздействие.

Не всегда удается обеспечить и асимптотический характер процесса наблюдения в силу неполной измеримости переменных и воздействий, наличия неконтролируемых помех, неучтенные факторы модельного и сигнального характера и т.д. В этой связи представляется наиболее корректным использовать понятие «динамическое наблюдающее устройство » (ДНУ), возможно также появление терминологического вульгаризма «наблюдатель ».

Первоначально основной сферой использования ДНУ были динамические системы , в состав которых входят формирователи сигналов управления, использующих информацию в виде прямых и обратных связей по состоянию объекта или источника конечномерного экзогенного воздействия. В настоящее время сфера использования ДНУ заметно расширилась за счет нового поколения измерительных комплексов , которые решают задачу формирования результата измерения в алгоритмической среде ДНУ. Ниже рассматриваются вопросы, связанные с использованием ДНУ в составе формирователей сигналов управления.

В предыдущих разделах рассмотрены алгоритмы формирования сигналов управления, опирающиеся на единую системную концепцию подобия , которая реализовалась в одном случае в методе модального управления динамическим объектом, в другом – методе обобщенного изодромного управления. Прежде, чем решать задачи динамического наблюдения в рамках каждого из этих методов управления дадим общесистемное определение динамическому наблюдающему устройству.

В общесистемной постановке наибольшее количество информации о ходе управляемых процессов (динамических объектов) содержится в векторе состояния, который характеризуется наибольшей по сравнению с другими переменными процесса размерностью. Но состояние есть скрытая (внутренняя) переменная, несущая полную информацию о системном «секрете» процесса, она не должна быть доступна непосредственному измерению в полном объеме. Внешними переменными являются вектор выхода , вектор сигнала управления , вектор ошибки воспроизведения задающего экзогенного воздействия , иногда само воздействие . Информационная среда может быть дополнена моделью источника экзогенного воздействия (МИЭВ).

Теперь можно дать определение динамического наблюдающего устройства (ДНУ).

Определение 16.1 (О16.1). Динамическое наблюдающее устройство представляет собой техническую или алгоритмическую среду , которая реализует функциональное отображение всех доступных непосредственному измерению: компонентов
задающего воздействия
, компонентов
вектора ошибки
, сигнала управления
, компонентов
вектора выхода
, а возможно и компонентов
вектора состояния
в вектор
оценки вектора состояния, обладающий асимптотическим свойством, что представляется записью

где
– матрица в общем случае особого (необратимого) преобразования.

В большинстве практических случаев задача динамического наблюдения решается на парах , а в случаях, когда задача сводится к автономной версии динамической системы – то на векторах выхода
или ошибки
.

Примечание 16.1 (ПР.16.1). Ниже рассматриваются проблемы синтеза динамического модального и динамического обобщенного изодромного управлений , которые решаются на основе агрегирования динамических наблюдающих устройств и устройств формирования сигналов управления, полученных на основе гипотезы о полной измеримости вектора состояния объекта. В этой связи модальное управление и обобщенное изодромное управление, сформированные таким образом (т.е. методами, описанными в разделе 15) в отличие от динамических будем именовать алгебраическим модальным и алгебраическим обобщенным изодромным управлениями.

Рассмотрим случай модального управления. Поставим задачу формирования наблюдающего устройства, позволяющего восстановить вектор
состояния непрерывного динамического объекта, имеющего векторно-матричное описание

Прежде, чем приступить к решению задачи формирования динамического наблюдающего устройства, рассмотрим одну «гипотетическую» ситуацию. Для этого предположим, что , тогда приполной измеримости вектора
вектор
состояния объекта (16.2)при полной его неизмеримости может быть восстановлен в силу соотношения

(16.3)

Нетрудно видеть, что такое наблюдающее устройство следует назвать «статическим», так как оно обладает нулевой динамикой.

На основе рассмотренной «гипотетической» ситуации можно сформулировать следующее утверждение без доказательства.

Утверждение 16.1 (У16.1). Для корректного функционирования динамического наблюдающего устройства, при котором могут быть восстановлены все компонентов вектора
состояния объекта, у которого
, необходимо выполнение условия

где
вектор состояния динамического наблюдающего устройства.

Примечание 16.2 (ПР.16.2). Ситуация, когда имеет место выполнение неравенства , используется в случае, когда процесс измерения вектора
динамического объекта сопровождается заметными помехами так, что на ДНУ возлагаются задачавосстановления вектора состояния объекта с одновременной фильтрацией измерений.

Вернемся к соотношению (16.1) для анализа системной нагрузки, возлагаемой на матрицу подобия
размерности
. Размерность и вид этой матрицы полностью отражает все многообразие вариантов построения динамических наблюдающих устройств, так:

– если
при
и при этом
полной размерности и в базисе наблюдаемого динамического объекта ;

– если
при
и при этом
, то динамическое наблюдающее устройство строитсяполной размерности в базисе, не совпадающем с базисом наблюдаемого динамического объекта , чаще всего это какой-либо канонический базис ;

– если
при
, то динамическое наблюдающее устройство строитсянеполной размерности в произвольном базисе, чаще всего это какой-либо канонический базис ; в этом случае для восстановления всех компонентов вектора состояния объекта используется композиция из измерения вектора выхода и вектора состояния ДНУ, а также матрица, составленная из матриц
.

Динамические наблюдающие устройства полной размерности в базисе исходного объекта строятся на основе следующих системных соображений , содержащихся в следующем утверждении.

Утверждение 16.2 (У16.2). Динамическое наблюдающее устройство вектора
состояния непрерывного объекта управления (16.2), реализующееалгоритм наблюдения , записываемый в векторно-матричной форме

где
вектор состояния ДНУ,
, характеризуется процессом сходимости оценки
к оцениваемому вектору
состояния объекта (16.2), определяемым алгебраическим спектром собственных значений матрицы

. □(16.6)

Доказательство. Для доказательства справедливости сформулированного утверждения введем в рассмотрение вектор
невязки наблюдения , который для общего случая задачи наблюдения имеет представление

, (16.7)

а для рассматриваемого случая в силу равенства
принимает вид

. (16.8)

Нетрудно видеть, что процесс сходимости
к оцениваемому вектору
в форме (16.1) с использованием вектора
невязки наблюдения принимает вид

. (16.9)

Построим модель динамики сходимости процесса наблюдения, используя вектор невязки наблюдения (16.8).Дифференцирование по времени (16.8) с последующей подстановкой в результат дифференцирования соотношений (16.2) и (16.5) дает

что записывается в форме

откуда для вектора
невязки наблюдения можно записать

Примечание 16.3 (ПР.16.3). Если начальные состояния объекта управления (16.2) и ДНУ (16.5), то в силу (16.11) невязка наблюдения
и наблюдаемый вектор
и его оценка
тождественно совпадают, то есть выполняется соотношение

Введем определение динамического модального управления .

Определение 16.2 (О16.2). Динамическим модальным управлением будем называть управление вида (15.48), в котором отрицательная обратная связь по вектору
состояния объекта управления заменена на обратную связь по вектору
оценки вектора
, формируемому в зависимости отреализации матрицы
в силу соотношений:

1. при


(16.12)

2. при (16.13)

3. при (16.14)

Построим теперь алгоритм синтеза динамического модального управления для случая формирования оценки
вектора
состояния объекта вида (16.12), формируемой в среде ДНУ (16.5).

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФИЗИЧЕСКИЙ ФАКУЛЬТЕТ

Кафедра Физико-Математических Методов Управления

ЗАДАНИЯ

на курсовую работу

«Оптимальное управление линейными динамическими системами»

по курсу «Оптимальное управление»

Составитель: проф., д. т. н. Афанасьев В.Н.

Москва 2014

  1. ЦЕЛЬ РАБОТЫ

Математическое конструирование оптимальных линейных систем управления.

  1. СОДЕРЖАНИЕ РАБОТЫ
    1. Изучение необходимого теоретического материала по источникам ;
    2. Получение аналитического решения задачи;
    3. Составление структурной схемы системы управления.
    4. Приобретение навыков математического моделирования системы управления с использованием пакета MatLab .
  1. ВРЕМЯ ПРОВЕДЕНИЯ РАБОТЫ

VIII семестр, 4 курс.

Задания выдаются на 5 учебной неделе.

Прием выполненных работ осуществляется на 10 и 11 неделях.

ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ.

ФОРМУЛИРОВКА ЗАДАЧИ

Многие объекты управления могут достаточно точно описываться линейными динамическими моделями. Путем разумного выбора квадратичных критериев качества и квадратичных ограничений в этом случае удается синтезировать весьма удачные управляющие устройства с линейной обратной связью.

Пусть управляемые динамические системы, описываемые линейными дифференциальными уравнениями

(1)

здесь: - состояние системы; - управляющий вход системы; - выход системы. Таким образом, матрицы A (t ), B (t ), C (t ) имеют соответствующие размерности: n x n , n x r , m x n . Предположим, что и на управление не наложено каких-либо ограничений.

Определим назначение системы с физической точки зрения. Пусть - «желаемый» выход системы. Требуется отыскать такое управление u (t ) , при котором ошибка системы

(2)

была бы «малой».

Так как управление u (t ) в рассматриваемой задаче не ограничено, то для того чтобы избежать больших усилий в контуре управления и большого расхода энергии, можно ввести в критерий качества соответствующее требование, учитывающее эти факты.

Часто бывает важно сделать «малой» ошибку в конечный момент переходного процесса.

Перевод этих физических требований в форму того или иного математического функционала зависит от многих причин. В данной главе будет рассматриваться частный класс критериев качества, имеющих следующий вид:

(3)

где F , Q (t ) – положительно полуопределенные матрицы размерностью m x m ; R (t ) – положительно определенная матрица размерностью r x r .

Рассмотрим каждый член функционала (3). Начнем с. Очевидно, так как матрица Q (t ) положительно полуопределенная, то этот член неотрицателен при любом e (t ) и равен нулю при e (t )=0 . Так как, где q ij (t ) – элемент матрицы Q (t ), а e i (t ) и e j (t ) – компоненты вектора e (t ), то большие ошибки оцениваются «дороже», чем малые.

Рассмотрим член. Так как R (t ) - положительно определенная матрица, то этот член положителен при любых и «наказывает» систему за большие управляющие воздействия сильнее, чем за малые.

Наконец, . Этот член часто называют стоимостью конечного состояния. Его цель – гарантировать «малость» ошибки в конечный момент времени переходного процесса.

Критерий качества (3) удобен математически, и его минимизация приводит к тому, что оптимальные системы оказываются линейными.

Задача оптимального управления формулируется следующим образом: дана линейная динамическая управляемая система (1) и функционал (3). Требуется найти оптимальное управление, т.е. управление, под воздействием которого система (1) двигается таким образом, чтобы минимизировать функционал (3). Поиск решений будет производиться для задач с открытой областью изменений управляющих воздействий и задач, управляющие воздействия в которых принадлежат заданному множеству.

  1. ЗАДАНИЕ
    1. Изучить метод построения оптимального управления линейными динамическими системами
    2. В соответствии с номером варианта взять условие задачи из приложения
    3. Проверить свойства управляемости и наблюдаемости
    4. Построить наблюдатель Луенбергера
    5. Получить аналитическое решение задачи
    6. Нарисовать структурную схему системы оптимального управления
    7. Изучить влияние весовых коэффициентов на качество переходных процессов и на значение функционала качества
    8. Математическое моделирование системы управления с использованием пакета MatLab

ПРИЛОЖЕНИЕ

Объект управления:

Функционал: .

Вариант № 1

Рассмотреть при:

  1. ;

Вариант № 2

Рассмотреть при:

  1. ;

Вариант № 3

Рассмотреть при:

  1. ;

Вариант № 4

Рассмотреть при:

  1. ;

Вариант № 5

Рассмотреть при:

  1. ;

Вариант № 6

Рассмотреть при:

  1. ;

Вариант № 7

Рассмотреть при:

  1. ;

Вариант № 8

Рассмотреть при:

  1. ;

Вариант № 9

Рассмотреть при:

  1. ;

Вариант № 10

Рассмотреть при:

  1. ;

Вариант № 11

Рассмотреть при:

  1. ;

Вариант № 12

Рассмотреть при:

  1. ;

Вариант № 13

Рассмотреть при:

  1. ;

Вариант № 14

Рассмотреть при:

14.1. ;

14.2. .

Вариант № 15

Рассмотреть при

15.1. ;

15.2. .

ЛИТЕРАТУРА

  1. Афанасьев В.Н., Колмановский В.Б., Носов В.Р. Математическая теория конструирования систем управления – Высшая школа. М., 2003, – 616 с.
  2. Афанасьев В.Н. Теория оптимального управления непрерывными динамическими системами. Аналитическое конструирование. – М. Физический факультет МГУ 2011, – 170 с.
  3. Афанасьев В.Н. Оптимальные системы управления. РУДН. 2007. − 260 с.

Выходные данные сборника:

УПРАВЛЕНИЕ С ПЕРЕМЕННОЙ СТРУКТУРОЙ СЛОЖНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

Маркин Василий Евгеньевич

канд. техн. наук, доцент МГУ им. адм. Г.И. Невельского, г. Владивосток

Воробьев Алексей Юрьевич

канд. техн. наук, доцент ДВФУ, г. Владивосток

Актуальной задачей современной теории управления является создание высокоэффективных алгоритмов и систем управления для управления сложными динамическими объектами. К классу сложных динамических объектов можно отнести такие объекты, как манипуляционные роботы, подводные аппараты, станки для сложной обработки т. д. Характерными особенностями подобных объектов являются большая размерность математической модели, нелинейности различного вида в математической модели, многосвязность, а также значительная структурная и параметрическая неопределенность, проявляющаяся в процессе функционирования.

Причинами параметрической неопределенности могут быть как динамические свойства самого объекта (например, изменение конфигурации манипулятора приводит к многократному изменению приведенного момента инерции), так и действие среды. Математически такой вид неопределенности можно оценить следующим образом:

где P i - некоторый параметр. В процессе функционирования параметры объекта могут принимать значение из диапазона между минимальным и максимальным значением.

Для синтеза алгоритмов и систем управления сложными динамическими объектами в условиях неопределенности используются различные подходы: адаптивный, робастный, нейросетевой и т. д. В работе в качестве базового используется алгоритм управления с переменной структурой. Работающие с использованием данного алгоритма системы с переменной структурой (СПС) известны достаточно давно как релейные системы с разрывным управлением . Управление с переменной структурой обычно строится в следующем виде:

(2)

где - уравнение поверхности переключения (скольжения) в пространстве состояния R n , содержащем фазовые координаты объекта x 1 ,…x n . Традиционно рассматриваются системы второго порядка, в этом случае пространство состояний вырождается в фазовую плоскость, а поверхность переключения - в линию переключения . Уравнение поверхности (линии) переключения может быть как линейным, так и нелинейным. В простейшем случае линия переключения представляет собой прямую. В этом случае поверхность переключения задается некоторым вектором параметров C размерности (n x 1), где n - порядок системы. Характерная особенность систем с переменной структурой (СПС) - наличие так называемого скользящего режима . Скользящий режим - особый динамический режим системы, движение в котором происходит по поверхности переключения s= 0, построенной в фазовом пространстве R n (рис. 1).

Рисунок1. Скользящий режим в СПС

Основное условие существования скользящего режима определяется следующим образом :

В скользящем режиме система работает в режиме переключений, происходящих теоретически с бесконечно большой частотой. Траектория движения системы теоретически определяется лишь уравнением линии переключения, не зависящим от параметров системы (например, от варьируемой нагрузки). Переходные процессы в скользящем режиме устойчивы и монотонны. Для обеспечения приемлемых динамических свойств системы необходима начальная настройка параметров, для которой традиционно применяется минимаксный метод: вектор параметров c выбирается таким, чтобы при любом наборе начальных условий выполнялось условие существования скользящего режима (3). Иначе говоря, значения коэффициентов линии переключения выбираются с учетом максимального значения изменяющегося параметра p i max (1). Это позволяет обеспечить возникновение скользящего режима при любых начальных условиях. Вместе с тем быстродействие системы (которое также определяется значениями элементов вектора c ) становится невысоким. Это является одним из основных недостатков традиционных СПС. Для увеличения быстродействия применяется адаптация по параметру скользящего режима . Адаптивный алгоритм настройки коэффициента линии переключения c имеет следующий вид:

(4)

где k c - коэффициент пропорциональности, m, m d - соответственно текущее и эталонное значения параметра скольжения .

В работе исследуется адаптивное управление приводом манипуляционного робота. Структурная схема системы автоматического управления приведена на рис. 2.

Рисунок 2 . Структурная схема системы управления приводом степени подвижности

Для реализации принципа переменности структуры в работе применяется релейное управление:

В свою очередь,

, (6)

где c - коэффициент плоскости скольжения (переключения).

Для имитационного моделирования использовался пакет Simulink, входящий в Matlab. Результаты моделирования в виде трехмерной фазовой траектории системы представлены на рис. 3.

Рисунок 3. Фазовые траектории и временные процессы системы третьего порядка: 1 - без адаптации, 2- с адаптацией.

Моделирование показывает существенное улучшение быстродействия при использовании адаптивного управления. Кроме того, имеет место существенное улучшение динамических показателей качества по сравнению с традиционными алгоритмами управления.

Дальнейшее направление исследований - обеспечение большей робастности алгоритмов управления по отношению к параметрам объекта и регулятора. Таким образом, разработаны алгоритмы управления сложным динамическим объектом высокого порядка в условиях существенной параметрической неопределенности. На основе предложенных алгоритмов синтезированы адаптивные системы управления. Проведены численные эксперименты, продемонстрировавшие высокую эффективность предложенных решений.

Список литературы:

1.Дыда А.А., Маркин В.Е. Системы управления с переменной структурой с парными и нелинейно деформируемыми поверхностями переключения. // Проблемы управления. - 2005, № 1. С. 22-25.

2.Маркин В.Е. Субоптимальное по быстродействию управление сложными динамическими объектами в условиях неопределенности. / Труды XIII Байкальской Международной школы-семинара по методам оптимизации. Т. 2 - Иркутск, 2005. С. 177-181.

3.Теория систем с переменной структурой. / Под ред. С.В. Емельянова - М.: Наука, Главная редакция физико-математической литературы, 1970 - 592 с.

4.Уткин В.И. Скользящие режимы в задачах оптимизации и управления. - М: Наука, Главная редакция физико-математической литературы, 1981 - 368 с.

5.Dyda A.A. Design of Adaptive VSS algorithms for Robot Manipulator Controls. Proc. Of First Asia Control Conference. Tokyo, July 27-30, 1994. Pp 1077-1080.