Многопараметрическая идентификация конструктивных параметров методом объединенного принципа максимума
Аннотация
Значительное число методов динамической идентификации построено на основе метода инвариантного погружения и градиентных методов [1], которые требуют для реализации больших вычислительных затрат и обладают не достаточно высокой степенью устойчивости.
Перспективным направлением эффективного решения задач идентификации конструктивных параметров динамических систем является применение метода объединенного принципа максимума [2]. Он разработан для задач синтеза оптимального управления динамическими системами [3] и выражается в достижении функцией обобщенной мощности максимального значения на оптимальных управлениях.
Показано, что его применение обеспечивает высокую точность расчетов при меньших вычислительных затратах в сравнении с известными методами, а сама задача разрешима и для случая нелинейности входящих в уравнение движения и функционал параметров.
Ключевые слова: идентификация, конструктивные параметры, целевой функционал, обобщенная мощность, синтезирующая функция.05.13.18 - Математическое моделирование, численные методы и комплексы программ
Введение. Синтез оптимального управления механическими системами в настоящее время базируется на методах классического вариационного исчисления, динамического программирования Р. Беллмана и принципа максимума Л.С. Понтрягина [4,5]. Однако эти методы дают условия оптимальности для рассматриваемого данного момента времени, а проблема синтеза решалась в ряде работ с использованием гипотез об управлениях, линиях переключения, функциях Беллмана и др. [4,6]. Для решения проблемы синтеза управления применялись также подходы, основанные на методах декомпозиции и использовании заданной программной траектории [7], на использовании управлений по обратной связи [8] и введении функции А.М. Ляпунова.
Если принцип максимума применить к признаку истинного движения Гамильтона-Остроградского [3], то условия оптимальности получаются для конечного промежутка времени, то есть рассматривается задача синтеза оптимального управления. Решение такой экстремальной задачи получается в форме объединенного принципа максимума из условия максимума функции обобщенной мощности [9,10]. Здесь синтез оптимального управления строится на основе анализа структуры фазового пространства. При этом устанавливается аналитическая зависимость управлений от фазовых координат и связь с целевым функционалом.
- Теорема объединенного принципа максимума [9,10].
Пусть задан целевой функционал
. (1)
Строится расширенный функционал [2,9,10]
, (2)
где - неопределенный множитель Лагранжа, - кинетическая энергия, - коэффициент инерции, , - вектора обобщенных координат и скоростей, - работа обобщенных сил, - вектор обобщенных сил, зависящий от вектора идентифицируемых параметров .
Теорема. Для того чтобы обобщенная сила и соответствующая ей траектория доставляли минимум расширенному функционалу (2), необходимо выполнить условия максимума для обобщенной мощности
, (3)
где , а на концах траектории , выполняются условия трансверсальности
, (4)
здесь – фиктивная сила, зависящая от формы целевого функционала.
Доказательство. Пусть к расширенному функционалу (2) последовательно применено асинхронное и игольчатое варьирование [3,4]. Для произвольной обобщенной силы асинхронная вариация функционала будет иметь выражение
, (5)
где - синхронные вариации обобщенных координат и скоростей; - асинхронная вариация функционала.
Интегрирование по частям первого слагаемого под знаком интеграла и замена в граничных условиях синхронной вариации так, чтобы асинхронная вариация равнялась нулю , откуда , преобразует выражение (5) к виду
(6)
Из выражений (5) и (6) следует [2], а при преобразовании краевых условий применена теорема Эйлера об однородных функциях [3]. С учетом преобразований первая асинхронная вариация (5) приводит к условиям трансверсальности (4) и выражению
. (7)
Пусть из допустимой области выбрана другая обобщенная сила, но полученная из первой игольчатым варьированием , при [4]. Асинхронная вариация функционала для этой обобщенной силы запишется аналогично (7)
. (8)
В силу произвольности синхронные вариации можно получить одинаковыми при .
Из сравнения (7) и (8) получается вторая асинхронно-игольчатая вариация функционала
(9)
Отрезок можно разделить на три части. На полуоткрытом интервале I произвольная и варьированная обобщенные силы совпадают, поэтому . На ограниченном замкнутом интервале II , но в силу малости интервала , [1]. Вторая вариация функционала определяется соотношением
. (10)
На полуоткрытом интервале и выражение под знаком интеграла (9) будет равно нулю
.
Это уравнение Лагранжа второго рода для возмущенного движения с начальными условиями
, , .
Вторая вариация функционала будет
или
, , . (11)
При предельном переходе , , , , , , - произвольно. Из (10) с учетом (1) получается
. (12)
Если обобщенная сила доставляет минимум функционалу (2), то из (12) вытекает теорема объединенного принципа максимума (3)
. (13)
Это условие не нарушается вдоль траектории, так как в соответствии с (11) и условиями предельного перехода вдоль траектории .
Из теоремы объединенного принципа максимума легко выяснить, что множество, на котором функция достигает максимума, определяется совпадением знаков сомножителей или их пропорциональностью , где - синтезирующая знакопостоянная функция. Теорема позволяет с точностью до функции определить искомые обобщенные силы
. (14)
Обратная подстановка обобщенной силы (14) в условие (13) устанавливает знакоотрицательность синтезирующей функции
.
2. Построение синтезирующей функции. Согласно (14) равенства
(15)
определяют в фазовом пространстве гиперповерхности переключения управления. Так как на этой гиперповерхности обобщенная сила равна нулю, условия трансверсальности (4) преобразуют в условие постоянства обобщенного кинетического потенциала в данный момент времени
. (16)
Это уравнение представляет собой поверхность гиперболического параболоида в фазовом пространстве переменных Лагранжа .
Преобразование Лежандра [9] функции по переменным есть функция Гамильтона, представляющая поверхность эллипсоида в переменных Гамильтона
, (17)
в которой величины выражены через при помощи уравнений
для обобщенных импульсов, при этом при проведении преобразования величины играют роль параметров. Здесь - алгебраическое дополнение элемента гессиана кинетического потенциала
.
Качественный анализ поверхности гиперболического параболоида (16) устанавливает, что ее главные сечения суть параболы , направленные в разные стороны. Сечения гиперболического параболоида плоскостью суть семейство прямых , которых на поверхности гиперболического параболоида бесчисленное множество. Плоскости пересекают гиперболический параболоид по гиперболам.
Качественный анализ поверхности эллипсоида (17) устанавливает, что ее сечения являются эллипсами.
Из анализа так же следует, что если центр симметрии эллипса является терминальной точкой в задаче управления, то траектории, ведущие в нее, должны быть сопряжены к линии эллипса и являются прямыми, гиперболами, эллипсами. Они также называются линиями переключения.
Построение синтезирующей функции в связи с этим проводится в два этапа. В начале выражение (15) подставляется в уравнение Лагранжа
,
что позволяет получить - угловой коэффициент касательной к эллипсу.
Исключение с помощью условий трансверсальности (4) фиктивной силы
преобразует уравнение Лагранжа на поверхности переключения к виду
. (18)
Но так как на поверхности переключения , а по (18) то из (18) получаются два соотношения
и .
Первое устанавливает, что функция является модулем углового коэффициента касательной к фазовым траекториям на поверхности переключения или с коэффициентом деформации ; второе является уравнением этих траекторий на этой же поверхности.
Равенства (16) и (17) показывают, что поверхности переключения при фиксированном времени являются изоэнергетическими. Откуда по уравнениям Уиттекера определяется угловой коэффициент на этой поверхности
.
Согласно - свойству измерительных функций Н.Н. Лузина, синтезирующая функция измерима, так как может быть сделана непрерывной на множестве сколь угодно малой меры .
В зависимости от начальных условий изоэнергетические поверхности (16), (17) образуют семейство, вырождающееся в точку (вершина или фокус) при , . Поэтому всякая траектория (линия переключения), сопряженная указанным изоэнергетическим поверхностям, должна иметь свое направление в сторону фокуса. Но это возможно, если модуль углового коэффициента касательной к линии переключения и модуль углового коэффициента касательной к изоэнергетической поверхности находятся в соотношении
. (19)
Вследствие этого для семейства линий переключения можно записать синтезирующую функцию общей для всех перечисленных линий формулой
,
А закон изменения обобщенной силы на фазовой траектории истинного движения получит вид
,
где - константы, определяемые из решения краевой задачи управления.
Согласно (19) соответствующее семейство касательных к линиям переключения
, (20)
где величины и производные вычисляются вдоль линии переключения.
Справедливость разработанной теории подтверждается так же совпадением предлагаемых решений с решениями задач известными методами в частных случаях. В простейших случаях уравнение (20) интегрируется. Пусть , , . Тогда уравнение линии переключения
,
где , - константы, определяемые из краевых условий.
При - это уравнение параболы, проходящей через начало координат, соответствует задаче о переводе фазовой точки в начало координат [11]. Возможны два решения для уравнений. Пусть . Тогда:
- Если траектория точки совпадает с линией переключения, то
,что методом принципа максимума Л.С. Понтрягина получить нельзя;
- 2.Если траектория точки пересекает линию переключения, то
, что в точности совпадает с решениями Л.С. Понтрягина и А.Т. Фуллера [4, 11, 12].
3. Задача идентификации. Рассматривается динамическая система, движение которой подчиняется принципу Гамильтона- Остроградского
,
- элементарное приращение работы.
Уравнение наблюдения имеет вид
.
Требуется определить такие постоянные параметры , , что бы достигался минимум целевого функционала невязки
.(21)
4. Метод решения. Идентификация параметров производится в два этапа. На первом этапе в соответствии с заданным функционалом (21) по основной теореме объединенного принципа максимума [2, 9, 10]
,
вычисляется значение обобщенной силы , реализующей наблюдаемое движение
.
На втором этапе идентификация параметров проводится на основе оптимального закона движения путем сопоставления обобщенной силы с истинной силой , явная зависимость которой от конструктивных параметров известна. Для этого конструктивные параметры выбирают такими, чтобы среднеквадратическая ошибка за характерный (произвольный) отрезок времени между обобщенной силой и заданной обобщенной силой была бы минимальной
. (22)
Так как обобщенные координаты и наблюдения теперь известны как функции времени: , , , то вместо минимизации функционала отыскивается минимум функции . При небольшом количестве неизвестных и их линейном вхождении в обобщенную силу можно решать систему
, (23) а в более сложных случаях применить программу поиска экстремума.
Пример 1. Рассматривается идентификация параметров жесткости и сопротивления динамической системы, математическая модель которой при имеет вид
При уравнении наблюдения целевой функционал (21) записывается в следующей форме
.
Уравнение оптимальной траектории, реализующей наблюдаемое движение, синтезированное на основе объединенного принципа максимума на первом этапе идентификации [7] записывается так
где .
Оценка конструктивных параметров определялась по уравнениям (23), которые для рассматриваемого случая в развернутой форме имеют вид
где , ,
, .
Результаты моделирования наблюдаемой траектории , оптимальной траектории , реализующей наблюдаемое движение, а также траектории объекта с идентифицируемыми параметрами показаны на рис. 1.
Ошибки оценки показаны на рис. 2, где обозначено: , , .
В результате получены следующие оценки конструктивных параметров: , . Относительная погрешность идентификации параметров составляет соответственно и .
Пример 2. Рассматривается идентификация параметров динамической системы
,
где , , , .
Уравнение наблюдения имеет вид .
Для поиска экстремума функционала применим процедуру половинного деления. Для этого интеграл (39) представим в виде
,
где .
Полученные оценки параметров приведены в Табл.1.
Таблица 1 – Оценки конструктивных параметров
|
b |
c |
a |
k |
Истинные параметры |
3 |
2 |
2 |
0.1 |
Оценки |
3.002 |
1.996 |
2 |
0.1 |
Результаты сравнения фазовых траекторий действительного и оцениваемого на первом этапе алгоритма движения представлены на рис.3. Результаты сравнения наблюдаемой траектории и траектории с идентифицируемыми параметрами представлены фазовыми портретами на рис. 4.
Относительная погрешность оценки параметров составляет соответственно , , .
Заключение. Новый метод идентификации конструктивных параметров объектов на основе предложенного метода объединенного принципа максимума обладает универсальностью, а синтезируемые на его основе алгоритмы отличаются минимумом вычислительных затрат и простотой. Его применение обеспечивает высокую точность расчетов, что подтверждается результатами численного моделирования: относительная погрешность идентификации параметров не превышает 0,7%. Построение метода не требует введения дополнительных гипотез в отличии от получивших в настоящее время распространение. При этом решить задачу идентификации можно даже в случае нелинейности входящих параметров в уравнение движения и функционал.
Литература
- 1.Сейдж Э.П., Мелса Дж.Л. Идентификация систем управления.- М.: Наука, 1974, 248 c.
2.Костоглотов А.А., Костоглотов А.И. Лазаренко С.В., Шевцова Л.А. Синтез оптимального управления на основе объединенного принципа максимума.// Известия ВУЗ. Сев. Кав. Регион, Tехнические науки, 2010, №2 (154), С. 31-38.
3.Лурье А. И. Аналитическая механика. М.: Государственное издательство физико - математической литературы, 1961. - 453 с.
4.Понтрягин Л.С., Болтянский В.Г., Гамкрелидзе Р.В., Мищенко Е.Ф. Математическая теория оптимальных процессов - М.: Наука, 1971, 384 с.
5.Беллман Р. Динамическое программирование.- М.: ИЛ, 1960, 400 с.
6.Наумов Г.В. Построение кривой переключения для задач оптимального управления с учащающимися переключениями. // Изв. РАН. ТиСУ. 2003. №3. С. 46-51.
7.Пятницкий Е.С. Принцип декомпозиции в управлении механическими системами. // Докл. АН СССР. 1988.т.300, №2. С. 300-303.
8.Ананьевский И.М. Непрерывное управление по обратной связи возмущенными механическими системами. // ПММ. 2003. т.67.вып. С 163-178.
9.Костоглотов А.А., Костоглотов А.И., Лазаренко С.В. Объединенный принцип максимума в задаче синтеза оптимального управления нелинейными системами. // Автоматика и вычислительная техника. 2007. № 5, С.52-61.
10.Костоглотов А.А., Костоглотов А.И., Лазаренко С.В. Объединенный принцип максимума в задачах оценки параметров движения маневрирующего летательного аппарата. // Радиотехника и электроника. 2009. т.54. № 4, С. 450-457.
11.Fuller A.T. Study of an optimal non-linear control system. // Journal of Electronics and Control.1963. №1(15). pp. 63-71.
12.Kostoglotov A.A. Solution of Fuller`s problem on the basis of the joint Pontryagin – Hamilton – Ostrogradskii principle. // Automatic Control and Computer Sciences, 2007, Vol. 41, No. 4 pp. 179 – 187.