Dr_can模型预测控制笔记与代码实现-程序员宅基地

技术标签: 自动化  动态规划  控制器算法  

最近在准备毕业设计,通过看Dr_can的视频来学习一些控制方法,视频链接https://www.bilibili.com/video/BV1cL411n7KV/?spm_id_from=333.788.recommend_more_video.0https://www.bilibili.com/video/BV1cL411n7KV/?spm_id_from=333.788.recommend_more_video.0

由于实际需要,后续应该会更新模型预测控制在非线性领域的应用(自适应MPC,增益预定MPC,非线性MPC)

1.最优控制与代价函数

最优控制(optimal control)指的是在一定的约束情况下达到最优状态的系统表现,其中约束情况通常是实际环境所带来的限制,比如说如果你去控制方向盘的转向,方向盘的转动自身是有一个极限位置的,再比如说,对于一个卫星控制系统,三轴输出的力,力矩都有自己的极大值。

而如何去定义一个最优状态呢?首先引入一个比较直观的例子,汽车的转向变道问题:

正常来说,汽车转向变道应当追求乘客舒适度情况,如下图;

但如果考虑到紧急避障的问题,那么答案就完全不同了,如下图,当汽车前方遭遇到一辆校车急刹车时,为了躲开它,汽车必须尽快地向一侧变道,而不考虑舒适度问题。

因此,最优是需要结合系统面临的实际情况得出的概念,对于不同的应用背景,应当设定不同的指标去衡量优劣,因此我们引入代价函数(Cost Function)的概念:

首先,对于单输入单输出系统(SISO)而言,衡量系统性能优劣可以用误差的积累值\int_{0}^{t} e^2 dt(越小,代表误差越小,收敛越快)和输入的积累值\int_{0}^{t} u^2 dt(越小,代表控制耗能越少,越节约)来衡量。

由此,我们可以定义代价函数:

J=\int_{0}^{\infty} qe^2+ru^2 dt

函数中的q,r分别表示一个增益系数,如果q大,表示希望误差变得更小,收敛更快;r大,表示更注重输入累积,更注重节能。

接下来,我们把其推广到多输入多输出系统(MIMO),使用状态空间描述为:(这里我们假设前馈矩阵为0)

\dot{X}=AX+BU

Y=CX

此时,衡量系统表现优劣就要引入二次型的知识,我们定义:

J=\int_{0}^{\infty}E^TQE+U^TRUdt

这里的Q和R矩阵一般是我们设定的对角矩阵,我们来举一个简单的例子:

\begin{pmatrix} \dot{x_1} \\ \dot{x_2} \end{pmatrix} =A\begin{pmatrix}x_1 \\ x_2 \end{pmatrix} +B\begin{pmatrix} u_1 \\ u_2 \end{pmatrix}

\begin{pmatrix} y_1 \\y_2 \end{pmatrix} =\begin{pmatrix}x_1 \\ x_2 \end{pmatrix}

我们假定期望输入是0,那么:

E =\begin{pmatrix}y_1-r_1 \\ y_2-r_2 \end{pmatrix}=\begin{pmatrix}x_1 \\ x_2 \end{pmatrix}

U=\begin{pmatrix}u_1 \\ u_2 \end{pmatrix}

E^TQE=\begin{pmatrix}x_1&x_2\end{pmatrix}\begin{pmatrix}q_1&0\\ 0&q_2\end{pmatrix}\begin{pmatrix}x_1 \\ x_2 \end{pmatrix}=q_1x_1^2+q_2x_2^2

U^TRU=\begin{pmatrix}u_1&u_2\end{pmatrix}\begin{pmatrix}r_1&0\\ 0&r_2\end{pmatrix}\begin{pmatrix}u_1 \\ u_2 \end{pmatrix}=r_1u_1^2+r_2u_2^2

我们可以通过代价函数J的大小,来衡量系统表现的优劣,当代价函数取最小值时得到的输入,即可被称为是一种“最优输入”。

2.模型预测控制的引入

那么为什么还要引入模型预测控制的概念呢?最优控制中的代价函数需要计算从0时刻到正无穷时刻的积分,这是一种很贪婪的行为,需要消耗大量算力;同时,系统如果是一个时变系统,或者面临扰动的话,前一时刻得到的最优并不一定是下一时刻的最优值。

J=\int_{0}^{\infty}E^TQE+U^TRUdt

因而我们引入模型预测控制(Model Predictive Control)的概念,对于一般的离散化系统(因为实际计算机实现的控制系统都是离散的系统,连续系统离散化的方法在此不述)。在k时刻,我们可以测量或估计出系统的当前状态y(k),再通过计算得到的u(k),u(k+1),u(k+2)...u(k+j)得到系统未来状态的估计值y(k+1),y(k+2)...y(k+j);我们将预测估计的部分称为预测区间(Predictive Horizon),将控制估计的部分称为控制区间(Control Horizon),在得到最优输入之后,我们只施加当前时刻的输入u(k),而放弃接下来得到的输入序列。

总结如下:模型预测控制在k时刻共需三步;

第一步:估计/测量读取系统的当前状态;

第二步:基于u(k),u(k+1),u(k+2)...u(k+j)进行最优化处理;

离散系统的代价函数可以参考

J=\sum_{k}^{j-1}E_k^TQE_k+u_k^TRu_k+E_N^TFE_N

其中EN表示误差的终值,也是衡量优劣的一种标准。

第三步:只取u(k)作为控制输入施加在系统上。

在下一时刻重复以上三步,在下一步进行预测时使用的就是下一步的状态值,我们将这样的方案称为滚动优化控制(Receding Horizon Control)。

可以看到,每一时刻都需要进行一次预测,这对算力提出了巨大的要求,同时我们在此并没考虑约束问题,这个放在之后讨论。

3.最优化建模

实现MPC有许多方法,这里介绍一种方法:二次规划(Quadratic Programming)

我们首先引入一个离散系统:

x(k+1)=Ax(k)+Bu(k)

我们定义:\small u(k|k)是k时刻预测的输入值,而\small x(k|k)是k时刻预测的状态值,我们设:

X_k=\begin{pmatrix}x(k|k) \\ x(k+1|k) \\ x(k+2|k)\\ ...\\ x(k+N|k)\end{pmatrix}

U_k=\begin{pmatrix}u(k|k) \\ u(k+1|k) \\ u(k+2|k)\\ ...\\ u(k+N-1|k)\end{pmatrix}

对于期望输入为0,输出向量等于状态向量的离散系统:

x(k+1)=Ax(k)+Bu(k)

y(k)=x(k)

e(k)=y(k)-r(k)=y(k)=x(k)

我们可以得到代价函数:

\small J=\sum_{i=0}^{N-1}(x(k+i|k)^TQx(k+i|k)+u(k+i|k)^TRu(k+i|k))+x(k+N)^TFx(k+N) 

其中,我们需要求解的是系统的输入u(k),这就需要我们把状态项x(k)给消除掉,处理这个事情需要利用系统的状态方程,首先有

x(k|k)=x(k)

我们可以通过传感器或者状态估计得到系统当前的状态值,这相当于系统的一个初值,由初值和状态方程可以得到其他项为:

x(k+1|k)=Ax(k|k)+Bu(k|k)=Ax(k)+Bu(k|k)

x(k+2|k)=Ax(k+1|k)+Bu(k+1|k)=A^2x(k)+ABu(k|k)+Bu(k+1|k)

......

x(k+N|k)=A^Nx(k)+A^{N-1}Bu(k|k)+...+Bu(k+N-1|k)

我们把它简单整理一下,有:

X_k=\begin{pmatrix}I\\ A\\ A^2\\ ...\\ A^N\end{pmatrix}x(k)+\begin{pmatrix}0&0&...&0\\ B&0&...&0\\ AB&B&...&0\\ ...&...&...&...\\ A^{N-1}B&A^{N-2}B&...&B\end{pmatrix}U_k

我们再令:

M=\begin{pmatrix}I\\ A\\ A^2\\ ...\\ A^N\end{pmatrix}

C=\begin{pmatrix}0&0&...&0\\ B&0&...&0\\ AB&B&...&0\\ ...&...&...&...\\ A^{N-1}B&A^{N-2}B&...&B\end{pmatrix}

我们就得到了最简单的形式:

X_k=Mx(k)+CU_k

\small J=\sum_{i=0}^{N-1}(x(k+i|k)^TQx(k+i|k)+u(k+i|k)^TRu(k+i|k)+x(k+N)^TFx(k+N))\\ =\begin{pmatrix}x(k|k) \\ x(k+1|k) \\ x(k+2|k)\\ ...\\ x(k+N|k)\end{pmatrix}\begin{pmatrix}Q&&&&\\&Q&&&\\&&Q&&\\...&...&...&...&...\\&&&&F\end{pmatrix}\begin{pmatrix}x(k|k) \\ x(k+1|k) \\ x(k+2|k)\\ ...\\ x(k+N|k)\end{pmatrix}^T+U_k^T\begin{pmatrix}R&&&&\\&R&&&\\&&R&&\\...&...&...&...&...\\&&&&R\end{pmatrix}U_k\\

即:

J=X_k^T\overline{Q}X_k+U_k^T\overline{R}U_k

上式还可根据之前推导的公式继续化简,

\small J=X_k^T\overline{Q}X_k+U_k^T\overline{R}U_k=(x(k)^TM^T+U_k^TC^T)\overline{Q}(Mx(k)+CU_k)+U_k^T\overline{R}U_k\\ \\=x(k)^TM^T\overline{Q}Mx(k)+U_k^TC^T\overline{Q}Mx(k)+x(k)^TM^T\overline{Q}CU_k+U_k^TC^T\overline{Q}CU_k+U_k^T\overline{R}U_k

其中,\small U_k^TC^T\overline{Q}Mx(k)\small x(k)^TM^T\overline{Q}CU_k互为转置,但他们彼此又都是常数,所以他们彼此相等,因此有:

\small J=x(k)^TM^T\overline{Q}Mx(k)+2x(k)^TM^T\overline{Q}CU_k+U_k^T(C^T\overline{Q}C+\overline{R})U_k

再令\small M^T\overline{Q}M=G,M^T\overline{Q}C=E,C^T\overline{Q}C+\overline{R}=H

有:

\small J=x(k)^TGx(k)+2x(k)^TEU_k+U_k^THU_k

由此我们就得到了模型预测控制代价函数的简单形式。

4.一个详细建模实例与完整代码

下面直接上得到最优输入U_k的代码

function U_k=MPC(A,B,N,x_k,Q,R,F)
%%%%%%%%%%%%%%%%%%%%%%%%
n = size(A,1); %% A矩阵是n * n矩阵,得到A矩阵的维数
p = size(B,2); %% B矩阵是n * p矩阵,得到B矩阵的维数
M = [eye(n);zeros(N*n,n)]; %% 初始化M矩阵,第一个分块矩阵置单位阵,其余矩阵置零
C = zeros((N+1)*n,N*p); %% 初始化C矩阵,置零
%接下来计算完整的M矩阵与C矩阵
tmp = eye(n); %定义一个n阶单位阵,工具人
for i = 1:N
    rows = i*n + (1:n);%行数,因为是分块矩阵所以从1至n;
    C(rows, :) = [tmp*B, C(rows-n, 1:end-p)];%用遍历的方法将C矩阵填满;
    tmp = A*tmp;%每次都左乘一次A矩阵;
    M(rows,:) = tmp;%写满M矩阵;
end
%定义Q_bar和R_bar
S_q = size(Q,1);%得到Q矩阵维度
S_r = size(R,1);%得到R矩阵维度
Q_bar = zeros((N+1)*S_q,(N+1)*S_q);%定义Q_bar矩阵维度
R_bar = zeros(N*S_r,N*S_r);%定义R_bar矩阵维度
for i = 0:N-1
    Q_bar(i*S_q+1:(i+1)*S_q,i*S_q+1:(i+1)*S_q) = Q;%把对角线上写满Q
end
Q_bar(N*S_q+1:(N+1)*S_q, N*S_q+1:(N+1)*S_q) = F;%最后一块写上F
for i = 0:N-1
        R_bar(i*S_r+1:(i+1)*S_r, i*S_r+1:(i+1)*S_r) = R;%对角线上写满R
end
G = M'*Q_bar*M;%定义M矩阵,事实上在代价函数中,这和输入无关,并没有被用到
E = M'*Q_bar*C;%定义E矩阵
H = C'*Q_bar*C + R_bar;%定义H矩阵
%最优化,得到最优输入值
f = x_k'*E;%由于quadprog函数的定义,需要把其写成矩阵相乘形式
%基于实际情况,给输入加约束
D = eye(3);b = [10;10;10];Aep=[];Bep=[];c=[1;1;1];d=[-1;-1;-1];
U_k = quadprog(H,f,D,b,Aep,Bep,d,c);%求解最优的U_k值

代码中有几个值得注意的点:

1.矩阵的维度,这里面涉及矩阵很多,很容易把维度搞晕,建议自己手推一次,效果很好。

2.这段填满C矩阵的过程稍微有点难懂,是对照着C矩阵的结构以及里面的规律写出来的。

for i = 1:N
    rows = i*n + (1:n);%行数,因为是分块矩阵所以从1至n;
    C(rows, :) = [tmp*B, C(rows-n, 1:end-p)];%用遍历的方法将C矩阵填满;
    tmp = A*tmp;%每次都左乘一次A矩阵;
    M(rows,:) = tmp;%写满M矩阵;
end

 3.得到最优控制输入的函数quadprog,根据Matlab自带文档描述,它是求解下列问题最小值的函数,可以添加约束,由一个二次型描述与一个线性描述组成,为了使控制器的表现更贴近实际,我给输出加了正负1的限制。

 接下来,我来做一个完整的仿真过程,并比对不同Q,F,R对系统的影响,假设有离散系统为:

x(k+1)=Ax(k)+Bu(k)

y(k)=x(k)

我们设A矩阵,B矩阵分别为:

A =\begin{pmatrix}1&0.1\\0&1\end{pmatrix}\qquad B=\begin{pmatrix}0\\0.5\end{pmatrix}

输出的期望值为零向量,设置不同的Q,R,F矩阵,进行仿真;

在第一种情况,我们令:

Q =\begin{pmatrix}2&0\\0&2\end{pmatrix}\qquad R=0.1\qquad F =\begin{pmatrix}2&0\\0&2\end{pmatrix}

在第二种情况,我们令:

Q =\begin{pmatrix}0.1&0\\0&0.1\end{pmatrix}\qquad R=10\qquad F =\begin{pmatrix}0.1&0\\0&0.1\end{pmatrix}

显然,在第一种情况我们更在意误差的收敛速度,而在第二种情况我们更在意能量消耗的多少,下面是仿真结果:

 可以明显得看到,情况一收敛速度更快,耗能更多,而情况二收敛速度更慢,耗能更少,符合之前的预测。

下面是完整仿真代码:

%h为一个更新周期,即积分步长,采样时间为n
%假定输入为零,输出即为状态值
clear
clc
format long 
%--------------------------初始参数---------------------------------%
h=0.1;                      %仿真步长              
n=300;                      %仿真时间   
NN=n/h;
A = [1,0.1;0,1];            %系统矩阵
B = [0;0.5];                %输入矩阵
Q = [2,0;0,2];              %Q矩阵,对误差积累的重视程度
R = 0.1;                    %R系数,表示对节省输入的重视程度
N = 3;                      %预测区间
F = [2,0;0,2];              %F矩阵,对终端误差的重视程度
x_0 = [100;100];            %初始位置
X1 = zeros(2,NN+1);          
t = zeros(1,NN+1);
U1 = zeros(1,NN+1);         %初始化
Eg1 = zeros(1,NN+1);
X1(:,1) = x_0;              %赋初值
%--------------------------仿真1开始---------------------------------%
for j = 1:NN
    U_all = MPC(A,B,N,X1(:,j),Q,R,F);
    X1(:,j+1) = A*X1(:,j) + B*U_all(1);       %这里只取预测估计的第一项
    U1(j) = U_all(1);
    t(j+1)=t(j)+h;
    Eg1(j+1) = Eg1(j)+U_all(1)^2;
end
%%为了比较不同参数的影响,选择另一组Q,R,F
Q = [0.1,0;0,0.1];          %Q矩阵,对误差积累的重视程度
R = 10;                     %R系数,表示对节省输入的重视程度
F = [0.1,0;0,0.1];          %F矩阵,对终端误差的重视程度
X2 = zeros(2,NN+1); 
U2 = zeros(1,NN+1);         %初始化
Eg2 = zeros(1,NN+1);
X2(:,1) = x_0;              %赋初值
%--------------------------仿真2开始---------------------------------%
for j = 1:NN
    U_all = MPC(A,B,N,X2(:,j),Q,R,F);
    X2(:,j+1) = A*X2(:,j) + B*U_all(1);     %这里只取预测估计的第一项
    U2(j) = U_all(1);
    t(j+1)=t(j)+h;
    Eg2(j+1) = Eg2(j)+U_all(1)^2;
end
figure(1)
subplot(2,1,1),plot(t,X1(1,:),'-','linewidth',3),title('状态向量'),ylabel('x_1');hold on;
plot(t,X2(1,:),'-','linewidth',2),title('状态向量'),ylabel('x_1');grid on;
legend('case1','case2');
subplot(2,1,2),plot(t,X1(2,:),'-','linewidth',3),xlabel('t/s'),ylabel('x_2');hold on
plot(t,X2(2,:),'-','linewidth',2),title('状态向量'),ylabel('x_2');grid on;
legend('case1','case2');
figure(2)
plot(t,U1,'linewidth',2),title('实际输入'),xlabel('t/s'),ylabel('u');hold on;
plot(t,U2,'linewidth',2),title('实际输入'),xlabel('t/s'),ylabel('u');grid on;
legend('case1','case2');
figure(3)
plot(t,Eg1,'linewidth',2),title('消耗能量'),xlabel('t/s'),ylabel('J');hold on;
plot(t,Eg2,'linewidth',2),title('消耗能量'),xlabel('t/s'),ylabel('J');grid on;
legend('case1','case2');

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_44718107/article/details/123944631

智能推荐

One-Hot编码_onehot编码的好处-程序员宅基地

文章浏览阅读448次。一、什么是One-Hot编码?One-Hot编码,又 称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码, 每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。One-Hot编码是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,它都是零值,它被标记为1.二、One-Hot编码的工作示例让我们用一..._onehot编码的好处

node.js+uniapp计算机毕业设计安卓英语学习app(程序+APP+LW)_基于uni-app实现的英语听说软件设计与研发-程序员宅基地

文章浏览阅读99次。该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置:项目技术:Express框架 + Node.js+ Vue 等等组成,B/S模式 +Vscode管理+前后端分离等等。环境需要1.运行环境:最好是Nodejs最新版,我们在这个版本上开发的。其他版本理论上也可以。2.开发环境:Vscode或HbuilderX都可以。推荐HbuilderX;3.mysql环境:建议是用5.7版本均可。_基于uni-app实现的英语听说软件设计与研发

证件照换背景-----ps_ps登记照换背景-程序员宅基地

文章浏览阅读772次。ps 免冠照_ps登记照换背景

鼎信诺取数出错解决_jpeg processing error-程序员宅基地

文章浏览阅读2k次。今天在外部审计机构审计过程中,需要用鼎信诺审计软件取数,我的系统为用友u9,华为云。在云服务器点击运行取数工具时,弹出多个如图窗口。显示 Jpeg processing erro的错误 ,内容为failed to create temporary file。2) 属性窗口中【高级】-【环境变量】-找到temp路径,点编辑将其原始路径复制下来。3)、在资源管理器中,将复制的路径粘贴到地址栏,进入temp文件夹。1) 首先,进桌面-我的电脑-右键找属性。这样清除该路径文件后,程序已经能正常运行了。_jpeg processing error

【c语言习题】数据结构和变量(Day5-Day8随堂)-程序员宅基地

文章浏览阅读966次,点赞16次,收藏9次。本次内容包括:Day5-Day8随堂习题以及答案

Hive,regexp_extract用法--注意圆括号!!_regexp_extract提取括号-程序员宅基地

文章浏览阅读3.6k次,点赞2次,收藏7次。网上的博客很多说的一知半解,尝试很多次都报错......select regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',0), regexp_extract('http://a.m.taobao.com/i41915173660.htm','i([0-9]+)',1) ,regexp_e..._regexp_extract提取括号

随便推点

python连接数据库_python连接数据库代码-程序员宅基地

文章浏览阅读3.6k次。python连接不同的数据库_python连接数据库代码

opencascade 得到选择的面的序列号-程序员宅基地

文章浏览阅读1.5k次。opencascade 得到选择的面的序列号public: //头文件中 //选择模式,鼠标点击模型,选中对应的面 void selectMode(Handle(AIS_Shape) ); //获取鼠标选中的对象 void getShape(); //提取工件中所有的面 void pickUp(TopoDS_Shape ); struct Show_face { int adv_face_index; //面的索引号

ae视频特效制作 -- After Effects 2024_ae2024-程序员宅基地

文章浏览阅读423次,点赞10次,收藏8次。同时,软件还提供了丰富的教程和资源,帮助用户快速掌握使用技巧和创意发挥。首先,After Effects 2024引入了全新的动态工作流程,支持更高分辨率的视频和更快的渲染速度,让用户可以更轻松地处理大规模的视觉项目。同时,软件还加强了合成和渲染功能,提供了灵活的合成设置和多种输出格式,让用户可以制作出更加复杂的视觉效果。其次,After Effects 2024还增加了新的颜色校正工具和智能背景移除功能,让用户可以更轻松地调整颜色、亮度和对比度等参数,突出主题元素,提高视觉效果的质量。_ae2024

EXT4文件系统学习(五)掉电数据损坏重启挂载失败并修复_ext4文件系统被损坏的可能原因-程序员宅基地

文章浏览阅读5.7k次。问题情况 500G机械硬盘使用过程中出现挂载失败的问题,查看是第二分区没有挂载,进行分析与排查;查看磁盘Disk /dev/sdb: 500.1 GB, 500107862016 bytes255 heads, 63 sectors/track, 60801 cylindersUnits = cylinders of 16065 * 512 = 8225280 bytes..._ext4文件系统被损坏的可能原因

基于GA-BP遗传算法优化BP神经网络多维分类预测研究(Matlab代码实现)-程序员宅基地

文章浏览阅读328次,点赞9次,收藏7次。需要注意的是,该算法需要大量的计算资源和较长的训练时间,需要在合适的硬件设备和软件环境下进行。同时,算法的效果也受到数据质量和模型设计的影响,需要在实践中持续优化和改进。在研究中,需要收集并预处理相关的数据集,然后构建BP神经网络和GA-BP算法模型,在实验中进行参数调节和性能评估,最终得出结论和结果。文章中一些内容引自网络,会注明出处或引用为参考文献,难免有未尽之处,如有不妥,请随时联系删除。2. 生成初始种群,并通过遗传操作,如选择、交叉、变异等,对种群进行迭代优化,得到最优解;行百里者,半于九十。

电商技术揭秘十三:云计算在电商中的应用场景-程序员宅基地

文章浏览阅读956次,点赞26次,收藏22次。云计算在电商领域的应用场景十分丰富,不仅提升了电商企业的运营效率和服务质量,还推动了电商行业的创新发展。

推荐文章

热门文章

相关标签