kontrol optimal berdasarkan pada kalkulus variasi - vanessa sarah griselda
TRANSCRIPT
0
KONTROL OPTIMAL BERDASARKAN PADA
KALKULUS VARIASI
Tugas Akhir
Diajukan untuk memenuhi persyaratan
Sidang Sarjana Matematika
Oleh:
VANESSA SARAH GRISELDA
10104017
PROGRAM STUDI MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
INSTITUT TEKNOLOGI BANDUNG
2010
1
PRAKATA
Puji syukur penulis haturkan sedalam-dalamnya ke hadirat Allah SWT yang telah
memberikan limpahan anugerah, bimbingan, dan kekuatan sehingga penulis dapat
menyelesaikan tugas akhir ini sejak Maret 2009 hingga Februari 2010. Tanpa
masukan berharga, kepercayaan, dan dukungan yang diberikan oleh Dr. Janson
Naiborhu selaku pembimbing, maka penulis tidak akan dapat menyelesaikan tugas
akhir ini dengan hasil memuaskan. Penulis berterima kasih sebesar-besarnya kepada
kedua orang tua penulis yang telah memberikan endless support dan courage selama
penulis berkuliah di ITB. Terima kasih penulis sampaikan Dr. Agus Yodi selaku
dosen penguji atas segala pelajaran dan bimbingan dalam tugas akhir ini, serta Dr.
Hanni Garminia selaku dosen penguji tugas akhir dan juga dosen wali selama 5 tahun
terakhir. Tidak lupa penulis berterima kasih kepada Heru Tjahjana atas bantuan
dalam menyelesaikan fundamental codes Matlab untuk hampiran numerik. Pada
akhirnya, penulis ingin mengucapkan terima kasih setulusnya kepada Hutama G.
Soediredja atas seluruh dukungannya setiap hari, setiap saat.
Penulis menyadari bahwa tugas akhir ini masih memiliki beberapa kekurangan. Oleh
karena itu, penulis mengharapkan kritik dan saran yang membangun dari pembaca
untuk perbaikan selanjutnya. Semoga tugas akhir ini dapat bermanfaat bagi kemajuan
ilmu pengetahuan dan bagi siapapun yang membacanya.
Bandung, Februari 2010
Penulis
2
ABSTRAK
Kontrol Optimal berhubungan dengan permasalahan dalam menentukan hukum
kontrol untuk suatu sistem sehingga kriteria keoptimalan tertentu dapat terpenuhi.
Permasalahan kontrol optimal melibatkan fungsi biaya yang merupakan fungsional
atas state dan variabel kontrol. Kontrol optimal adalah himpunan dari persamaan
diferensial yang merupakan lintasan dari variabel kontrol yang meminimalkan fungsi
biaya. Dalam tugas akhir ini, Pontryagin’s Maximum Principle digunakan untuk
menurunkan hukum kontrol dan solusi umum diperoleh dengan menerapkan
pendekatan Kalkulus Variasi. Lebih jauh lagi, beberapa permasalahan kontrol optimal
sederhana serta solusi analitik telah ditampilkan. Selain itu, algoritma Steepest
Descent digunakan sebagai hampiran numerik bagi solusi optimal.
3
ABSTRACT
Optimal Control deals with the problem of finding a control law for a given system
such that a certain optimality criterion is achieved. A control problem includes a cost
functional that is a function of state and control variables. An optimal control is a set
of differential equations describing the paths of the control variables that minimize
the cost functional. In this final project, Pontryagin’s Maximum Principle is used for
deriving control policies and general solutions are obtained by using Calculus of
Variations approach. Furthermore, several simple optimal control problems and their
analytical solutions are presented. In addition, Steepest Descent algorithm is being
used as numerical approach to optimal solutions.
4
BAB 1
PENDAHULUAN
1.1. Latar Belakang
Sebagian besar sistem dalam bidang fisika, kimia, biologi, dan ekonomi dapat
dimodelkan dengan persamaan matematika, salah satu bentuknya adalah model
persamaan diferensial stokastik atau deterministik. Keadaan dari sistem-sistem ini
kemudian mengalami perubahan nilai terhadap waktu atau variabel bebas lainnya,
tergantung pada persamaan dinamik tertentu. Lebih jauh lagi, sistem-sistem ini akan
membawa satu state ke state yang lainnya dengan cara menerapkan beberapa input
dari luar sistem, atau disebut juga kontrol input. Jika hal ini dapat dilakukan, maka
ada beberapa cara yang berbeda untuk mencapai nilai tertentu. Dan jika demikian,
maka ada cara yang terbaik di antara seluruh cara yang memungkinkan. Input yang
menghasilkan cara terbaik ini disebut kontrol optimal. Untuk mengukur seberapa baik
cara tersebut, digunakan indeks performa atau fungsi biaya sebagai parameter.
1.2. Rumusan Masalah
Bentuk umum dari permasalahan kontrol optimal diberikan sebagai berikut. Sistem
dinamik nonlinear dideskripsikan dalam bentuk persamaan diferensial
𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 (1.2.1)
dengan state 𝑥(𝑡) ∈ 𝑹𝑛 , kontrol input 𝑢(𝑡) ∈ 𝑹𝑚 , dan indeks performa
5
𝐽(𝑡) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑇
𝑡0 (1.2.2)
dimana :
𝑡0 adalah waktu awal (tetap),
𝑇 adalah waktu akhir (bebas),
𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 adalah fungsi biaya pada selang waktu antara [𝑡0, 𝑇] ,
𝜙 𝑥 𝑇 ,𝑇 adalah fungsi biaya pada waktu akhir yang bergantung hanya pada 𝑇 dan
𝑥(𝑇).
Permasalahan kontrol optimal adalah untuk mencari input 𝑢∗ 𝑡 pada selang waktu
[𝑡0, 𝑇] yang membawa persamaan (1.2.1) sepanjang lintasan 𝑥∗ 𝑡 sehingga nilai dari
indeks performa (1.2.2) menjadi minimal, dan
𝜓 𝑥 𝑇 ,𝑇 = 0 (1.2.3)
dimana 𝜓 𝑥 𝑇 , 𝑇 merupakan fungsi pembatas pada state akhir dengan 𝜓 ∈ 𝑹𝑝
diberikan.
1.3. Tujuan
Tujuan dari tugas akhir ini adalah menurunkan kondisi keoptimalan bagi
permasalahan kontrol optimal dengan menggunakan pendekatan kalkulus variasi.
Kondisi keoptimalan yang diperoleh bersifat umum, oleh karena itu penulis akan
menerapkannya pada beberapa sistem kontrol optimal sederhana sebagai gambaran
khusus. Lebih jauh lagi, dengan menggunakan kondisi keoptimalan tersebut akan
ditentukan solusi analitik dan numerik bagi beberapa permasalahan.
6
1.4. Batasan Masalah
Dalam tugas akhir ini, penulis memfokuskan permasalahan pada sistem kontrol yang
kontinu. Lebih jauh lagi, pembahasan hanya terfokus pada sistem deterministik,
bukan pada sistem stokastik.
1.5. Sistematika Penulisan
Tugas akhir ini dibagi menjadi beberapa bab. Bab I menjelaskan tentang latar
belakang, rumusan masalah, tujuan, batasan masalah, dan sistematika penulisan dari
tugas akhir. Pada bab II dijelaskan pemaparan mengenai kontrol optimal dan kalkulus
variasi, serta bagaimana menentukan kondisi keoptimalan bagi sistem kontinu. Bab
III menyajikan tentang penerapan teori kontrol optimal dalam sistem nonlinear
sederhana dan penentuan solusi analitik serta numerik atas beberapa permasalahan.
Pada Bab IV, penulis memberikan kesimpulan atas tugas akhir ini.
7
BAB 2
KONTROL OPTIMAL BERDASARKAN PADA
KALKULUS VARIASI
Titik berat dari kontrol optimal adalah menentukan kontrol input 𝑢∗ 𝑡 (tanda (*)
menandakan kondisi optimal) yang akan membawa suatu proses (plant) 𝑥 (𝑡) dari
state awal ke state akhir yang memenuhi kondisi batas dan mengekstrimkan
(memaksimumkan atau meminimumkan) indeks performa 𝐽.
Gambar 2.1 Permasalahan Kontrol Optimal
8
Terdapat dua metode yang umum digunakan untuk mencari kontrol input. Metode
pertama adalah metode dynamic programming yang dikembangkan oleh R.E.
Bellman, sedangkan metode kedua menggunakan Maximum Principle yang
dikemukakan oleh L.S. Pontryagin. Pontryagin Maximum Principle menyatakan
bahwa lintasan state yang optimal 𝑥∗ , kontrol optimal 𝑢∗ , dan faktor pengali
Lagrange yang bersesuaian 𝜆∗ harus meminimumkan Hamiltonian. Pada tugas akhir
ini, pendekatan kalkulus variasi berdasarkan Pontryagin Maximum Principle akan
digunakan untuk menurunkan kondisi keoptimalan.
Dalam penurunan kondisi keoptimalan akan disinggung mengenai permasalahan
meminimalkan indeks performa dengan cara mencari variasi pertama dari fungsional
tertentu. Oleh karena itu, penulis merasa perlu untuk memaparkan beberapa konsep
dasar dari kalkulus variasi yang berguna untuk mencari kondisi keoptimalan.
2.1. Kalkulus Variasi
Definisi 1 : Suatu variabel 𝑥 dikatakan fungsi atas 𝑡 , dituliskan 𝑥(𝑡) , jika peta
(range) dari setiap nilai 𝑡 berkorespondensi dengan suatu nilai 𝑥.
Definisi 2 : Suatu variabel 𝐽 dikatakan fungsional atas fungsi 𝑓 𝑥 , dituliskan
𝐽 = 𝐽 𝑓 𝑥 , jika untuk setiap fungsi 𝑓(𝑥) berkorespondensi suatu nilai 𝐽.
Definisi 3 : Jika 𝑞 dan 𝑞 + ∆𝑞 adalah elemen-elemen dimana fungsi 𝑓 terdefinisi,
maka increment dari fungsi 𝑓, dinotasikan dengan ∆𝑓, adalah
∆𝑓 ≜ 𝑓 𝑞 + ∆𝑞 − 𝑓(𝑞)
∆𝑓 bergantung pada 𝑞 dan ∆𝑞, untuk lebih eksplisit, notasikan ∆𝑓(𝑞, ∆𝑞).
9
Definisi 4 : Jika 𝑥 dan 𝑥 + 𝛿𝑥 adalah fungsi-fungsi dimana fungsional 𝐽 terdefinisi,
maka increment dari fungsional 𝐽, dinotasikan ∆𝐽, adalah
∆𝐽 ≜ 𝐽 𝑥 + 𝛿𝑥 − 𝐽(𝑥)
Untuk lebih eksplisit, notasikan ∆𝐽(𝑥, 𝛿𝑥), sedangan 𝛿𝑥 disebut variasi dari fungsi 𝑥.
Definisi 5 : Misalkan increment pada fungsi 𝑓 saat 𝑡∗ dideskripsikan sebagai
∆𝑓 ≜ 𝑓 𝑡∗ + ∆𝑡 − 𝑓(𝑡∗)
Dengan mengekspansi 𝑓 𝑡∗ + ∆𝑡 dengan deret Taylor di sekitar 𝑡∗, diperoleh
∆𝑓 = 𝑓 𝑡∗ + 𝑑𝑓
𝑑𝑡 ∗∆𝑡 +
1
2! 𝑑2𝑓
𝑑𝑡2 ∗
∆𝑡 2 + … − 𝑓(𝑡∗)
dimana
𝑑𝑓
𝑑𝑡 ∗∆𝑡 = 𝑓 𝑡∗ ∆𝑡 = 𝑑𝑓
𝑑𝑓 disebut diferensial atas fungsi 𝑓 pada titik 𝑡∗, sedangkan 𝑓 𝑡∗ adalah turunan
atau slope dari 𝑓 pada titik 𝑡∗. Dengan kata lain, diferensial 𝑑𝑓 adalah aproksimasi
orde pertama (linear) terhadap increment ∆𝑓.
10
Gambar 2.1.1 Increment ∆𝑓, Diferensial 𝑑𝑓, dan Turunan 𝑓 dari Fungsi 𝑓(𝑡)
Definisi 6 : Misalkan increment pada fungsional 𝐽 dideskripsikan sebagai
∆𝐽 ≜ 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 − 𝐽(𝑥(𝑡)
dengan mengekspansi 𝐽 𝑥 𝑡 + 𝛿𝑥 𝑡 menggunakan deret Taylor, diperoleh
∆𝐽 = 𝐽 𝑥 𝑡 +𝜕𝐽
𝜕𝑥𝛿𝑥 𝑡 +
1
2!
𝜕2𝐽
𝜕𝑥2 𝛿𝑥 𝑡
2+ …− 𝐽 𝑥 𝑡
=𝜕𝐽
𝜕𝑥𝛿𝑥 𝑡 +
1
2!
𝜕2𝐽
𝜕𝑥2 𝛿𝑥 𝑡
2+ …
= 𝛿𝐽 + 𝛿2𝐽 + ⋯
dimana,
𝛿𝐽 =𝜕𝐽
𝜕𝑥𝛿𝑥 𝑡 dan 𝛿2𝐽 =
1
2!
𝜕2𝐽
𝜕𝑥2 𝛿𝑥 𝑡
2
11
disebut variasi pertama dan variasi kedua dari fungsional 𝐽 . Variasi 𝛿𝐽 adalah
aproksimasi orde pertama (linear) dari increment ∆𝐽.
Gambar 2.1.2 Increment ∆𝐽 dan Variasi Pertama 𝛿𝐽 dari Fungsional 𝐽
Lema 1 : Hubungan antara variasi dan diferensial
Misalkan 𝑥(𝑡) adalah fungsi kontinu dalam waktu 𝑡 , dan diferensial 𝑑𝑥(𝑡) dan 𝑑𝑡
tidak independen. Namun dapat didefinisikan perubahan kecil dalam 𝑥(𝑡) yang
independen terhadap 𝑑𝑡 . Definisikan variasi dalam 𝑥(𝑡) , yaitu 𝛿𝑥(𝑡) , sebagai
perubahan (increment) dalam 𝑥(𝑡) saat 𝑡 dibuat tetap.
Untuk mengilustrasikan hubungan antara 𝑑𝑥, 𝛿𝑥, dan 𝑑𝑡, dapat diperhatikan gambar
berikut.
12
Gambar 2.1.2 Hubungan antara Variasi 𝛿𝑥 dan Diferensial 𝑑𝑥
Pada gambar ditunjukkan fungsi asal 𝑥(𝑡) dan fungsi yang bertetangga 𝑥 𝑡 + 𝑑𝑥(𝑡)
dalam selang [𝑡0, 𝑇].
Hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 dinyatakan dalam persamaan berikut
𝑑𝑥 𝑇 = 𝛿𝑥 𝑇 + 𝑥 𝑇 𝑑𝑇 (2.1.1)
Lema 2 : Aturan Leibniz untuk fungsional
Jika 𝑥(𝑡) ∈ 𝑹𝑛 adalah fungsi dari 𝑡 dan 𝐽 𝑥 = ℎ 𝑥 𝑡 , 𝑡 𝑑𝑡𝑇
𝑡0 maka
𝑑𝐽 = ℎ 𝑥 𝑇 ,𝑇 𝑑𝑇 − ℎ 𝑥 𝑡0 , 𝑡0 𝑑𝑡0 + ℎ𝑥𝑇(𝑥 𝑡 , 𝑡)𝛿𝑥(𝑡) 𝑑𝑡
𝑇
𝑡0
dengan notasi
ℎ𝑥 ≜𝜕ℎ
𝜕𝑥
13
Definisi 7 : Suatu fungsional 𝐽 dikatakan memiliki nilai optimum relatif di 𝑥∗ jika
terdapat suatu 𝜖 sehingga untuk setiap fungsi 𝑥 dalam domain Ω memenuhi 𝑥 −
𝑥∗ < 𝜖 . Dengan kata lain, jika
∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥∗) ≥ 0
maka 𝐽(𝑥∗) adalah nilai minimum relatif. Dan sebaliknya, jika
∆𝐽 = 𝐽 𝑥 − 𝐽(𝑥∗) ≤ 0
maka 𝐽(𝑥∗) adalah nilai maksimum relatif. Jika hubungan di atas terpenuhi untuk 𝜖
yang cukup besar, maka 𝐽(𝑥∗) adalah nilai optimum global.
Teorema 1 : Teorema Dasar Kalkulus Variasi
Supaya suatu nilai 𝑥∗(𝑡) menjadi suatu nilai yang optimum, variasi pertama dari 𝐽
harus bernilai 0 pada saat 𝑥∗(𝑡), dalam hal ini 𝛿𝐽(𝑥∗ 𝑡 , 𝛿𝑥 𝑡 ) = 0, untuk semua
nilai yang memungkinkan dari 𝛿𝑥 𝑡 .
2.2. Kontrol Optimal Berdasarkan pada Kalkulus Variasi
Tinjau sistem dinamik nonlinear (1.2.1)
𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡
dengan indeks performa (1.2.2)
𝐽(𝑡0) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑇
𝑡0
serta fungsi pembatas pada state akhir (1.2.3)
𝜓 𝑥 𝑇 ,𝑇 = 0
14
Berikut akan diturunkan kondisi yang diperlukan untuk keoptimalan dengan
menerapkan kalkulus variasi terhadap indeks performa yang merupakan subjek bagi
fungsi pembatas (1.2.1) dan (1.2.3).
Untuk mendekatkan fungsi pembatas (1.2.1) dan (1.2.3) dengan indeks performa
maka persamaan (1.2.2) dimodifikasi dengan faktor pengali Lagrange. Karena
𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 berlaku untuk setiap 𝑡 ∈ [𝑡0, 𝑇] maka dibutuhkan faktor
pengali Lagrange yang bersesuaian, yaitu 𝜆(𝑡) ∈ 𝑹𝑛 yang merupakan fungsi dalam 𝑡.
Sedangkan untuk 𝜓 𝑥 𝑇 ,𝑇 yang hanya berlaku saat 𝑇 , faktor pengali Lagrange
yang bersesuaian adalah 𝑣 ∈ 𝑹𝑝 .
Modifikasi indeks performa (1.2.2) dengan menggunakan faktor pengali Lagrange
tersebut dan diperoleh
𝐽 = 𝜙 𝑥 𝑇 , 𝑇 + 𝑣𝑇𝜓 𝑥 𝑇 ,𝑇
+ [𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 +𝜆𝑇(𝑡) 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝑥 (𝑡) ]𝑑𝑡𝑇
𝑡0 (2.2.1)
Definisikan Hamiltonian 𝐻(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) untuk mendekatkan fungsi biaya dengan
fungsi pembatas
𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 = 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 + 𝜆𝑇𝑓(𝑥 𝑡 , 𝑢 𝑡 , 𝑡) (2.2.2)
Indeks performa (2.2.1) dapat dituliskan ulang sebagai
𝐽 = 𝜙 𝑥 𝑇 ,𝑇 + 𝑣𝑇𝜓 𝑥 𝑇 ,𝑇 + [𝐻 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 − 𝜆𝑇𝑥 (𝑡)]𝑑𝑡𝑇
𝑡0 (2.2.3)
Untuk menerapkan kondisi yang diperlukan bagi keoptimalan, dalam hal ini 𝛿𝐽 = 0,
terlebih dahulu perlu dihitung variasi 𝛿𝐽 . Dengan menggunakan aturan Leibniz pada
Lema 2 dan dengan mengasumsikan variasi independen dalam 𝛿𝑢( ),𝛿𝑥 ,𝛿𝑣, 𝛿𝜆,
dan 𝛿𝑡 diperoleh variasi pertama dari persamaan (2.2.3), yaitu
15
𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑥(𝑇) + 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡
𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑇
+𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 (𝑇) 𝑑𝑇 − 𝐻 − 𝜆𝑇 𝑡0 𝑥 (𝑡0) 𝑑𝑡0
+ 𝐻𝑥𝑇𝛿𝑥 𝑡 + 𝐻𝑢
𝑇𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡
𝑡𝑓
𝑡0
Disusun ulang menjadi
𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 , 𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 𝑑𝑥 𝑇
+ 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣
− 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0
+ 𝐻𝑥𝑇𝛿𝑥 𝑡 + 𝐻𝑢
𝑇𝛿𝑢 𝑡 − 𝜆𝑇 𝑡 𝛿𝑥 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 𝛿𝜆(𝑡) 𝑑𝑡
𝑡𝑓𝑡0
(2.2.4)
Dengan menggunakan pengintegralan parsial untuk 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇
𝑡0,
penyederhanaan pada variasi 𝑥 dapat dilakukan.
− 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇
𝑡0= −𝜆𝑇 𝑇 𝛿𝑥 𝑇 + 𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 + 𝜆 𝑇 𝑡 𝛿𝑥 𝑡
𝑇
𝑡0𝑑𝑡 (2.2.5)
Berdasarkan persamaan (2.1.1), hubungan antara variasi 𝛿𝑥 dan diferensial 𝑑𝑥 adalah
𝛿𝑥 𝑡 = 𝑑𝑥 𝑡 − 𝑥 𝑡 𝑑𝑡
dimana 𝑥(𝑡) fungsi kontinu atas 𝑡 , serta turunan 𝑑𝑥(𝑡) dan 𝑑𝑡 saling
bergantung. 𝛿𝑥(𝑡) adalah variasi dari 𝑥(𝑡) , increment kecil dalam 𝑥(𝑡) saat 𝑡
dianggap tetap, yang saling bebas dengan 𝑑𝑡. Term dalam 𝑡 = 𝑇 bergantung pada
𝑑𝑥(𝑡) dan 𝑑𝑇.
𝛿𝑥 𝑇 didefinisikan dalam 𝑑𝑥 𝑇 dan 𝑑𝑇, begitu pula dengan 𝛿𝑥 𝑡0 didefinisikan
dalam 𝑑𝑥 𝑡0 dan 𝑑𝑡0, menjadi
−𝜆𝑇 𝑇 𝛿𝑥 𝑇 = −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 (2.2.6)
16
𝜆𝑇 𝑡0 𝛿𝑥 𝑡0 = 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0 − 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 (2.2.7)
Substitusikan persamaan (2.2.6) dan (2.2.7) ke persamaan (2.2.5), maka akan
diperoleh
− 𝜆𝑇 𝑡 𝛿𝑥 𝑡 𝑑𝑡𝑇
𝑡0
= −𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0
−𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝜆 𝑇 𝑡 𝛿𝑥 𝑡 𝑇
𝑡0𝑑𝑡 (2.2.8)
Kemudian substitusikan penyederhanaan pada persamaan (2.2.8) ke persamaan
(2.2.4).
𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇
+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 − 𝜆𝑇 𝑇 𝑥 𝑇 + 𝜆𝑇 𝑇 𝑥 𝑇 𝑑𝑇
+𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣 − 𝐻 − 𝜆𝑇 𝑡0 𝑥 𝑡0 + 𝜆𝑇 𝑡0 𝑥 𝑡0 𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0
+ (𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢
𝑇𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡
𝑡𝑓
𝑡0
Disederhanakan kembali menjadi
𝛿𝐽 = 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇 + 𝜓𝑇 𝑥 𝑇 ,𝑇 𝑑𝑣
+ 𝜙𝑡 𝑥 𝑇 , 𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 𝑑𝑇 − 𝐻𝑑𝑡0 + 𝜆𝑇 𝑡0 𝑑𝑥 𝑡0
+ (𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 )𝛿𝑥 𝑡 + 𝐻𝑢
𝑇𝛿𝑢 𝑡 + (𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 )𝛿𝜆(𝑡) 𝑑𝑡
𝑡𝑓
𝑡0
Berdasarkan teori Lagrange, nilai minimum (ekstremum) dari 𝐽 dicapai pada keadaan
yang sama dengan nilai minimum dari 𝐽 , yaitu saat 𝛿𝐽 = 0. Untuk memenuhi keadaan
ini, nilai-nilai dari semua koefisien pada increment bebas 𝛿𝜆, 𝑑𝑣, 𝛿𝑢, 𝛿𝑝, 𝛿𝑥 𝑇 , 𝛿𝑥(𝑡)
dijadikan 0.
17
𝑑𝑣 = 0 → 𝜓𝑇 𝑥 𝑇 ,𝑇 = 0
𝛿𝜆 = 0 → 𝐻𝜆𝑇 − 𝑥 𝑇 𝑡 = 0
𝑥 𝑡 =𝜕𝐻
𝜕𝜆 𝑡 = 𝑓
𝛿𝑥 = 0 → 𝐻𝑥𝑇 + 𝜆 𝑇 𝑡 = 0
𝜆 𝑡 = −𝜕𝐻
𝜕𝑥
𝛿𝑢 = 0 → 0 = 𝐻𝑢𝑇 =
𝜕𝐻
𝜕𝑢
𝑑𝑥 𝑇 = 0 → 𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣 − 𝜆𝑇 𝑇 = 0
𝜙𝑥 𝑥 𝑇 ,𝑇 − 𝜆𝑇 𝑇 = 𝜓𝑥𝑇 𝑥 𝑇 ,𝑇 𝑣
𝑑𝑇 = 0 → 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 , 𝑇 𝑣 + 𝐻 = 0
𝐻 + 𝜙𝑡 𝑥 𝑇 ,𝑇 = −𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣
18
Tabel 1 Syarat keoptimalan bagi fungsi kontinu
Persamaan Variasi
Model
Pertumbuhan
Sistem
𝑥 (𝑡) = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡
𝑡 ≥ 𝑡0, 𝑡0 𝑡𝑒𝑡𝑎𝑝
Indeks Performa
𝐽(𝑡0) = 𝜙 𝑥 𝑇 ,𝑇 + 𝐿 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡𝑡𝑓
𝑡0
Fungsi pembatas
bagi state akhir
𝜓 𝑥 𝑇 , 𝑇 = 0
𝑑𝑣
Persamaan State
𝑥 𝑡 =𝜕𝐻
𝜕𝜆 𝑡
𝛿𝜆
Persamaan
Costate
𝜆 𝑡 = −𝜕𝐻
𝜕𝑥
𝛿𝑥
Kondisi
Kestasioneran
Input
𝜕𝐻
𝜕𝑢= 0
𝛿𝑢
Kondisi Pembatas
pada waktu akhir
𝜙𝑥 𝑥 𝑇 ,𝑇 + 𝜓𝑥𝑇 𝑥 𝑇 , 𝑇 𝑣 − 𝜆𝑇 𝑇 𝑑𝑥 𝑇
+ 𝜙𝑡 𝑥 𝑇 ,𝑇 + 𝜓𝑡𝑇 𝑥 𝑇 ,𝑇 𝑣 + 𝐻 𝑑𝑇 = 0
𝑑𝑥(𝑇)
𝑑𝑇
19
BAB 3
APLIKASI KONTROL OPTIMAL
DALAM SISTEM KONTINU
3.1. Prinsip Hamilton dalam Dinamika Klasik
Dinamika klasik adalah salah satu cabang ilmu Mekanika klasik, yang mempelajari
ilmu fisika tentang gaya yang bekerja pada benda. Dinamika partikel dideskripsikan
oleh hukum-hukum Newton tentang gerak, terutama oleh hukum kedua Newton.
Hukum ini menyatakan, "Sebuah benda yang memperoleh pengaruh gaya atau
interaksi akan bergerak sedemikian rupa sehingga laju perubahan waktu dari
momentum sama dengan gaya tersebut".
Jika ditinjau gerak partikel pada suatu permukaan bidang, dapat diperhatikan bahwa
diperlukan adanya gaya tertentu yakni gaya konstrain yang berperan mempertahankan
kontak antara partikel dengan permukaan bidang. Namun tak selamanya gaya
konstrain yang beraksi terhadap partikel dapat diketahui. Pendekatan Newtonian
memerlukan informasi gaya total yang bekerja pada partikel. Gaya total ini
merupakan total dari keseluruhan gaya yang beraksi pada partikel, termasuk juga
gaya konstrain. Oleh karena itu, jika dalam kondisi khusus terdapat gaya yang tidak
dapat diketahui, maka pendekatan Newtonian tidak berlaku, sehingga diperlukan
pendekatan baru dengan meninjau kuantitas fisis lain yang merupakan karakteristik
partikel, misal energi totalnya. Pendekatan ini dilakukan dengan menggunakan
prinsip Hamilton, dimana persamaan Lagrange dapat diturunkan dari prinsip tersebut.
20
Prinsip Hamilton untuk sistem konservatif yang seringkali ditemukan dalam fisika
klasik menyatakan bahwa “Dari seluruh lintasan yang mungkin bagi sistem dinamik
untuk berpindah dari satu titik ke titik lain dalam interval waktu spesifik (konsisten
dengan sembarang konstrain), lintasan nyata yang diikuti sistem dinamis adalah
lintasan yang meminimumkan integral waktu selisih antara energi kinetik dengan
energi potensial.” (Marion 1965).
Sesuai dengan prinsip Hamiltonian, persamaan gerak partikel yang dinyatakan oleh
persamaan Lagrange dapat diperoleh dengan meninjau energi kinetik dan energi
potensial partikel tanpa perlu meninjau gaya yang beraksi pada partikel. Energi
kinetik partikel dalam koordinat kartesian adalah fungsi dari kecepatan, energi
potensial partikel yang bergerak dalam medan gaya konservatif adalah fungsi dari
posisi.
Lebih jauh lagi, Lagrangian didefinisikan sebagai selisih antara energi kinetik dan
energi potensial. Dari prinsip Hamilton, dapat diturunkan persamaan Lagrange
dengan menggunakan kondisi kestasioneran. Persamaan Lagrange merupakan
persamaan gerak partikel sebagai fungsi dari koordinat, kecepatan, dan waktu.
Fungsi Lagrangian terhadap waktu merupakan konsekuensi dari fungsi konstrain
terhadap waktu atau dikarenakan persamaan transformasi yang menghubungkan
koordinat kartesian dan koordinat umum memuat fungsi atas waktu.
a. Persamaan Gerak Lagrange
Persamaan Lagrange untuk pergerakan dapat diturunkan dari Prinsip Hamilton
dengan mendefinisikan
𝑞 ≜ vektor koordinat,
21
𝑢 = 𝑞 ≜ vektor kecepatan,
𝑈(𝑞) ≜ energi potensial,
𝑇(𝑞, 𝑢) ≜ energi kinetik,
𝐿 𝑞, 𝑢 ≜ 𝑇 𝑞, 𝑢 − 𝑈(𝑞) , Lagrangian dari sistem.
Model pertumbuhan dideskripsikan dengan
𝑞 = 𝑢 ≜ 𝑓(𝑞, 𝑢) (3.1.1)
dimana fungsi 𝑓 diberikan oleh bagian fisika dari permasalahan. Untuk mencari
lintasan gerak, prinsip Hamilton mengatakan bahwa indeks performa berikut
harus diminimalkan
𝐽 0 = 𝐿 𝑞, 𝑢 𝑑𝑡𝑇
0 (3.1.2)
dengan Hamiltonian
𝐻 = 𝐿 + 𝜆𝑇𝑢 (3.1.3)
Berdasarkan tabel keoptimalan, untuk meminimalkan indeks performa maka
kondisi-kondisi berikut harus dipenuhi
−𝜆 =𝜕𝐻
𝜕𝑞=
𝜕𝐿
𝜕𝑞 (3.1.4)
0 =𝜕𝐻
𝜕𝑢=
𝜕𝐿
𝜕𝑢+ 𝜆 (3.1.5)
Setelah mengkombinasikan kedua persamaan di atas diperoleh Persamaan Gerak
Lagrange
𝜕𝐿
𝜕𝑞−
𝑑
𝑑𝑡
𝜕𝐿
𝜕𝑞 = 0 (3.1.6)
22
Perlu ditekankan bahwa dalam konteks ini, persamaan costate dan kondisi
kestasioneran ekivalen dengan Persamaan Lagrange. Dalam konteks yang lebih
umum dari permasalahan variasi, persamaan di atas disebut Persamaan Euler.
Persamaan costate dan kondisi kestasioneran pada tabel keoptimalan adalah
formulasi alternatif dari persamaan Euler.
b. Persamaan Gerak Hamilton
Jika vektor momentum didefinisikan dengan
𝜆 = −𝜕𝐿
𝜕𝑞 (3.1.7)
maka persamaan gerak dapat dituliskan dalam bentuk Hamiltonian dengan
𝑞 =𝜕𝐻
𝜕𝜆 (3.1.8)
−𝜆 =𝜕𝐻
𝜕𝑞 (3.1.9)
Jadi, dalam permasalahan kontrol optimal, persamaan state dan costate adalah
generalisasi dari Persamaan Gerak Hamilton.
23
3.2. Jarak Terdekat antara Dua Titik
Persamaan panjang kurva 𝑥(𝑡) yang bergantung pada parameter 𝑡 dengan 𝑎 ≤ 𝑡 ≤ 𝑏
diberikan oleh
𝐽 = 1 + 𝑥 2(𝑡)𝑏
𝑎𝑑𝑡 (3.2.1)
Untuk menyatakan bahwa kurva 𝑥(𝑡) menghubungkan dua titik di bidang, 𝑎, 𝐴 dan
(𝑏, 𝐵), maka perlu ditetapkan kondisi-kondisi batas berikut
𝑥 𝑎 = 𝐴 (3.2.2)
𝑥 𝑏 = 𝐵 (3.2.3)
Berikutnya, akan dicari kurva 𝑥(𝑡) yang menghubungkan 𝑎, 𝐴 dan (𝑏, 𝐵) serta
meminimalkan 𝐽.
Model pertumbuhan didefinisikan dengan
𝑥 = 𝑢 (3.2.4)
dan 𝐽 jika dituliskan dalam 𝑢 akan menjadi
𝐽 = 1 + 𝑢2𝑏
𝑎𝑑𝑡 (3.2.5)
dengan Hamiltonian
𝐻 = 1 + 𝑢2 + 𝜆𝑢 (3.2.6)
Tabel keoptimalan memberikan kondisi
𝑥 = 𝐻𝜆 = 𝑢 (3.2.7)
−𝜆 = 𝐻𝑥 = 0 (3.2.8)
24
0 = 𝐻𝑢 = 𝜆 +𝑢
1 + 𝑢2 (3.2.9)
Untuk mencari 𝑢 yang optimal, dari persamaan terakhir diperoleh
𝑢 =𝜆
1 + 𝜆2 (3.2.10)
namun dari persamaan (3.2.8) diketahui bahwa 𝜆 konstan, dengan demikian maka 𝑢
yang bernilai konstan merupakan solusi optimal.
Kurva 𝑥(𝑡) yang optimal memiliki persamaan
𝑥 𝑡 = 𝑐1𝑡 + 𝑐2 (3.2.11)
Untuk mencari nilai 𝑐1 dan 𝑐2 dapat digunakan kondisi batas yang telah ditetapkan
sebelumnya, dan diperoleh
𝑥 𝑡 = 𝐴 − 𝐵 𝑡 + 𝑎𝐵 − 𝑏𝐴
𝑎 − 𝑏 (3.2.12)
yang merupakan persamaan garis lurus sebagai lintasan optimal antara dua titik.
3.3. Kontrol Temperatur dalam Ruangan
Misalkan suatu keadaan dimana dibutuhkan energi seminimal mungkin untuk
memanaskan ruangan. Jika 𝜃(𝑡) adalah temperatur ruangan pada saat 𝑡 , 𝜃𝑎 adalah
temperatur udara di luar ruangan (konstan), dan 𝑢(𝑡) adalah laju perubahan
temperatur ke dalam ruangan, maka model dinamiknya adalah
𝜃 = −𝑎 𝜃 − 𝜃𝑎 + 𝑏𝑢 (3.3.1)
untuk suatu konstanta 𝑎 dan 𝑏, yang bergantung pada redaman panas di ruangan, dan
sebagainya. Dengan menuliskan state sebagai
25
𝑥 𝑡 ≜ 𝜃 𝑡 − 𝜃𝑎 (3.3.2)
persamaan state dapat pula dinyatakan dengan
𝑥 = −𝑎𝑥 + 𝑏𝑢 (3.3.3)
Untuk mengontrol temperatur ruangan pada suatu interval waktu tetap [0, 𝑇] dengan
energi seminimal mungkin, definisikan indeks performa sebagai berikut
𝐽 0 =1
2 𝑢2 𝑡 𝑑𝑡
𝑇
0 (3.3.4)
Hamiltonian yang digunakan adalah
𝐻 =𝑢2
2+ 𝜆 −𝑎𝑥 + 𝑏𝑢 (3.3.5)
Berdasarkan tabel keoptimalan, kontrol optimal 𝑢(𝑡) dapat ditentukan dengan
menyelesaikan
𝑥 = 𝐻𝜆 = −𝑎𝑥 + 𝑏𝑢 (3.3.6)
𝜆 = −𝐻𝑥 = 𝑎𝜆 (3.3.7)
0 = 𝐻𝑢 = 𝑢 + 𝑏𝜆 (3.3.8)
Kondisi kestasioneran mengatakan bahwa kontrol optimal diberikan oleh
𝑢 𝑡 = −𝑏𝜆(𝑡) (3.3.9)
sehingga untuk menetukan 𝑢∗(𝑡) diperlukan untuk mencari costate yang optimal
𝜆∗(𝑡) terlebih dahulu.
Substitusikan (3.3.9) ke (3.3.6) dan diperoleh persamaan state dan costate
𝑥 = −𝑎𝑥 − 𝑏2𝜆 (3.3.10a)
26
𝜆 = 𝑎𝜆 (3.3.10b)
yang harus diselesaikan untuk 𝜆∗(𝑡) dan lintasan state yang optimal 𝑥∗(𝑡).
Walaupun final costate 𝜆(𝑇) belum diketahui, namun persamaan di atas dapat
diselesaikan dengan mengasumsikan 𝜆(𝑇) telah diketahui. Solusi untuk (3.3.10b)
adalah
𝜆∗ 𝑡 = 𝑒−𝑎 𝑇−𝑡 𝜆(𝑇) (3.3.11)
dan dengan menggunakan hasil ini untuk (3.3.10a), diperoleh
𝑥 = −𝑎𝑥 − 𝑏2𝜆(𝑇)𝑒−𝑎(𝑇−𝑡) (3.3.12)
Terapkan transformasi Laplace pada persamaan ini, dan dihasilkan
𝑋 𝑠 =𝑥(0)
𝑠 + 𝑎−
𝑏2𝜆(𝑇)𝑒−𝑎𝑇
𝑠 + 𝑎 (𝑠 − 𝑎)
=𝑥(0)
𝑠 + 𝑎−
𝑏2
𝑎𝜆 𝑇 𝑒−𝑎𝑇
−12
𝑠 + 𝑎+
12
𝑠 − 𝑎 (3.3.13)
sehingga
𝑥∗ 𝑡 = 𝑥 0 𝑒−𝑎𝑇 −𝑏2
𝑎𝜆 𝑇 𝑒−𝑎𝑇 sinh 𝑎𝑡 (3.3.14)
Persamaan (3.3.11) dan (3.3.14) memberikan costate yang optimal 𝜆∗(𝑡) dan state
yang optimal 𝑥∗(𝑡) dengan catatan bahwa final costate 𝜆(𝑇) belum diketahui. State
awal 𝑥 0 diberikan.
Lebih jauh lagi, objektif dari permasalahan kontrol perlu diklasifikasikan menjadi dua
kasus, yang masing-masing akan memberikan nilai 𝜆(𝑇).
27
a. State Akhir Tetap
Misalkan temperatur awal ruangan sama dengan 𝜃𝑎 = 60о. Kemudian
𝑥 0 = 0о (3.3.15)
Diasumsikan bahwa objektif dari permasalahan kontrol adalah untuk membawa
temperatur akhir 𝜃(𝑇) tepat ke 70о selama 𝑇 detik, sehingga state akhir bernilai
tetap yaitu
𝑥 𝑇 = 10о (3.3.16)
Karena waktu akhir dan state akhir keduanya bernilai tetap, maka 𝑑𝑇 dan 𝑑𝑥(𝑇)
keduanya bernilai 0, dan kondisi batas (pada tabel keoptimalan) terpenuhi.
Dengan menggunakan persamaan (3.3.15) dan (3.3.16) akan ditentukan 𝜆(𝑇) ;
kemudian akan dicari 𝜆(𝑡) dengan menggunakan persamaan (3.3.11) dan mencari
kontrol optimal dengan memakai persamaan (3.3.9). Untuk mencari 𝜆(𝑇) ,
gunakan persamaan (3.3.14) untuk mendapatkan
𝑥 𝑇 = 𝑥 0 𝑒−𝑎𝑇 −𝑏2
2𝑎𝜆 𝑇 1 − 𝑒−2𝑎𝑇 (3.3.17)
Substitusikan persamaan (3.3.15) dan (3.3.16) dan diperoleh final costate
𝜆 𝑇 = −20𝑎
𝑏2 1 − 𝑒−2𝑎𝑇 (3.3.18)
maka lintasan costate yang optimal adalah
𝜆∗ 𝑡 = −10𝑎𝑒𝑎𝑡
𝑏2 sinh 𝑎𝑇 (3.3.19)
28
dan akhirnya laju perubahan temperatur yang optimal diberikan oleh (3.3.9) atau
𝑢∗ 𝑡 =10𝑎𝑒𝑎𝑡
𝑏 sinh 𝑎𝑇 0 ≤ 𝑡 ≤ 𝑇 (3.3.20)
Untuk memeriksa solusi, terapkan 𝑢∗ 𝑡 ke dalam sistem (3.3.3). Kemudian
selesaikan untuk lintasan state, diperoleh
𝑥∗ 𝑡 = 10sinh 𝑎𝑡
sinh 𝑎𝑇 (3.3.21)
𝑥∗ 𝑡 = 10
sesuai dengan hasil yang diharapkan.
b. State Akhir Bebas
Misalkan state akhir tidak ditetapkan bernilai 10о seperti kasus sebelumnya.
Yang diharapkan adalah fungsi kontrol 𝑢(𝑡) meminimalkan
𝐽 0 =1
2𝑠(𝑥 𝑇 − 10)2 +
1
2 𝑢2 𝑡 𝑑𝑡
𝑇
0
(3.3.22)
untuk suatu bobot 𝑠 (misal 𝑠 ∈ 𝑹) yang dipilih kemudian. Jika nilai 𝑠 cukup
besar, maka solusi optimal akan memiliki nilai 𝑥(𝑇) mendekati 10о , karena
berikutnya term pertama akan berkontribusi kecil terhadap biaya.
Berdasarkan tabel keoptimalan, persamaan state dan costate diberikan oleh
(3.3.10), dan kontrol optimal oleh (3.3.9). Dengan demikian, (3.3.11) dan (3.3.14)
tetap valid.
Kondisi awal tetap diberikan oleh (3.3.15), namun kondisi akhir harus ditentukan
dengan menggunakan kondisi batas. Waktu akhir 𝑇 bernilai tetap, sehingga
29
𝑑𝑇 = 0 dan term ke dua dari kondisi batas (pada tabel) otomatis bernilai 0.
Karena 𝑥(𝑇) tidak tetap, 𝑑𝑥(𝑇) tidak nol (sama seperti pada kasus state akhir
tetap).
Dengan memandang kondisi di atas, dibutuhkan bahwa
𝜆 𝑇 = 𝜕𝜙
𝜕𝑥 𝑇
= 𝑠 𝑥 𝑇 − 10 (3.3.23)
Dari (3.3.15) dan (3.3.23) akan ditentukan 𝜆(𝑇).
Untuk itu, perhatikan bahwa
𝑥 𝑇 =𝜆 𝑇
𝑠+ 10 (3.3.24)
Kombinasikan (3.3.24), (3.3.15), dan (3.3.17) kemudian selesaikan untuk final
costate diperoleh
𝜆 𝑇 =−20𝑎𝑠
2𝑎 + 𝑏2𝑠 1 − 𝑒−2𝑎𝑇 (3.3.25)
Dengan menggunakan (3.3.11) didapatkan lintasan costate yang optimal
𝜆∗ 𝑡 =−10𝑎𝑠𝑒𝑎𝑡
𝑎𝑒𝑎𝑇 + 𝑠𝑏2 sinh 𝑎𝑇 (3.3.26)
Akhirnya diperoleh kontrol optimal
𝑢∗ 𝑡 =10𝑎𝑏𝑠𝑒𝑎𝑡
𝑎𝑒𝑎𝑇 + 𝑠𝑏2 sinh 𝑎𝑇 (3.3.27)
Untuk memeriksa kebenaran solusi, simulasikan fungsi kontrol dengan
menggunakan 𝑢∗ 𝑡 dalam model pertumbuhan (3.3.3). Dengan menyelesaikan
untuk lintasan state yang optimal diperoleh
30
𝑥∗ 𝑡 =10𝑠𝑏2 sinh 𝑎𝑡
𝑎𝑒𝑎𝑇 + 𝑠𝑏2 sinh 𝑎𝑇 (3.3.28)
Pada waktu akhir,
𝑥∗ 𝑇 =10𝑠𝑏2 sinh 𝑎𝑇
𝑎𝑒𝑎𝑇 + 𝑠𝑏2 sinh 𝑎𝑇 (3.3.29)
3.4. Permasalahan Titik Potong dan Titik Temu
a. Formulasi Masalah
Geometri dari permasalahan ditunjukkan pada gambar, dimana 𝑦(𝑡) dan 𝑣(𝑡)
masing-masing adalah posisi vertikal dan kecepatan dari pesawat pengejar 𝐴
relatif terhadap pesawat target 𝐴𝑡 , yang diasumsikan sedang beristirahat. Jarak
horisontal awal pesawat pengejar terhadap pesawat target adalah 𝐷. Kecepatan
horisontal pengejar relatif terhadap target 𝐴𝑡 adalah 𝑉; sehingga waktu akhir 𝑇,
dimana kedua pesawat akan memiliki jarak horisontal yang sama, adalah tetap
dan diketahui bernilai
𝑇 = 𝑡0 +𝐷
𝑉 (3.4.1)
dengan sudut penglihatan 𝜎(𝑡).
Dalam permasalahan titik temu, diinginkan agar posisi akhir 𝑦(𝑇) dan kecepatan
akhir 𝑣(𝑇) keduanya bernilai 0. Namun dalam permasalahan titik potong,
kecepatan akhir tidak dipentingkan, meskipun diharapkan bahwa posisi akhir
𝑦(𝑇) adalah 0.
31
Gambar 3.4.1 Geometri dari Permasalahan Titik Potong dan Titik Temu
Persamaan dinamik dari pergerakan vertikal dinyatakan oleh persamaan state
𝑦 = 𝑣 (3.4.2)
𝑣 = 𝑢 (3.4.3)
dimana 𝑢(𝑡) adalah percepatan vertikal. Kemudian indeks performa yang
digunakan adalah
𝐽 𝑡0 =𝑠𝑦𝑦
2(𝑇)
2+
𝑠𝑣𝑣2(𝑇)
2+
1
2 𝑢2 𝑡 𝑑𝑡
𝑇
𝑡0
(3.4.4)
Untuk titik potong, 𝑠𝑣 = 0 dan 𝑠𝑦 dibuat bernilai cukup besar sehingga kontrol
optimal akan menghasilkan 𝑦2(𝑇) yang kecil. Untuk titik temu, 𝑠𝑣 dan 𝑠𝑦
keduanya dipilih bernilai besar.
b. Solusi Permasalahan
Kontrol optimal akan dipilih sedemikian rupa sehingga meminimalkan (3.4.4).
32
Setiap komponen pada state harus memiliki faktor pengali Lagrange yang
bersesuaian; oleh karena itu ambil 𝜆 ≜ [𝜆𝑦 , 𝜆𝑣]𝑇 dan Hamiltonian
𝐻 =1
2𝑢2 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣 (3.4.5)
maka persamaan costate adalah
𝜆 𝑦 = −𝜕𝐻
𝜕𝑦= 0 (3.4.6)
𝜆 𝑣 = −𝜕𝐻
𝜕𝑣= −𝜆𝑦 (3.4.7)
Kondisi kestasioneran adalah
0 =𝜕𝐻
𝜕𝑢= 𝑢 + 𝜆𝑣 (3.4.8)
sehingga kontrol optimal adalah negatif dari faktor pengali kecepatan
𝑢 𝑡 = −𝜆𝑣(𝑡) (3.4.9)
Kondisi awal adalah
𝑦 𝑡0 ,𝑣 𝑡0 diberikan. (3.4.10)
Kondisi akhir ditentukan oleh kondisi batas pada tabel keoptimalan. Karena
waktu akhir tetap, 𝑑𝑇 = 0, maka hanya term pertama yang memberikan kondisi
mengikat.
𝜆𝑦 𝑇 =𝜕𝜙
𝜕𝑦 𝑇 = 𝑠𝑦𝑦 𝑇 (3.4.11)
𝜆𝑣 𝑇 =𝜕𝜙
𝜕𝑣 𝑇 = 𝑠𝑣𝑣 𝑇 (3.4.12)
33
Berikutnya akan diselesaikan permasalahan nilai batas yang didefinisikan oleh
persamaan state dan costate dengan 𝑢 seperti pada (3.4.9) dan kondisi batas
(3.4.10) – (3.4.12). Seperti pada 3.3, 𝜆𝑦 𝑇 dan 𝜆𝑣 𝑇 diasumsikan telah
diketahui. Persamaan costate diselesaikan secara mundur terhadap waktu, dan
persamaan state kemudian diselesaikan secara maju terhadap waktu.
Dengan mengintegralkan kedua ruas pada (3.4.6) dari 𝑡 hingga 𝑇 diperoleh
konstanta komponen costate, yaitu
𝜆𝑦 𝑡 = 𝜆𝑦 𝑇 ≜ 𝜆𝑦 (3.4.13)
Integralkan (3.4.7), memberikan
𝜆𝑣 𝑇 − 𝜆𝑣 𝑡 = −(𝑇 − 𝑡)𝜆𝑦
atau
𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + (𝑇 − 𝑡)𝜆𝑦 (3.4.14)
Selanjutnya, untuk menyederhanakan diasumsikan bahwa 𝑡0 = 0 . Kemudian
substitusikan kontrol (3.4.9) ke (3.4.3) dan dihasilkan
𝑣 = −𝜆𝑣 𝑡 (3.4.15)
Dengan menggunakan (3.4.14) dan mengintegralkan kedua ruas untuk [0, 𝑡]
diperoleh persamaan kuadrat
𝑣 𝑡 = 𝑣 0 − 𝑡 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +𝑡2
2𝜆𝑦 (3.4.16)
Substitusikan hasil ini ke dalam perhitungan dan integralkan (3.4.2) lalu diperoleh
persamaan kubik
𝑦 𝑡 = 𝑦 0 + 𝑤 0 −𝑡2
2 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +
𝑡3
6𝜆𝑦 (3.4.17)
34
Persamaan state dan costate telah diselesaikan dalam term 𝜆(𝑇) dan 𝑦 0 ,𝑣(0)
yang diberikan. Namun, final costate belum diketahui. Untuk mencarinya, dapat
digunakan hubungan (3.4.11) dan (3.4.12) antara final state dan final costate.
Setelah menggabungkan hubungan ini dengan (3.4.16) dan (3.4.17) didapat
𝜆𝑦 = 𝑠𝑦 𝑦 0 + 𝑇𝑣 0 −𝑇2
2 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +
𝑇3
6𝜆𝑦 (3.4.18)
dan
𝜆𝑣 𝑇 = 𝑠𝑣 𝑣 0 − 𝑇 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 +𝑇2
2 𝜆𝑦 (3.4.19)
Kedua persamaan ini dapat dituliskan ulang sebagai
1 +
𝑠𝑦𝑇3
3
𝑠𝑦𝑇2
2𝑠𝑣𝑇
2
21 + 𝑠𝑣𝑇
𝜆𝑦
𝜆𝑣 𝑇 =
𝑠𝑦 𝑠𝑦𝑇
0 𝑠𝑣
𝑦 0
𝑣 0 (3.4.20)
Menyelesaikan persamaan ini dan diperoleh final costate
𝜆𝑦
𝜆𝑣 𝑇 =
1
∆ 𝑇 𝑠 𝑣 + 𝑇 𝑇 𝑠 𝑣 +
𝑇
2
−𝑇2
2𝑠 𝑦 −
𝑇3
6 𝑦 0
𝑣 0 (3.4.21)
dimana
∆ 𝑇 = 𝑠 𝑦 +𝑇3
3 𝑠 𝑣 + 𝑇 −
𝑇4
4 (3.4.22)
bobot akhir diperoleh
𝑠 𝑦 ≡1
𝑠𝑦 (3.4.23𝑎)
35
𝑠 𝑣 ≡1
𝑠𝑣 (3.4.23𝑏)
Pada faktanya, waktu awal 𝑡0 tidak bernilai 0. Karena persamaan state dan costate
linear, untuk mengoreksi dibutuhkan untuk mensubstitusi (𝑇 − 𝑡0) ke dalam 𝑇
pada ruas kanan persamaan (3.4.21). Sebelumnya, perlu diingat bahwa pada saat
𝑡 ≤ 𝑇 nilai 𝑦 𝑡 dan 𝑣(𝑡) telah diketahui, sehingga 𝑡 dapat diambil sebagai waktu
awal. Hal ini berkorespondensi dengan meminimalkan 𝐽(𝑡), yaitu remaining cost
pada selang [𝑡, 𝑇].
Dengan mensubstitusikan (𝑇 − 𝑡) untuk 𝑇 dalam persamaan (3.4.21) diperoleh
persamaan untuk final costate dalam variabel state saat ini :
𝜆𝑦
𝜆𝑣 𝑇 =
1
∆ 𝑇 − 𝑡 𝑠 𝑣 + 𝑇 − 𝑡 𝑇 − 𝑡 𝑠 𝑣 +
𝑇 − 𝑡
2
− 𝑇 − 𝑡 2
2𝑠 𝑦 −
𝑇 − 𝑡 3
6 𝑦 𝑡
𝑣 𝑡 (3.4.24)
Pada akhirnya, kontrol optimal dapat dihitung dengan mendasarkan perhitungan
pada (9) dan (14)
𝑢 𝑡 = − 𝑇 − 𝑡 1 𝜆𝑦
𝜆𝑣 𝑇 (3.4.25)
Dengan turut memperhitungkan (24) diperoleh kontrol optimal
𝑢 𝑡 = − 𝑇 − 𝑡 𝑠 𝑣 +
𝑇 − 𝑡 2
2∆ 𝑇 − 𝑡
𝑦 𝑡
−𝑠 𝑦 + 𝑇 − 𝑡 2𝑠 𝑣 +
𝑇 − 𝑡 3
3∆ 𝑇 − 𝑡
𝑣 𝑡 (3.4.26)
Hasil ini merupakan hukum kontrol feedback karena kontrol yang sesungguhnya
hanya diberikan dalam state saat ini.
36
c. Navigasi Proporsional
Untuk permasalahan titik potong, pilih 𝑠𝑣 = 0 dan 𝑠𝑦 → ∞. Dengan mengambil
limit dari (26) diperoleh
𝑢 𝑡 = −3
𝑇 − 𝑡 2𝑦 𝑡 −
3
𝑇 − 𝑡𝑣 𝑡 (3.4.27)
sebagai kontrol optimal titik potong.
Perlu diperhatikan bahwa untuk sudut penglihatan yang kecil
𝜎 𝑡 = tan 𝜎 𝑡 =𝑦 𝑡
𝑇 − 𝑡 𝑉 (3.4.28)
sehingga
𝜎 =𝑦 (𝑡)
𝑇 − 𝑡 𝑉+
𝑦 𝑡
𝑇 − 𝑡 2𝑉 (3.4.29)
maka kontrol optimalnya adalah
𝑢 𝑡 = −3𝑉𝜎 (3.4.30)
Persamaan ini adalah hukum kontrol untuk navigasi proporsional. Setiap pilot
mengetahui bahwa untuk melakukan perpotongan hanya diperlukan untuk
menjaga sudut terhadap target tetap konsan sehingga tidak akan ada pergerakan
terhadap posisi relatif.
3.5. Keoptimalan Sudut Gaya Dorong
Contoh ini bertujuan untuk menekankan bahwa kondisi keoptimalan pada tabel dapat
diterapkan pada sistem tak linear umumnya.
37
a. Hukum Tangent Bilinear
Sebuah partikel dengan massa 𝑚 digerakkan oleh gaya dorong konstan 𝐹 dan
dikenakan pada variabel sudut 𝛾(𝑡) . Posisi partikel adalah (𝑥 𝑡 , 𝑦 𝑡 ) dan
kecepatan pada sumbu 𝑥 dan 𝑦 masing-masing adalah 𝑢(𝑡) dan 𝑣(𝑡). Perhatikan
gambar. Persamaan state tak linear untuk 𝑋 = 𝑓(𝑋, 𝛾, 𝑡) adalah
𝑥 = 𝑢 (3.5.1)
𝑦 = 𝑣 (3.5.2)
𝑢 = 𝑎 cos 𝛾 (3.5.3)
𝑣 = 𝑎 sin 𝛾 (3.5.4)
dimana vektor untuk state adalah 𝑋 = 𝑥 𝑦 𝑢 𝑣 𝑇 , dan 𝑎 ≜ 𝐹/𝑚 adalah
percepatan gaya dorong yang telah diketahui. Sudut gaya dorong 𝛾(𝑡) merupakan
kontrol input.
Indeks performa yang digunakan berupa fungsi atas waktu akhir 𝑇 dan state
𝐽 = 𝜙(𝑋 𝑇 ,𝑇) (3.5.5)
Misalkan suatu fungsi 𝜓 atas state akhir harus bernilai 0, sehingga
𝜓 𝑋 𝑇 ,𝑇 = 0 (3.5.6)
Akan dicari bentuk dari 𝛾(𝑡) yang meminimalkan 𝐽 dan memenuhi (3.5.6).
Hamiltonian adalah
𝐻 = 𝐿 + 𝜆𝑇𝑓 = 𝜆𝑥𝑢 + 𝜆𝑦𝑣 + 𝜆𝑢𝑎 cos 𝛾 + 𝜆𝑣𝑎 sin 𝛾 (3.5.7)
dimana faktor pengali Lagrange 𝜆 𝑡 = 𝜆𝑥 𝜆𝑦 𝜆𝑢 𝜆𝑣 𝑇 memiliki komponen
yang berasosiasi dengan komponen setiap state.
38
Gambar 3.5.1 Keoptimalan Sudut Gaya Dorong
Berdasarkan tabel keoptimalan, persamaan costate adalah 𝜆 = −𝑓𝑋𝑇𝜆 atau
𝜆 𝑥 = −𝑓𝑥𝑇𝜆 = 0 (3.5.8)
𝜆 𝑦 = −𝑓𝑦𝑇𝜆 = 0 (3.5.9)
𝜆 𝑢 = −𝑓𝑢𝑇𝜆 = −𝜆𝑥 (3.5.10)
𝜆 𝑣 = −𝑓𝑣𝑇𝜆 = −𝜆𝑦 (3.5.11)
(Perhatikan bahwa subskrip pada 𝑓 menotasikan turunan parsial, sedangkan
subskrip pada 𝜆 menotasikan komponen dari persamaan costate.)
Kondisi kestasioneran adalah
0 = 𝐻𝛾 = −𝜆𝑢𝑎 sin 𝛾 + 𝜆𝑣𝑎 cos 𝛾 (3.5.12)
atau
tan 𝛾(𝑡) =𝜆𝑣 𝑡
𝜆𝑢 𝑡 (3.5.13)
39
Dengan mengintegralkan persamaan costate secara mundur dari waktu akhir 𝑇
diperoleh
𝜆𝑥 𝑡 = 𝜆𝑥(𝑇) ≜ 𝜆𝑥 (3.5.14)
𝜆𝑦 𝑡 = 𝜆𝑦(𝑇) ≜ 𝜆𝑦 (3.5.15)
𝜆𝑢 𝑡 = 𝜆𝑢 𝑇 + 𝑇𝜆𝑥 − 𝑡𝜆𝑥 ≜ 𝑐1 − 𝑡𝜆𝑥 (3.5.16)
𝜆𝑣 𝑡 = 𝜆𝑣 𝑇 + 𝑇𝜆𝑦 − 𝑡𝜆𝑦 ≜ 𝑐2 − 𝑡𝜆𝑦 (3.5.17)
Kemudian substitusikan ke persamaan (3.5.13) dan diperoleh hukum kontrol
optimal
tan 𝛾 𝑡 =𝑡𝜆𝑦 − 𝑐2
𝑡𝜆𝑥 − 𝑐1 (3.5.18)
Persamaan ini disebut hukum tangent bilinear untuk arah gaya dorong optimal
𝛾 𝑡 .
Untuk menentukan konstanta 𝜆𝑥 , 𝜆𝑦 , 𝑐1 , dan 𝑐2 , dapat dilakukan dengan cara
mensubstitusikan persamaan (3.5.18) ke persamaan state, menyelesaikannya, dan
menerapkan kondisi batas. Untuk menentukan kondisi batas, diperlukan untuk
mengetahui 𝜙 dan 𝜓, yang bergantung pada objektif kontrol tertentu. Ada banyak
objektif permasalahan kontrol yang memungkinkan mengingat bahwa seluruhnya
bergantung pada sifat dari partikel 𝑚. Salah satu contoh yang memiliki solusi
sederhana dan menarik akan dibahas berikut ini.
b. Titik Potong dengan Waktu Minimum
Misalkan 𝑚 merepresentasikan sebuah pesawat yang diharapkan berpotongan
dengan target 𝑃 dalam waktu yang minimum. 𝑃 memiliki posisi awal 𝑥1 dan
40
kecepatan konstan terhadap sumbu 𝑥 , yaitu 𝑉1 , sehingga persamaan posisi
pesawat terhadap sumbu 𝑥 pada saat 𝑡 adalah 𝑥1 + 𝑉1𝑡 . Sedangkan posisi
terhadap sumbu 𝑦 bernilai konstan.
Karena objektif permasalahan ini adalah meminimalkan waktu, maka diharapkan
bahwa kontrol optimal dapat meminimalkan
𝐽 = 𝑇 = 1 𝑑𝑡𝑇
0 (3.5.19)
dan karena 𝐿 = 1, maka Hamiltonian menjadi
𝐻 𝑡 = 1 + 𝜆𝑥𝑢 + 𝜆𝑦𝑣 + 𝜆𝑢𝑎 cos 𝛾 + 𝜆𝑣𝑎 sin 𝛾 (3.5.20)
Bagaimanapun, karena nilai 𝐿 konstan, hasil yang diperolah pada bagian a tetap
valid.
Jika 𝑚 mulai bergerak saat 𝑡0 = 0 dan dimulai dari titik awal, kondisi awal dari
𝑚 adalah
𝑥 0 = 0, 𝑦 0 = 0, 𝑢 0 = 0, 𝑣 0 = 0 (3.5.21)
Fungsi untuk final state adalah
𝜓 𝑋 𝑇 ,𝑇 = 𝑥 𝑇 − (𝑥1 + 𝑉1𝑇)
𝑦 𝑇 − ℎ = 0 (3.5.22)
sehingga
𝑥 𝑇 = 𝑥1 + 𝑉1𝑇 (3.5.23)
𝑦 𝑇 = ℎ (3.5.24)
Untuk mencari kondisi akhir yang tersisa diperlukan untuk menggunakan syarat
kondisi batas pada tabel keoptimalan.
41
State akhir dan waktu akhir keduanya bernilai bebas. Oleh karena itu 𝑑𝑥 𝑇 ≠ 0
dan 𝑑𝑇 ≠ 0 . Bagaimanapun, dalam permasalahan ini 𝑑𝑥 𝑇 dan 𝑑𝑇 saling
independen sehingga syarat kondisi batas pada tabel keoptimalan menghasilkan
dua kondisi batas yang terpisah yaitu
(𝜙𝑋 + 𝜓𝑋𝑇𝑣 − 𝜆) 𝑇 = 0 (3.5.25)
(𝜙𝑡 + 𝜓𝑡𝑇𝑣 + 𝐻) 𝑇 = 0 (3.5.26)
dimana 𝑣 = 𝑣𝑥 𝑣𝑦 𝑇 adalah faktor pengali Lagrange yang baru.
Dengan memperhitungkan (3.5.22) dan memperhatikan bahwa 𝜙 𝑥 𝑇 , 𝑇 = 0,
maka persamaan (3.5.25) menjadi
𝜆 𝑇 =
1 00 10 00 0
𝑣𝑥
𝑣𝑦
atau
𝜆𝑥 𝑇 = 𝑣𝑥 (3.5.27)
𝜆𝑦 𝑇 = 𝑣𝑦 (3.5.28)
𝜆𝑢 𝑇 = 0 (3.5.29)
𝜆𝑣 𝑇 = 0 (3.5.30)
Perlu diperhatikan bahwa komponen-komponen dari 𝜆 𝑇 yang berkorespondensi
dengan komponen final state yang tetap, yaitu 𝑥(𝑇) dan 𝑦(𝑇), adalah variabel-
variabel yang belum diketahui, sedangkan komponen-komponen dari 𝜆 𝑇 yang
berkorespondensi dengan komponen final state yang bebas, yaitu 𝑢(𝑇) dan 𝑣(𝑇),
memiliki nilai tetap pada 0.
42
Dengan menggunakan kondisi (3.5.20) dan (3.5.22), kondisi akhir (3.5.26)
menjadi
𝐻 𝑇 = − 𝜓𝑡𝑇𝑣 𝑇 = − −𝑉1 0
𝑣𝑥
𝑣𝑦
atau dengan menggunakan (3.5.27) – (3.5.30)
1 + 𝑣𝑥𝑢 𝑇 + 𝑣𝑦𝑣 𝑇 = 𝑉1𝑣𝑥 (3.5.31)
Kemudian persamaan state (3.5.1) – (3.5.4) akan diselesaikan dengan
memperhitungkan (3.5.18) dan solusi costate (3.5.14) – (3.5.17) serta kondisi
batas (3.5.21), (3.5.23), (3.5.24), (3.5.27) – (3.5.30). Kondisi (3.5.31) juga
diperlukan untuk menyelesaikan waktu akhir optimal 𝑇∗ yang belum diketahui.
Dari persamaan (3.5.27) – (3.5.30) solusi costate adalah
𝜆𝑥 𝑡 = 𝑣𝑥 (3.5.32)
𝜆𝑦 𝑡 = 𝑣𝑦 (3.5.33)
𝜆𝑢 𝑡 = (𝑇 − 𝑡)𝑣𝑥 (3.5.34)
𝜆𝑣 𝑡 = (𝑇 − 𝑡)𝑣𝑦 (3.5.35)
Dimana faktor pengali terakhir 𝑣𝑥 , 𝑣𝑦 perlu ditentukan. Dengan demikian, hukum
tangent bilinear (3.5.18) dapat dibuat dalam bentuk yang lebih sederhana
tan 𝛾 =𝑣𝑦
𝑣𝑥 (3.5.36)
Untuk permasalahan titik potong dengan waktu minimum ini, sudut gaya dorong
yang optimal bernilai konstan.
43
Untuk mencari kontrol optimal atas sudut gaya dorong 𝛾∗(𝑡), yang tersisa adalah
untuk mencari 𝑣𝑥 dan 𝑣𝑦 .
Karena 𝛾 bernilai konstan, sangat mudah untuk melakukan proses integrasi secara
maju dari 𝑡0 = 0 hingga diperoleh
𝑣 𝑡 = 𝑎𝑡 sin 𝛾 (3.5.37)
𝑢 𝑡 = 𝑎𝑡 cos 𝛾 (3.5.38)
𝑦 𝑡 =𝑎𝑡2
2sin 𝛾 (3.5.39)
𝑥 𝑡 =𝑎𝑡2
2cos 𝛾 (3.5.40)
dimana kondisi awal (3.5.21) telah dimasukkan dalam perhitungan.
Dengan menyelesaikan persamaan (3.5.39) dan (3.5.40) pada saat 𝑡 = 𝑇
tan 𝛾 =𝑦 𝑇
𝑥 𝑇 (3.5.41)
dan kondisi akhir (3.5.23) dan (3.5.24) kemudian memberikan persamaan untuk
kontrol dalam kondisi akhir :
tan 𝛾 =ℎ
𝑥1 + 𝑉1𝑇 (3.5.42)
Bagaimanapun, masih perlu ditentukan waktu akhir yang optimal 𝑇∗ untuk
digunakan dalam (3.5.42). Peran dari persamaan (3.5.31) adalah untuk
menyelesaikan 𝑇∗, namun untuk menggunakannya dibutuhkan untuk mencari 𝑣𝑥
44
dan 𝑣𝑦 . Khusus dalam permasalahan ini dapat digunakan cara singkat dimana 𝑣𝑥 ,
𝑣𝑦 tidak diperlukan.
Dapat diperhatikan bahwa (3.5.39), (3.5.40), (3.5.23), dan (3.5.24) menghasilkan
sin 𝛾 =2𝑦(𝑇)
𝑎𝑇2=
2ℎ
𝑎𝑇2 (3.5.43)
cos 𝛾 =2𝑥 𝑇
𝑎𝑇2=
2 𝑥1 + 𝑉1𝑇
𝑎𝑇2 (3.5.44)
Kemudian, sin2 𝛾 + cos2 𝛾 = 1, atau
4ℎ2 + 4(𝑥1 + 𝑉1𝑇)2 = 𝑎2𝑇4 (3.5.45)
yang mana
−𝑎2𝑇4
4+ 𝑉1
2𝑇2 + 2𝑉1𝑥1𝑇 + 𝑥12 + ℎ2 = 0 (3.5.46)
Persamaan kuadrat ini dapat diselesaikan untuk 𝑇∗ dengan kondisi awal di sekitar
target 𝑥1, 𝑉1,ℎ diberikan. Hanya ada satu solusi untuk persamaan (3.5.46) yang
masuk akal secara fisis.
Kontrol optimal ditentukan dengan menyelesaikan persamaan (3.5.46) untuk 𝑇∗
dan kemudian menyelesaikan persamaan (3.5.42) untuk sudut gaya dorong
optimal 𝛾∗.
Gambar di bawah ini merepreentasikan bahwa sisi miring dari segitiga
digambarkan dalam persamaan gerak target, sebagai
𝑑2 = ℎ2 + (𝑥1 + 𝑉1𝑇∗)2 (3.5.47)
atau dalam persamaan gerak pesawat pengejar sebagai
45
𝑑2 = 1
2𝑎 𝑇∗ 2
2
(3.5.48)
Gambar 3.5.2 Kontrol Input bagi Permasalahan Titik Potong dengan Waktu Minimum
Persamaan (3.5.45) hanyalah sebuah persamaan yang harus dipenuhi agar kedua
pesawat berada pada titik yang sama pada waktu akhir.
Tanpa melalui penurunan yang detail dari (3.5.45) maka tidak dapat disimpulkan
dari gambar apakah solusinya merupakan waktu akhir yang optimal.
46
3.6. Solusi Numerik Sistem Hamiltonian untuk Hukum Newton
Misalkan model pertumbuhan yang mengikuti Hukum Newton, dimana
𝑦 = 𝑣
𝑣 = 𝑢 (3.6.1)
dengan 𝑦 adalah vektor posisi, 𝑣 adalah vektor kecepatan, dan 𝑢 adalah input
percepatan. Vektor state adalah 𝑥 = [𝑦 𝑣]𝑇 . Kemudian pilih indeks performa :
𝐽 =1
2 𝑢2 𝑡 𝑑𝑡
𝑇
𝑡0
(3.6.2)
Model pertumbuhan akan dibawa mendekati final state 𝑥(𝑇) = [𝑦 𝑇 𝑣 𝑇 ]𝑇 tanpa
menggunakan terlalu banyak energi. Nilai sesungguhnya dari final state tidaklah
tetap, meskipun waktu akhir 𝑇 tetap.
Dalam 3.2. telah dibangun controller untuk model pertumbuhan ini, dan dalam 3.4.
telah dicari ekspresi analitik untuk controller feedback yang kontinu. Pada bagian ini
akan dicari kontrol optimal dengan menggunakan solusi numerik atas persamaan
state–costate.
Hamiltonian dan persamaan Euler sama seperti yang diberikan pada 3.4. yaitu
𝐻 =1
2𝑢2 + 𝑣𝜆𝑦 + 𝑢𝜆𝑣
𝜆 𝑦 = −𝜕𝐻
𝜕𝑦= 0
𝜆 𝑣 = −𝜕𝐻
𝜕𝑣= −𝜆𝑦
47
Kontrol optimal adalah
𝑢 = −𝜆𝑣(𝑡) (3.6.3)
Dengan menggunakan kontrol optimal di atas dalam persamaan state, diperoleh
Hamiltonian dari sistem, yaitu
𝑦 = 𝑣
𝑣 = −𝜆𝑣
𝜆 𝑦 = 0
𝜆 𝑣 = −𝜆𝑦 (3.6.4)
Dengan menggunakan persamaan terakhir, diperoleh
𝜆𝑦 𝑡 = 𝑙
𝜆𝑣 𝑡 = exp −𝑡 𝑘
untuk suatu konstanta 𝑙 dan 𝑘.
Kondisi batas yang digunakan adalah
𝑦 0 = 𝑚 diberikan,
𝑣 0 = 𝑛 diberikan,
𝑦 𝑇 = 0
𝑣 𝑇 = 0 (3.6.5)
dengan 𝑚 dan 𝑛 merupakan tebakan untuk state awal, atau notasikan 𝑥 0 = [𝑚 𝑛]𝑇
sedangkan untuk state akhir, diinginkan agar 𝑥 𝑇 = [0 0]𝑇 .
48
Karena kondisi awal dari persamaan costate tidak diketahui, maka akan dibangun
suatu metode aproksimasi terhadap kondisi awal costate yang sesuai.
Misalkan 𝜙 = [𝑝 𝑞]𝑇 = [𝜆𝑦 0 𝜆𝑣
0 ]𝑇 adalah vektor tebakan untuk costate awal
untuk suatu 𝑝 ∈ 𝐑𝐧, 𝑞 ∈ 𝐑𝐧 didapatkan
𝜆𝑦 𝑡 = 𝑝
𝜆𝑣 𝑡 = exp −𝑡 𝑞 (3.6.6)
Jika kita mengkhususkan perhatian pada final state 𝑣(𝑇) dengan 𝜆𝑣 0 = 𝑞 ,
diperoleh
𝑣 𝑇; 𝑞 = − exp(−𝑡) 𝑑𝑡𝑇
0
𝑞
Tentu saja, lintasan dari 𝑥(𝑇) secara umum tidak berakhir pada 𝑥 𝑇 = [0 0]𝑇 .
Dengan kata lain, secara umum 𝑥(𝑇) ≠ 𝑥 (𝑇).
Untuk menebak 𝜙 yang sesuai yang membuat 𝑥 dimulai tepat pada 𝑥 0 = [𝑚 𝑛]𝑇
dan berakhir di 𝑥 𝑇 = [0 0]𝑇 tidaklah mudah. Oleh karena itu, akan digunakan
algoritma berikut untuk menghampiri nilai 𝜙 yang sesuai. Algoritma tidak bertujuan
untuk mencari nilai 𝜙 yang presisi, namun diharapkan algoritma dapat menemukan 𝜙
yang meminimalkan fungsional berikut
𝐹 𝜙 = 𝑥 𝑇 − 𝑥 (𝑇) 2 (3.6.7)
dimana 𝑥(𝑇) adalah evaluasi atas 𝑥 saat 𝑇 dan (𝑥, 𝜙) adalah solusi atas sistem
persamaan diferensial (3.6.4) dengan kondisi awal 𝑥 0 , 𝜙 0 = 𝑥 0 , 𝜙 0 .
Fungsional 𝐹 akan diminimalkan dengan menggunakan metode Steepest Descent.
Program yang digunakan adalah MATLAB. Kemudian akan diperoleh lintasan state
49
dan costate 𝜆𝑦(𝑡) dan 𝜆𝑣(𝑡) , sehingga kontrol input dapat ditentukan dengan
menggunakan persamaan (3.6.3).
Algoritma untuk metode Steepest Descent dapat dideskripsikan sebagai berikut.
Pertama, pilih sebarang bilangan positif 𝜖 dan 𝛼, serta sebarang vektor
𝜙 0 = [𝑝 𝑞]𝑇
Dengan menggunakan nilai-nilai ini dan kondisi awal 𝑥 0 = [𝑚 𝑛]𝑇 permasalahan
nilai awal berikut dapat diselesaikan
𝑦 = 𝑣
𝑣 = −𝜆𝑣
𝜆 𝑦 = 0
𝜆 𝑣 = −𝜆𝑦
dimana (𝑥 0 , 𝜙 0 ) = (𝑥 0 ,𝜙 0). Kemudian, dapat dihitung final state 𝑥(𝑇) untuk
𝜙 0 tersebut. Lebih jauh lagi, dengan menggunakan nilai 𝑥(𝑇) ini, nilai skalar dari
𝐹(𝜙 0) dapat dihitung dengan persamaan (3.6.7). Berikutnya, akan dicari nilai 𝜙 1
yang baru yang akan membuat nilai 𝐹(𝜙 1) < 𝐹(𝜙 0).
Turunan parsial dari 𝐹 terhadap masing-masing 𝜆𝑦 dan 𝜆𝑣 di 𝜙 0 diaproksimasi
dengan
𝜕𝐹
𝜕𝜆𝑦 𝜙 0 ≈ 𝐷1 ≈
𝐹 𝜙 0 + 𝜖(1,0) − 𝐹(𝜙 0 )
𝜖
𝜕𝐹
𝜕𝜆𝑣 𝜙 0 ≈ 𝐷2 ≈
𝐹 𝜙 0 + 𝜖(0,1) − 𝐹(𝜙 0 )
𝜖
Sehingga, gradient dari 𝐹 di 𝜙 0 diaproksimasi dengan
50
∇𝐹 𝜙 0 = 𝜕𝐹
𝜕𝜆𝑦 𝜙 0 ,
𝜕𝐹
𝜕𝜆𝑣 𝜙 0 ≈ (𝐷1 , 𝐷2)
Berikutnya, bentuk
𝐸1 = 𝐹 𝜙 0 − α 𝐷1 ,𝐷2
𝐸2 = 𝐹 𝜙 0 −α
2 𝐷1 , 𝐷2
Jika 𝐸1 < 𝐸2 , maka 𝜙 1 = 𝜙 0 − 𝛼 𝐷1 ,𝐷2 . Dan jika sebaliknya, maka 𝜙 1 = 𝜙 0 −
𝛼
2 𝐷1 ,𝐷2 dan ubah nilai 𝜖 dengan
𝜖
2 serta nilai 𝛼 dengan
𝛼
2. Kemudian lanjutkan
dengan mengulangi proses di atas menggunakan nilai 𝜙 1 untuk variabel 𝜙 0, sehingga
dapat diperoleh nilai 𝜙 2 . Jika proses iterasi ini terus dilanjutkan, maka akan
dihasilkan barisan vektor 𝜙 𝑚 𝑚=0
∞ .
51
********************************************************************
% program input Hamiltonian
function dy = hamiltonian(t,y)
dy = zeros(4,1);
% a column vector
dy(1) = y(2) ; % y dot
dy(2) = -y(4) ; % v dot
dy(3) = 0; % lambda y dot
dy(4) = -y(3); % lambda v dot
end
********************************************************************
% program utama
clear all;
clc;
toleransi = 0.001; %besar galat
epsilon1 = 0.001; %nilai awal untuk epsilon
epsilon2 = epsilon1/2;
alpha1 = 0.001; %nilai awal untuk alpha
alpha2 = alpha1/2;
tmin = 0; %waktu awal (t0)
tmax = 10; %waktu akhir (tf)
time = [tmin tmax];
% Syarat awal untuk state dan costate
a = 1; % syarat awal y
52
b = 1; % syarat awal v
L10 = 2; % tebakan awal costate lambda v
L20 = 2; % tebakan awal costate lambda y
ic = [a b L10 L20];
options = odeset('RelTol', 1e-10);
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
F(1) = (Y(ujung,1))^2+(Y(ujung,2))^2; %syarat akhir state (0,0,0)
i=1;
alpha = alpha1;
epsilon = epsilon1;
while F(i) > toleransi
L10_lama = L10(i);
L20_lama = L20(i);
% Initial condition partial
L10partial = L10_lama + epsilon;
ic = [a b L10partial L20_lama];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL1 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;
% Initial condition partial
L20partial = L20_lama + epsilon;
ic = [a b L10_lama L20partial];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
partialL2 = ((Y(ujung,1))^2+(Y(ujung,2))^2 - F(i)) / epsilon;
53
normF = sqrt(partialL1^2 + partialL2^2);
% Initial condition
L10_baru = L10_lama - alpha * partialL1 / normF;
L20_baru = L20_lama - alpha * partialL2 / normF;
ic = [a b L10_baru L20_baru];
[T,Y] = ode45(@hamiltonian, time, ic, options);
ujung = length(T);
i=i+1;
F(i)= (Y(ujung,1))^2+(Y(ujung,2))^2;
if F(i)>=F(i-1)
alpha = alpha2;
epsilon = epsilon2;
else
alpha = alpha1;
epsilon = epsilon2;
end
L10 = [L10; L10_baru];
L20 = [L20; L20_baru];
end
figure(1)
plot(T, Y(:,1))
xlabel('t (s)')
ylabel('y (m)')
axis([0 10 0 10])
figure(2)
plot(T,Y(:,2))
xlabel('t (s)')
ylabel('v (m/s)')
54
figure (3)
plot(T,Y(:,1:2))
xlabel('t (s)')
ylabel('y (m) dan v (m/s)')
% Transpose
F = F.';
Hasil =[F L10 L20];
*********************************************************
55
Dengan menjalankan program di atas, diperoleh hasil plot lintasan state yang optimal
sebagai berikut
Gambar 3.6.1 Plot Lintasan 𝑦∗ terhadap t
Gambar 3.6.2 Plot Lintasan 𝑣∗ terhadap t
56
Gambar 3.6.3 Plot Lintasan 𝑦∗ dan 𝑣∗ terhadap t
Nilai costate yang optimal adalah
𝜆𝑦 𝑡 = 0.0738
𝜆𝑣 𝑡 = 0.4662 − 0.0738𝑡
Sehingga diperoleh kontrol input
𝑢∗ 𝑡 = −0.4662 + 0.0738𝑡
57
BAB 4
KESIMPULAN
Dalam tugas akhir ini, beberapa konsep dasar dari kalkulus variasi telah dipaparkan
dan kondisi keoptimalan telah diturunkan dengan menggunakan Pontryagin
Maximum Principle. Variasi pertama dari indeks performa telah dicari, dan nilai dari
setiap increment bebas pada saat nol adalah syarat perlu bagi persamaan state dan
costate untuk mencapai keoptimalan. Tabel 1 merangkum syarat perlu bagi kondisi
keoptimalan tersebut.
Beberapa contoh permasalahan sistemn kontinu nonlinear yang diselesaikan dengan
menggunakan kontrol optimal telah diselesaikan dengan cara mencari solusi analitik
dan solusi numerik. Pendekatan solusi numerik yang digunakan adalah metode
Steepest Descent.
58
DAFTAR PUSTAKA
1. Athans, M and P. Falb, Optimal Control, New York : McGraw-Hill, 1966
2. Bryson, A. E. and Ho, Y-C., Applied Optimal Control, Blaisdell Publishing
Company, Waltham, 1969
3. Kirk, D., Optimal Control Theory : An Introduction, Prentice Hall, 1970
4. Lewis, F. L., Optimal Control, New York : Wiley, 1995
5. Tjahjana, H., Pranoto, I., Muhammad, H., Naiborhu, J., On The Optimal
Control Computation of Linear Systems, J. Indonesian Math. Society Vol. 15,
No. 1 (2009), pp. 13 – 20
6. Tomlin, C. J., Lecture Notes 8 : Optimal Control and Dynamic Games, (2005)