Лекция Екстремуми Квадратични форми Функцията ϕ ( = ( K се нарича квадратична форма на променливите когато има вида ϕ( = aij i j i j= За коефициентите предполагаме че a ij = a ji i j При = имаме ϕ ( = a при = ϕ ( = a + b + c Коефициентите на формата образуват симетрична матрица A { a } ij i j = и обратно всяка симетрична матрица поражда квадратична форма = С помощта на скаларно произведение квадратичната форма може да се запише във вида ( ϕ ( = A където A е векторът получен от умножението на матрицата A с вектор стълба на променливите Чрез матрично умножение скаларното произведение се записва = следователно ( = A ϕ Някои квадратични форми приемат стойности с един и същи знак при всяко Такива форми се наричат знакоопределени Определение Казва се че квадратичната форма ϕ ( е положително (отрицателно определена когато за всяко е изпълнено ϕ( > ( ϕ( < Симетричната матрица A се нарича положително (отрицателно определена когато породената от нея квадратична форма е положително (отрицателно определена Когато неравенствата не са строги формата ϕ ( и свързаната с нея матрица се наричат неотрицателно (неположително определени От ( следва че ако матрицата A е положително определена то матрицата A е отрицателно определена и обратно ϕ е положително определена Тогава съществува Твърдение Нека ( m за която ( m константа > ϕ Доказателство Единичната сфера = { R = } S е ограничено и затворено множество (компактно множество следователно непрекъснатата функция ϕ( е ограничена при което достига в S най-малка стойност m mi ϕ( = ϕ( mi за някое = S S По условие ϕ( > за mi mi ( = mi ( = λ ϕ( ϕ λ От вида на ( m = ϕ следователно ( mi > : S R понеже ϕ следва че за всяка константа λ е изпълнено Нека сега Тогава векторът = S понеже = = = По определение за константата m имаме ϕ( m следователно
ϕ m или ϕ( m за всяко което трябваше да докажем По същия начин се доказва че ако ( m за която ϕ ( m съществува константа > ϕ е отрицателно определена то Положителната (отрицателната определеност на матрицата A зависи от знаците на нейните главни минори a a a a a = a = = a a a = det A a a a a a Теорема (критерий на Силвестър Симетричната матрица A е положително определена тогава и само тогава когато всичките главни минори са положителни > > > > Ако A е положително определена то като разместим редовете и стълбовете по един и същи начин отново се получава положително определена матрица понеже това разместване означава пренареждане на променливите което не променя положителната определеност В този случай от критерия на Силвестър следва че всеки диагонален елемент на A е положителен и изобщо всеки минор получен от пресичането на някои редове и стълбове с едни и същи номера е положителен Матрицата A е отрицателно определена когато A е положително определена следователно от критерия на Силвестър се получава верността на Твърдение Симетричната матрица A е отрицателно определена тогава и само тогава когато за нейните главни минори е изпълнено ( > Пример Матрицата A = е положително определена понеже = > = = 5 > и = det A = > Това означава че формата породена от A ϕ( z = + + z + + z > винаги когато поне една от променливите или z е различна от нула От курса по линейна алгебра знаем че за всяка симетрична матрица A може да се намери унитарна матрица H която диагонализира A в следния смисъл λ H AH = Λ = λ λ < > <
Матрицата H се нарича ортогонална когато H H = I където I е единичната матрица от ред (за ортогоналните матрици H = H Тогава след смяна на променливите = H формата ( приема вида ϕ( H = AH H = H AH = Λ ( ( ϕ H = λ + λ + + λ Смяната на променливите посредством ортогонални матрица запазва скаларното произведение понеже ако = H и = H то = H H = H H = следователно тази смяна запазва дължините на векторите и ъглите между тях и по този начин представлява преобразуване на еднаквост в R (завъртане на координатната система около началото Числата λ λ λ се наричат собствени стойности на матрицата A и са корени на характеристичния полином λ a a a a λ a a χ( λ = det ( λi A = det a a a и по тази причина в конкретен случай могат да бъдат намерени без да има необходимост от познаване на матрицата H От ( се получава друг критерий за положителна (отрицателна определеност Условието ϕ( > за всяко означава че дясната страна на ( е положителна за всяко а последното е вярно тогава и само тогава когато всичките собствени значения λ λ λ на матрицата A са положителни Следователно е вярна Теорема Симетричната матрица A е положително (отрицателно определена тогава и само тогава когато всичките собствени значения са положителни (отрицателни Когато всичките собствени значения на A са различни от нула и между тях има както положителни така и отрицателни се казва че квадратичната форма има поведение от тип седло В този случай променливите могат да се разделят условно на две групи според знака на съответното λ в дясната страна на ( Нека за определеност λ k > за k = K s и λ k < за k = s + K Тогава формата ϕ( > за всяко = H където = ( K ( K s K и ( < s K ϕ за всяко = H където = + В новата координатна система по една група от променливите формата е положително определена а по групата на останалите е отрицателно определена Произведението на собствените числа на A е равно на детерминантата det A понеже λλ λ = det Λ = det( H AH = det H det Adet H = = det H det H det A = det( H H det A = det I det A = det A следователно всичките собствени числа на A са различни от нула тогава и само тогава когато det A Екстремуми на функция на много променливи Нека функцията f ( е ( определена в областта G и нека G f има локален минимум в Казва се че (
точката ( ( f ( ( когато ( f ( ( ( f за всяко от някаква δ -околност ( B ( ( δ Ако f > за B δ то минимумът се нарича строг Определенията за локален максимум и строг локален максимум са аналогични ( f е непрекъснато диференцируема в която е точка на локален Нека ( екстремум и нека = ( l l K l е някакъв единичен вектор = Тогава функцията на една променлива ( ( ( ( φ( t = f ( + t = f ( + tl + tl K + tl е диференцируема в околност на точката t и има екстремум от същия вид следователно от теоремата на Ферма получаваме че φ ( = От друга страна ( точно производната на f ( по направление в точката = φ е ( Това показва че производната по всяко направление в точката е равна на нула следователно ( всичките частни производни на f ( в точката са равни на нула и градиентът е ( нулевият вектор f ( = По този начин доказахме следното необходимо условие за екстремум което очевидно е аналог на познатата теорема на Ферма за функция на една променлива ( f е непрекъснато диференцируема в която е Твърдение Нека ( ( ( точка на локален екстремум Тогава f = и производните по всички направления ( в точката са равни на нула С помощта на пълен диференциал заключението на твърдение се записва ( df ( = Точки в които градиентът се анулира се наричат стационарни точки за функцията f ( Твърдение гласи че всяка екстремална точка е стационарна Обратното както знаем не е вярно даже за функция на една променлива Сега ще установим условия при които една стационарна точка е точка на локален екстремум За тази цел ще използваме формулата на Тейлър Нека f ( е ( определена и има непрекъснати производни до трети ред в някаква околност B ( δ ( на стационарната точка Тогава според формулата на Тейлър имаме ( ( ( ( f ( + = f ( + f ( + H( + o( < δ следователно ( ( ( ( f ( + f ( = H( + ε( lim ε( = където ( ( ( ( ( ( f f ( ( ( ( ( ( ( ( f f H = ( ( ( ( ( ( f f ( ( е хесианът на f ( пресметнат в Дали е точка на локален екстремум зависи ( ( от поведението на разликата f ( + f ( при достатъчно малко за която ( разлика получихме равенството ( Да предположим че хесианът H ( е положително определена матрица и нека m > е константа за която (твърдение H ( ( m ( 4
Нека освен това δ > е избрано достатъчно малко че за величината ( m бъде изпълнено ε( < когато < < δ Тогава за всяко < 4 ( ( m m m f ( + f ( = > което показва че при направените предположения функцията ( минимум в точката определена матрица то функцията ( този начин доказахме 4 ( Аналогично се показва че ако хесианът Твърдение 4 Нека ( трети ред в някаква околност хесианът ( ( 4 ε от ( да < δ f има строг локален ( ( H е отрицателно ( По f има строг локален максимум в точката f е определена и има непрекъснати производни до ( B на стационарната точка Тогава ако ( ( δ H е положително (отрицателно определена матрица то функцията f ( има строг локален минимум (максимум в точката Условията за положителна (отрицателна определеност на хесианът понякога се ( ( означават с помощта на втория диференциал d f ( > ( d f ( < при d > понеже формално вторият диференциал задава същата квадратична форма само че относно "променливите" d d d d ( f f ( = i j= i j d d i j Чрез същите разсъждения може да се установи че ако квадратичната форма ( породена от хесиана H ( има поведение от тип седло то функцията f ( сигурно ( няма локален екстремум в стационарната точка което означава че могат да се ( ( намерят точки произволно близки до за които f ( > f ( както и ( ( произволно близки точки за които f ( < f ( В този случай се казва че е седлова точка за функцията f ( Като съпоставим направените изводи с критерия на Силвестър получаваме верността на следната Теорема Нека f ( е определена и има непрекъснати производни до трети ( ( ред в околност B δ на стационарната точка и да разгледаме главните минори на хесиана H = f ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( ( = = Тогава: Ако > > > > ( минимум в точката Ако < > < > ( максимум в точката ( ( ( = det H то функцията ( ( то функцията ( f има строг локален f има строг локален 5
Ако = det H ( ( но не са изпълнени условията за строг локален минимум от пункт нито условията за строг локален максимум от пункт то за функцията f ( Пример Да намерим точките на екстремум на функцията f ( z = + + 4z + 8z + 5 + 9z Стационарните точки на тази функция определяме от системата f = + + 4z = f = + + 8z = f = 4 + 8 + 8z = z За детерминантата на тази хомогенна система имаме 4 8 = 8 5 4 = 8 6 4 8 8 4 9 ( е седлова точка следователно единственото решение е точката M ( Хесианът на f ( z всяка точка има вида 4 H = 8 4 8 8 откъдето намираме 4 = > = = 6 > = 8 = 8 6 > 4 8 8 във следователно съгласно теорема функцията f ( z в точката M ( Да разгледаме подробно случая на функция на две променливи ( стационарна точка M ( За хесиана имаме ( f ( H ( = ( ( f Да положим A = f ( B = ( = f ( C f ( има строг локален минимум f и = Тук имаме = A и = AC B И в двата случая на екстремум е налице AC B > а в кой от случаите се намираме зависи от знака на A Когато AC B < е налице седлова точка Открит остава въпросът само когато AC B = Следващият пример показва колко сложни могат да бъдат нещата когато AC B = Пример Да разгледаме функцията f ( = ( ( M Производната на тази функция по всяко в околност на стационарната точка ( направление в точката ( функцията има локален минимум но въпреки това ( M е равна на нула по-точно по всяко направление M не е точка на локален 6
минимум понеже ( f е отрицателна в ивицата между параболите = и = и положителна извън тази ивица (по самите параболи е нула Условен екстремум Множители на Лагранж Да разгледаме отначало случая на функция на две променливи f ( при наличие на едно условие g ( = Нека функцията f ( е непрекъснато диференцируема в областта G Нека E G е множеството определено от условието g ( = където g ( е непрекъснато диференцируема в G Казва се че функцията f ( има условен локален минимум в точката M E g g ( + g ( когато съществува околност ( = > B (( δ такава че f ( f ( за всяко ( E B( ( δ f ( > f ( за ( E I B( ( δ ( ( I Ако то минимумът се нарича строг Определенията за условен локален максимум и строг условен локален максимум са аналогични Рис Условието g ( = задава някаква крива γ съдържаща точката Когато сравняваме стойностите на f ( със стойността f ( точката ( се мени в някаква малка околност на ( оставайки по кривата γ M (Рис Ако M е точка на обикновен (безусловен екстремум то очевидно M е точка на условен екстремум при всякакво условие От друга страна една функция може да няма безусловен екстремум в дадена точка но при различни условия да има условни екстремуми от различен вид както се вижда от следния пример Пример 4 Да разгледаме функцията f ( = за която стационарната точка M ( е седлова При условието = функцията f ( = има локален условен минимум в M а при условието = функцията f ( = има локален условен максимум в M Нека ( Тогава от теоремата за неявните функции следва че g променливата може да се представи като неявна функция = ϕ( в околност ( δ + δ δ > те g ( ϕ( = за ( δ + δ и ϕ ( = Нека f ( има условен локален екстремум в M ( Това означава че функцията на една променлива ( = f ( ϕ( φ има обикновен екстремум от същия вид в и по 7
теоремата на Ферма φ ( От друга страна φ ( = f ( ϕ( + f ( ϕ( ( = следователно f + f ϕ (4 ( ( ( = За производната на неявната функция имаме също g + g ϕ = (5 ( ( ( ϕ Да разгледаме сега функцията на Лагранж ( λ = f ( + λg( където константата λ е множител на Лагранж който ще определим от изискването f (6 ( ( λ = f + λg ( ( = λ = λ = g ( Ще покажем че при този избор на λ имаме също ( λ = Наистина като умножим (5 с λ и съберем почленно със (4 получаваме f + λg + f + λg ϕ [ ] ( [ ( ( ] ( ( = λ = f + λg = λ ( λ = g( = По този начин доказахме което заедно със (6 показва че ( ( ( Теорема 4 Нека ( функцията f ( с условие g ( = при което f ( и ( Очевидно M е точка на локален условен екстремум за диференцируеми в околност на M и g ( + g ( > константа λ (множител на Лагранж такава че точката ( λ функцията на Лагранж ( λ = f ( + λg( g са непрекъснато Тогава съществува е стационарна за Теорема 4 ни учи че условните екстремуми трябва да се търсят между стационарните точки на функцията на Лагранж те като решения на системата λ = f + λg = ( ( ( ( λ = f ( + λ g ( = ( λ = g( = λ Последното уравнение е всъщност самото условие f = e при Пример 5 Да намерим условните екстремуми на функцията ( ограничението g ( = + + + 4 = ( + + + 4 Тук функцията на Лагранж е = e + λ а системата за определяне на стационарните точки има вида = e + λ + = ( ( + = = e + λ λ = + + + 4 = Умножаваме първото равенство с второто с и изваждаме Получаваме (7 λ( + = λ( ( + + + = Ако λ = то ще имаме = = което не удовлетворява третото уравнение (условието Множителят + + + > за всеки и следователно (7 ни дава единствено възможността = Сега замествайки в третото уравнение намираме 8
+ = следователно = = При така намерените стойности за λ получаваме e e λ = Единствената стационарна точка е 4 4 За да определим дали в тази точка функцията има локален условен екстремум и вида на екстремума ще пресметнем втория диференциал по променливите и на функцията на Лагранж d ( λ = e ( d + d + dd ( d + d Тук обаче променливите d и d не са независими понеже са свързани от условието Тази връзка определяме след като пресметнем пълния диференциал на връзката g ( d + g ( d = откъдето намираме d + d = Сега като заместим получаваме d ( λ = 5ed < което означава че става дума за условен локален максимум В общия случай се постъпва аналогично Нека G е точка на локален условен екстремум за функцията f ( която е непрекъснато диференцируема в областта G при наличие m на брой връзки ( m < g ( g ( g m( които също ( се предполагат непрекъснато диференцируеми в точката при което се иска още рангът на якобиана (матрицата производна ( ( ( g ( ( ( g g ( ( ( g ( ( ( g g ( J ( = ( ( ( g ( ( ( m gm gm ( ( ( да бъде максимален r J = Тогава могат да се намерят константи λ λ ( ( ( m ( ( ( λ λ m такива че точката да бъде стационарна за функцията на Лагранж ( λ = f ( + λg( + λg( + + λmgm( Изследването на откритите след решаване на съответната система стационарни точки се провежда по аналогичен начин Пример 6 Да намерим условните екстремуми на линейната функция u = + z върху сферата + + z = Тук функцията на Лагранж има вида = + + λ( + + z Нейните стационарни точки определяме от системата = + λ = = + λ = z = + λz = λ = + + z = Като изключим и z получаваме + + = откъдето намираме λ λ λ λ = и λ = Така за функцията на Лагранж получихме две стационарни точки ( 9
M и M Пресмятаме ( ( > + + = dz d d M d следователно M е точка на условен локален минимум за функцията u и ( ( < + + = dz d d M d следователно M е точка на условен локален максимум за функцията u