%\section{Umkehrsatz und Anwendungen}
\subsection{Extrema auf Mannigfaltigkeiten}
\begin{Satz}[\textbf{Extrema unter Nebenbedingungen}]
Seien $X$ ein endlichdimensionaler reeller Raum, $U\co X$
offen, $g: U \ra \Bbb{R}^{m}$ 
stetig differenzierbar\label{ExNe}  
  und $p \in U$ ein Punkt mit  $\diff_{p}f$
surjektiv. Wir setzen 
$$M \pdef \{q\in U\mid g(q) = g(p)\}$$ 
Besitzt dann f"ur eine differenzierbare Funktion $f:U \ra \Bbb{R}$
ihre Einschr"ankung $f|_M$ ein lokales Extremum bei $p$,
so gibt es $\lambda_{1}, \ldots, \lambda_{m} \in \Bbb{R}$ mit
$$\diff _{p}f 
= \lambda_{1}\diff _{p}g_{1} + \ldots + \lambda_{m}\diff _{p}g_{m}$$
\end{Satz} 
\begin{figure}[p]\centering
\includegraphics[width=\textwidth]{SkriptenBilder/BildLM}\\[4mm]
\noindent 
Dies Bild soll den Satz "uber Extrema mit Nebenbedingungen
veranschaulichen f"ur den Fall einer Funktion $f$ auf der 
Papierebene, hier angedeutet durch einige 
gestrichelt engezeichnete Niveaulinien,
die maximiert werden soll unter einer Nebenbedingung $g$, 
hier angedeutet durch die fett eingezeichnete Kurve $M$ der
Punkte, bei denen sie erf"ullt ist. Es scheint mir anschaulich
recht offensichtlich, da"s  Extrema von $f$ auf $M$ nur
an Stellen $p\in M$ zu
erwarten sind, an denen der Gradient von $f$ senkrecht steht auf $M$,
also ein Vielfaches des Gradienten von $g$ ist. Im Bild h"atten wir etwa 
grob gesch"atzt $(\op{grad}f)(p)=-\frac{1}{2}(\op{grad}g)(p)$. 
Allerdings ist es
f"ur reellwertige Funktionen auf der Papierebene 
streng genommen erst nach der Wahl eines 
Ma"sstabs sinnvoll, von  Gradienten zu reden,
und in allgemeineren F"allen erst nach  Wahl eines 
Skalarprodukts auf dem Richtungsraum, weshalb ich im Satz die 
koordinatenfreie Formulierung mit  Differentialen 
vorgezogen habe.
\end{figure}
\begin{Bemerkungl}
Mit der Notation $g(p)=c$ mag man
in dieser Situation ein lokales Extremum der Restriktion
$f|_{M}$ auch ein {\bf lokales Extremum von $f$ unter den
Nebenbedingungen}\index{Extrema!unter Nebenbedingungen} 
$g_{1}(q) = c_{1},\ldots, g_{m}(q) =c_{m}$.
Die $\lambda_{i}$ hei"sen die {\bf Lagrange'schen 
Multiplikatoren}\index{Lagrange'sche Multiplikatoren}.
Im Fall $X=\Bbb{R}^n$ kann man unsere Bedingung dahingehend interpretieren,
da"s \glqq der Gradient der Funktion $f$ in $p$ auf $M$ senkrecht stehen mu"s\grqq\ 
oder auch, da"s \glqq der Gradient der Funktion $f$ in $p$ 
eine Linearkombination der Gradienten der Nebenbedingungen sein mu"s\grqq.
Die Bedingung \glqq $\diff_p g$ surjektiv\grqq\  hinwiederum 
kann man dahingehend interpretieren, da"s die Gradienten der $g_i$ 
bei $p$ linear unabh"angig sein sollen.
\end{Bemerkungl}
\begin{proof}[Beweis]
Indem wir $U$ verkleinern, d"urfen wir ohne Beschr"ankung der
Allgemeinheit annehmen, da"s $\diff_{q}g$ surjektiv ist f"ur alle
$q\in U$. Nach \ref{MN} ist dann $M\subset X$ eine
Untermannigfaltigkeit.
Ist $\varphi : W \ra M$ eine Karte von $M$ um $p$ mit
$p=\varphi (w)$, so hat $f|_{M\cap U}$ ein lokales Extremum bei
$p$ genau dann, wenn $f \circ \varphi$ ein lokales Extremum bei
$w$ hat.
Nach \ref{MIKR} ist
eine notwendige Bedingung daf"ur  $\diff _{w}(f\circ \varphi)=0$,
als da hei"st $\diff _{p}f\circ \diff _{w}\varphi =0$.
Wir haben aber eh $g \circ \varphi =0$, 
also $\diff _{p}g\circ \diff _{w}\varphi =0$, und
aus Dimensionsgr"unden bilden die $\diff _{p}g_{i}$ f"ur $1\leq i \leq
m$ sogar eine Basis f"ur den Untervektorraum von $\vec{X}^{\ast}$ aller
Linearformen, die auf dem Bild von $ \diff _{w}\varphi$ verschwinden.
Verschwindet auch $\diff _{p}f$ auf diesem Teilraum,
so mu"s es folglich als Linearkombination der $\diff _{p}g_{i}$
geschrieben werden k"onnen.
\end{proof}









\begin{Beispiel}
Wir suchen lokale Extrema 
der Funktion $f:(x,y) \mapsto x+y$ auf
dem Einheitskreis $M = S^{1}$, d.h.\ unter der Nebenbedingung
$x^{2}+y^{2} =1$. Diese Nebenbedingung bedeutet, da"s die
Funktion $g:(x,y) \mapsto x^{2}+y^{2}$ den Wert 1 annehmen mu"s.
Lokale Extrema 
k"onnen nach unserem Satz nur
an Stellen $p\in M$ mit $\diff _p f = \lambda \diff _p g$
angenommen werden, also an Stellen 
$p=(x,y)\in S^{1}$ mit $(1,1)=\lambda(2x,2y)$.
Damit kommen nur die beiden Stellen $(-1/\sqrt{2},-1/\sqrt{2})$ 
und $(1/\sqrt{2},1/\sqrt{2})$ in Frage. Hier ist offensichtlich die
erste ein lokales Minimum und die zweite ein lokales Maximum.
\end{Beispiel}

\begin{Beispiel}
Wir suchen lokale Extrema 
der Funktion $f:(x,y,z) \mapsto ax+by+cz$ auf
dem Einheitskreis $M = S^{1}\times 0$ in der $xy$-Ebene, 
d.h.\ unter den beiden Nebenbedingungen
$g_1(x,y,z)=x^{2}+y^{2}=1$ und $g_2(x,y,z)=z=0$. 
Lokale Extrema 
k"onnen nach unserem Satz nur
an Stellen $p\in M$ angenommen werden, 
f"ur die es $\lambda_1,\lambda_2\in\DR$ gibt mit
$\diff _p f = \lambda_1 \diff _p g_1+\lambda_2 \diff _p g_2$,
also an Stellen $(x,y,z)\in M$ mit 
$$(a,b,c)=\lambda_1(2x,2y,0)+\lambda_2(0,0,1)$$
Daraus folgt jedoch schnell 
$\lambda_2=c$, und unter der zus"atzlichen
Voraussetzung $(a,b)\neq (0,0)$ es
kommen nur die beiden Stellen $\pm(a^2 +b^2)^{-1}(a,b,0)$ 
in Frage. Wieder ist hier offensichtlich die eine
ein lokales Minimum und die andere ein lokales Maximum.
\end{Beispiel}


\begin{Proposition*}[\textbf{Hinreichende Bedingungen f"ur Extrema}] 
    Seien $U\co \DR^n$ offen und $g:U\ra\DR^m$ sowie $f:U\ra \DR$ zweimal
    stetig differenzierbar. Sei $p\in U$ gegeben mit $\diff_pg$ surjektiv und
 sei   $M\pdef \{q\in U\mid g(q)=g(p)\}$.  
Sei unsere notwendige Bedingung $\diff _{p}f 
= \lambda_{1}\diff _{p}g_{1} + \ldots + \lambda_{m}\diff _{p}g_{m}$
f"ur ein Extremum  der Restriktion $f|_M$ bei $p$ erf"ullt und sei
$$Q\pdef \diff^2_pf-\lambda_{1}\diff^2 _{p}g_{1} - \ldots - \lambda_{m}\diff^2 _{p}g_{m}$$ die quadratische Form
     auf $\DR^n$, die durch die angegebene 
Linearkombination von Hesse-Matrizen entsteht. So gilt: 
    \begin{enumerate}
    \item Ist unsere quadratische Form $Q$ positiv definit auf
$\op{ker}\diff_pg$, so hat $f|_M$ bei $p$
      ein isoliertes lokales Minimum;
    \item Ist unsere quadratische Form $Q$ negativ definit auf
$\op{ker}\diff_pg$, so hat $f|_M$ bei $p$
      ein isoliertes lokales Maximum;
    \item Ist unsere quadratische Form $Q$ indefinit auf
$\op{ker}\diff_pg$, so hat $f|_M$ bei $p$ weder
      ein lokales Minimum noch ein lokales Maximum.
    \end{enumerate}
\end{Proposition*}
\begin{proof}[Beweis]
Wir beginnen wie beim Beweis von \ref{ExNe}.
Indem wir $U$ verkleinern, d"urfen wir ohne Beschr"ankung der
Allgemeinheit annehmen, da"s $\diff_{q}g$ surjektiv ist f"ur alle
$q\in U$. Nach \ref{MN} ist dann $M\subset X$ eine
Untermannigfaltigkeit.
Ist $\varphi : W \ra M$ eine Karte von $M$ um $p$ mit
$p=\varphi (w)$, so hat $f|_{M\cap U}$ ein lokales Extremum bei
$p$ genau dann, wenn $f \circ \varphi$ ein lokales Extremum bei
$w$ hat.
Nach \ref{MIKR} ist
eine notwendige Bedingung daf"ur  $\diff _{w}(f\circ \varphi)=0$,
als da hei"st $\diff _{p}f\circ \diff _{w}\varphi =0$,
und wir hatten bereits gesehen, wie sich diese Bedingung "ubersetzt in die
Bedingung der Existenz der Lagrange'schen Multiplikatoren. 
Nun approximiert die polynomiale Abbildung $$p+h\mapsto
f(p) + (\diff_pf)(h)+ \frac{1}{2}(\diff^2_pf)(h)$$
unsere Funktion $f$ bei $p$ bis zu zweiter Ordnung im Sinne von
\ref{ReAp}. Ebenso approximiert die polynomiale Abbildung $$w+k\mapsto
\varphi(w) + (\diff_w\varphi)(k)+ \frac{1}{2}(\diff^2_w\varphi)(k)$$
unsere Funktion $\varphi$ bei $w$ bis zu zweiter Ordnung.
 Nach \ref{RApp} approximieren folglich die Anteile vom
Grad h"ochstens Zwei von deren Komposition alias 
die polynomiale Abbildung $$w+k\mapsto
f(\varphi(w)) + \frac{1}{2}(\diff^2_pf)((\diff_w\varphi)(k))+ 
\frac{1}{2}(\diff_pf)((\diff^2_w\varphi)(k))$$
unsere Funktion $f\circ\varphi$ bei $w$ bis zu zweiter Ordnung.
Andererseits liefern die Bedingungen $g_i\circ\varphi=g_i(p)$ 
bei "Ubergang 
zu den Approximationen bis zum Grad Zwei bei $w$ die Identit"aten
$(\diff_p^2g_i)((\diff_w\varphi)(k))+(\diff_pg_i)((\diff^2_w\varphi)(k))=0$
und damit 
$$(\diff_pf)((\diff^2_w\varphi)(k))
=-\sum_i\lambda_i (\diff_p^2g_i)((\diff_w\varphi)(k))$$
Auf diese Weise k"onnen wir die Approximation zur  Ordnung Zwei 
von $f\circ\varphi$ bei $w$
 umschreiben zu 
 $$w+k\mapsto
f(\varphi(w)) + \frac{1}{2}(\diff^2_pf)((\diff_w\varphi)(k))-
\frac{1}{2}\sum_i\lambda_i (\diff_p^2g_i)((\diff_w\varphi)(k))$$
alias $w+k\mapsto
f(\varphi(w)) + \frac{1}{2}Q((\diff_w\varphi)(k))$.
Wegen unserer Erkenntnis $\op{im}(\diff_w\varphi)=
\op{ker}(\diff_pg)$ aus dem Beweis von \ref{ExNe}
folgen unsere Behauptungen damit aus
den Resultaten zu Extremwerten ohne Nebenbedingungen
\ref{MMMV}.
\end{proof}









