Metodo delle caratteristiche

In matematica, il metodo delle caratteristiche è un importante strumento utile per risolvere le equazioni differenziali alle derivate parziali (PDE) di primo grado, ed in generale si applica a tutte le equazioni iperboliche.

Ad esempio, se si ha un'equazione del tipo:

a t z ( x , t ) + b z ( x , t ) x z ( x , t ) = 0 {\displaystyle a{\frac {\partial }{\partial t}}z(x,t)+bz(x,t){\frac {\partial }{\partial x}}z(x,t)=0}

ponendo z ( s ) = z ( x ( s ) , t ( s ) ) {\displaystyle z(s)=z(x(s),t(s))} si ha:[1]

d z d s = d x d s z x + d t d s z t {\displaystyle {\frac {dz}{ds}}={\frac {dx}{ds}}{\frac {\partial z}{\partial x}}+{\frac {dt}{ds}}{\frac {\partial z}{\partial t}}}

da cui:

d t d s = a d x d s = b z d z d s = 0 {\displaystyle {\frac {dt}{ds}}=a\qquad {\frac {dx}{ds}}=bz\qquad {\frac {dz}{ds}}=0}

Si tratta di un sistema di equazioni differenziali ordinarie, e le prime due relazioni sono dette curve caratteristiche dell'equazione. Integrando si ottiene:

t ( s ) = a s x ( s ) = b s z 0 ( x ) z ( s ) = z 0 ( x ) {\displaystyle t(s)=as\qquad x(s)=bsz_{0}(x)\qquad z(s)=z_{0}(x)}

con z 0 ( x ) = z ( x , 0 ) {\displaystyle z_{0}(x)=z(x,0)} costante di integrazione.

Tale metodo si applica, ad esempio, all'equazione delle onde e all'equazione del trasporto.

PDE di primo grado

Il metodo delle caratteristiche permette di trovare le curve dette caratteristiche, lungo le quali un'equazione differenziale alle derivate parziali di primo grado si comporta come un'equazione differenziale ordinaria. La ricerca delle caratteristiche si traduce quindi nell'utilizzo di un nuovo sistema di coordinate ( x 0 , s ) {\displaystyle (x_{0},s)} in cui la PDE sia un'equazione ordinaria lungo certi cammini. Una volta calcolata l'equazione ordinaria, essa viene risolta lungo le curve caratteristiche e trasformata in soluzione per la PDE di primo grado.

Si consideri la PDE quasi-lineare (i coefficienti della derivata di grado maggiore non dipendono dalle derivate dell'incognita) di due variabili indipendenti x {\displaystyle x} e y {\displaystyle y} :

a ( x , y ) z x + b ( x , y ) z y = c ( x , y , z ) {\displaystyle a(x,y){\frac {\partial z}{\partial x}}+b(x,y){\frac {\partial z}{\partial y}}=c(x,y,z)}

e si supponga che una soluzione z {\displaystyle z} sia nota. Considerando la superficie di grafico z = z ( x , y ) {\displaystyle z=z(x,y)} in R 3 {\displaystyle \mathbb {R} ^{3}} , un vettore normale a tale superficie ha la forma:

( z x ( x , y ) , z y ( x , y ) , 1 ) {\displaystyle \left({\frac {\partial z}{\partial x}}(x,y),{\frac {\partial z}{\partial y}}(x,y),-1\right)}

Come conseguenza di ciò, l'equazione precedente è equivalente a dire che il campo vettoriale ( a ( x , y , z ) , b ( x , y , z ) , c ( x , y , z ) ) {\displaystyle (a(x,y,z),b(x,y,z),c(x,y,z))} è tangente alla superficie z = z ( x , y ) {\displaystyle z=z(x,y)} in ogni punto. In altri termini, il grafico della soluzione è un'unione di curve-soluzione, le curve caratteristiche della PDE. Esse sono date da:

d x / d s = a ( x , y ) d y / d s = b ( x , y ) {\displaystyle dx/ds=a(x,y)\qquad dy/ds=b(x,y)}

Infatti, si ha:

d z d s = d x d s z x + d y d s z y = a ( x , y ) z x + b ( x , y ) z y {\displaystyle {\frac {dz}{ds}}={\frac {dx}{ds}}{\frac {\partial z}{\partial x}}+{\frac {dy}{ds}}{\frac {\partial z}{\partial y}}=a(x,y){\frac {\partial z}{\partial x}}+b(x,y){\frac {\partial z}{\partial y}}}

e lungo le caratteristiche la PDE diventa così ordinaria:

d z d s + c ( x , y ) z = 0 {\displaystyle {\frac {dz}{ds}}+c(x,y)z=0}

Le equazioni delle curve caratteristiche possono essere formulate attraverso le equazioni di Lagrange-Charpit:

d x a ( x , y , z ) = d y b ( x , y , z ) = d z c ( x , y , z ) {\displaystyle {\frac {dx}{a(x,y,z)}}={\frac {dy}{b(x,y,z)}}={\frac {dz}{c(x,y,z)}}}

Se si utilizza una particolare parametrizzazione t {\displaystyle t} della curva, le equazioni possono essere scritte come sistema di equazioni differenziali ordinarie per x ( t ) {\displaystyle x(t)} , y ( t ) {\displaystyle y(t)} e z ( t ) {\displaystyle z(t)} :

d x d t = a ( x , y , z ) d y d t = b ( x , y , z ) d z d t = c ( x , y , z ) {\displaystyle {\frac {dx}{dt}}=a(x,y,z)\qquad {\frac {dy}{dt}}=b(x,y,z)\qquad {\frac {dz}{dt}}=c(x,y,z)}

dette equazioni caratteristiche per il sistema originale.

Caso lineare

Data una PDE nella forma:

i = 1 n a i ( x 1 , , x n , u ) u x i = c ( x 1 , , x n , u ) {\displaystyle \sum _{i=1}^{n}a_{i}(x_{1},\dots ,x_{n},u){\frac {\partial u}{\partial x_{i}}}=c(x_{1},\dots ,x_{n},u)}

essa è lineare se i coefficienti a i {\displaystyle a_{i}} dipendono solo dalle variabili spaziali, e non da u {\displaystyle u} . Per un'equazione lineare o quasi-lineare le curve sono parametrizzate da:

( x 1 , , x n , u ) = ( x 1 ( s ) , , x n ( s ) , u ( s ) ) {\displaystyle (x_{1},\dots ,x_{n},u)=(x_{1}(s),\dots ,x_{n}(s),u(s))}

in modo da soddisfare il sistema composto dalle caratteristiche:

d x i d s = a i ( x 1 , , x n , u ) d u d s = c ( x 1 , , x n , u ) {\displaystyle {\frac {dx_{i}}{ds}}=a_{i}(x_{1},\dots ,x_{n},u)\qquad {\frac {du}{ds}}=c(x_{1},\dots ,x_{n},u)}

Caso non lineare

Si consideri la PDE:

F ( x 1 , , x n , u , p 1 , , p n ) = 0 {\displaystyle F(x_{1},\dots ,x_{n},u,p_{1},\dots ,p_{n})=0}

dove le variabili p i {\displaystyle p_{i}} sono le derivate parziali:

p i = u x i {\displaystyle p_{i}={\frac {\partial u}{\partial x_{i}}}}

Sia ( x i ( s ) , u ( s ) , p i ( s ) ) {\displaystyle (x_{i}(s),u(s),p_{i}(s))} una curva in R 2 n + 1 {\displaystyle \mathbb {R} ^{2n+1}} e u {\displaystyle u} una soluzione:

u ( s ) = u ( x 1 ( s ) , , x n ( s ) ) {\displaystyle u(s)=u(x_{1}(s),\dots ,x_{n}(s))}

Differenziando la PDE rispetto a s {\displaystyle s} , lungo una soluzione si ha:

( F x i + F u p i ) x ˙ i + F p i p ˙ i = 0 u ˙ p i x ˙ i = 0 ( x ˙ i d p i p ˙ i d x i ) = 0 {\displaystyle \sum (F_{x_{i}}+F_{u}p_{i}){\dot {x}}_{i}+\sum F_{p_{i}}{\dot {p}}_{i}=0\qquad {\dot {u}}-\sum p_{i}{\dot {x}}_{i}=0\qquad \sum ({\dot {x}}_{i}dp_{i}-{\dot {p}}_{i}dx_{i})=0}

dove la seconda segue dall'applicazione della regola della catena a una soluzione u {\displaystyle u} , mentre la terza si ottiene dalla derivata esterna della relazione d u p i d x i = 0 {\displaystyle du-\sum p_{i}dx_{i}=0} . A partire da queste relazioni si dimostra che:

x ˙ i = λ F p i p ˙ i = λ ( F x i + F u p i ) u ˙ = λ p i F p i {\displaystyle {\dot {x}}_{i}=\lambda F_{p_{i}}\qquad {\dot {p}}_{i}=-\lambda (F_{x_{i}}+F_{u}p_{i})\qquad {\dot {u}}=\lambda \sum p_{i}F_{p_{i}}}

dove λ {\displaystyle \lambda } è una costante. Scrivendo le equazioni in modo simmetrico si ottengono le equazioni di Lagrange-Charpit per le caratteristiche:

x ˙ i F p i = p ˙ i F x i + F u p i = u ˙ p i F p i {\displaystyle {\frac {{\dot {x}}_{i}}{F_{p_{i}}}}=-{\frac {{\dot {p}}_{i}}{F_{x_{i}}+F_{u}p_{i}}}={\frac {\dot {u}}{\sum p_{i}F_{p_{i}}}}}

Da un punto di vista geometrico, il metodo delle caratteristiche nel caso non lineare può essere interpretato come la richiesta che il cono di Monge dell'equazione differenziale sia tangente ovunque al grafico della soluzione.

Operatori differenziali lineari

Sia X {\displaystyle X} una varietà differenziabile e sia P : C ( X ) C ( X ) {\displaystyle P:C^{\infty }(X)\to C^{\infty }(X)} un operatore differenziale lineare di ordine k {\displaystyle k} . In un sistema di coordinate locali x i {\displaystyle x_{i}} si ha:

P = | α | k P α ( x ) x α {\displaystyle P=\sum _{|\alpha |\leq k}P^{\alpha }(x){\frac {\partial }{\partial x^{\alpha }}}}

in cui α {\displaystyle \alpha } indica la notazione multi-indice. Il simbolo principale σ ( P ) {\displaystyle \sigma (P)} di P {\displaystyle P} è la funzione definita sul fibrato cotangente T X {\displaystyle T^{*}X} data da:

σ P ( x , ξ ) = | α | = k P α ( x ) ξ α {\displaystyle \sigma _{P}(x,\xi )=\sum _{|\alpha |=k}P^{\alpha }(x)\xi _{\alpha }}

dove ξ i {\displaystyle \xi _{i}} sono le coordinate sul fibrato indotte dalle coordinate differenziali x i {\displaystyle x_{i}} . Le trasformazioni che legano queste due coordinate rendono σ ( P ) {\displaystyle \sigma (P)} una funzione ben definita sul fibrato, i cui zeri sono le caratteristiche di P {\displaystyle P} . Una ipersuperficie definita dall'equazione F ( x ) = c {\displaystyle F(x)=c} è una ipersuperficie caratteristica in x {\displaystyle x} se:

σ P ( x , d F ( x ) ) = 0 {\displaystyle \sigma _{P}(x,dF(x))=0}

Equazione del trasporto

Lo stesso argomento in dettaglio: Equazione del trasporto.

Nel caso monodimensionale omogeneo si possono introdurre le caratteristiche come le curve lungo le quali una soluzione è costante. Nel caso multidimensionale si utilizzano invece gli invarianti di Riemann, quantità che si conservano e permettono di ricostruire la soluzione (non più in generale costante lungo le caratteristiche). Ad esempio, si vuole cercare una funzione u ( x , t ) {\displaystyle u(x,t)} soluzione dell'equazione del trasporto:

( t + v x ) u ( x , t ) = 0 {\displaystyle (\partial _{t}+v\partial _{x})u(x,t)=0}

con opportune condizioni al bordo:

u ( x , 0 ) = g ( x ) {\displaystyle u(x,0)=g(x)}

e supponendo per semplicità v {\displaystyle v} costante. L'equazione esprime il bilancio della quantità rappresentata da u {\displaystyle u} . Infatti, integrando nella variabile x {\displaystyle x} e supponendo u {\displaystyle u} almeno di classe C 1 {\displaystyle C^{1}} rispetto al tempo, in modo da poter scambiare derivata e integrale, si ottiene che la variazione nel tempo dell'integrale di u {\displaystyle u} è eguagliata dal flusso netto di u {\displaystyle u} agli estremi del dominio:

d d t x 1 x 2 u = v ( u ( x 1 ) u ( x 2 ) ) {\displaystyle {\frac {d}{dt}}\int _{x_{1}}^{x_{2}}u=v\left(u(x_{1})-u(x_{2})\right)}

Il metodo delle caratteristiche consiste nel cercare una soluzione del tipo u ( ϕ ( t ) , t ) {\displaystyle u(\phi (t),t)} , dove una variabile (in tal caso la x {\displaystyle x} ) è sostituita da una funzione, finora arbitraria, di una delle altre variabili. Si nota che:

t u ( ϕ ( t ) , t ) = ( d d t d ϕ d t ϕ ) u ( ϕ ( t ) , t ) {\displaystyle \partial _{t}u(\phi (t),t)=\left({\frac {d}{dt}}-{\frac {d\phi }{dt}}\partial _{\phi }\right)u(\phi (t),t)}

e sostituendo nell'equazione originaria si ha:

( t + v ϕ ) u ( ϕ ( t ) , t ) = ( d d t + [ v d ϕ d t ] ϕ ) u ( ϕ ( t ) , t ) {\displaystyle (\partial _{t}+v\partial _{\phi })u(\phi (t),t)=\left({\frac {d}{dt}}+\left[v-{\frac {d\phi }{dt}}\right]\partial _{\phi }\right)u(\phi (t),t)}

Imponendo che il termine tra parentesi quadre si annulli si ottiene il seguente sistema di equazioni:

{ d d t u ( ϕ ( t ) , t ) = 0 d ϕ ( t ) d t = v {\displaystyle \qquad {\begin{cases}{\frac {d}{dt}}u(\phi (t),t)=0\,\!\\{\frac {d\,\phi (t)}{dt}}=v\,\!\end{cases}}}

Si è quindi trasformato un problema alle derivate parziali in un sistema di equazioni differenziali ordinarie. Le soluzioni ϕ ( t ) {\displaystyle \phi (t)} sono le caratteristiche: in virtù della prima equazione le curve x = ϕ ( t ) {\displaystyle x=\phi (t)} sono quelle curve lungo le quali la funzione u {\displaystyle u} è costante. In questo caso le caratteristiche sono molto semplici da trovare, dal momento che una generica soluzione della seconda equazione è un fascio di rette:

ϕ ( t ) = x 0 + v ( t t 0 ) {\displaystyle \phi (t)=x_{0}+v(t-t_{0})}

Poiché su queste rette la soluzione non varia, volendo sapere il valore di u ( x , t ) {\displaystyle u(x,t)} è sufficiente risalire la caratteristica passante per tale punto fino ad incontrare un tratto di bordo su cui sia assegnata o una condizione al contorno o un dato iniziale. Se si suppone il problema definito su tutto R {\displaystyle \mathbb {R} } , occorre risalire la caratteristica fino al tempo in cui è assegnato il dato iniziale g ( x ) {\displaystyle g(x)} . Quindi, se t 0 = 0 {\displaystyle t_{0}=0} si ha:

u ( x , t ) = u ( x v t , 0 ) = g ( x v t ) {\displaystyle u(x,t)=u(x-vt,0)=g(x-vt)}

La soluzione è dunque un'onda viaggiante di velocità v {\displaystyle v} nel verso positivo (negativo) dell'asse delle x {\displaystyle x} . Il dato iniziale è così trasportato "rigidamente" e ogni quantità si conserva. In particolare, se il dato iniziale è di classe C k {\displaystyle C^{k}} , ad ogni tempo t 1 > 0 {\displaystyle t_{1}>0} , u ( x , t 1 ) {\displaystyle u(x,t_{1})} sarà di classe C k {\displaystyle C^{k}} .

L'equazione di Burgers

Lo stesso argomento in dettaglio: Equazione di Burgers.

Nel caso non lineare può succedere che da un dato iniziale di classe C {\displaystyle C^{\infty }} si generi una soluzione discontinua, e quando ciò si verifica sono necessari parecchi sforzi per ridare significato a concetti quali la derivata in presenza di soluzioni discontinue. Per esempio, si consideri l'equazione di Burgers non viscosa:

u t + u u x = 0 {\displaystyle u_{t}+uu_{x}=0}

Si tratta di un'equazione di trasporto in cui la velocità di trasporto è data dalla soluzione stessa. Tale equazione nella forma più generale è:

u t + q ( u ) u x = 0 {\displaystyle u_{t}+q'(u)u_{x}=0}

in cui il caso di Burgers è q ( u ) = u {\displaystyle q'(u)=u} , cioè q ( u ) = u 2 / 2 {\displaystyle q(u)=u^{2}/2} . q ( u ) {\displaystyle q(u)} si dice associato ad u {\displaystyle u} . Per applicare il metodo delle caratteristiche si cerca x = x ( t ) {\displaystyle x=x(t)} su cui u {\displaystyle u} si conservi. L'equazione delle caratteristiche si ricava facilmente ed è:

d x d t = q ( u ) {\displaystyle {\frac {dx}{dt}}=q'(u)}

Si nota che non sono necessariamente rette dato che la pendenza, coincidendo con u {\displaystyle u} , può variare da punto a punto. Tuttavia, poiché per ricavarle si è imposto d u / d t = 0 {\displaystyle du/dt=0} , si ha che u {\displaystyle u} è ancora costante lungo le caratteristiche, che dunque sono ancora rette (non sarebbe così nel caso non omogeneo). Inoltre, u = g ( x u t ) {\displaystyle u=g(x-ut)} non definisce u {\displaystyle u} in modo implicito. Infatti, chiamando:

G ( u , x , t ) = u g ( x q ( u ) t ) {\displaystyle G(u,x,t)=u-g(x-q'(u)t)}

il teorema delle funzioni implicite assicura che G {\displaystyle G} definisce univocamente u {\displaystyle u} solo se G u 0 {\displaystyle G_{u}\neq 0} . Dato che:

G u = 1 + t q ( u ) g ( x q ( u ) t ) {\displaystyle G_{u}=1+tq''(u)g'(x-q'(u)t)}

se il dato iniziale e il flusso assumono configurazioni particolari tale derivata può annullarsi e la soluzione implicita perde di significato, poiché le funzioni devono essere relazioni univoche. In particolare, per l'equazione di Burgers, q ( u ) = 1 {\displaystyle q''(u)=1} , dunque i dati iniziali decrescenti "creano problemi". Può risultare utile considerare il seguente flusso:

q ( u ) = v m u ( 1 u u m ) {\displaystyle q(u)=v_{m}u\left(1-{\frac {u}{u_{m}}}\right)}

che rappresenta, ad esempio, il flusso di macchine su una strada, allorché la densità di macchine sia pari a u {\displaystyle u} . Inoltre, v m {\displaystyle v_{m}} è la velocità massima a cui le macchine possono viaggiare, mentre u m {\displaystyle u_{m}} è la massima densità delle macchine (corrispondente a traffico fermo). In questo caso q ( u ) < 0 {\displaystyle q''(u)<0} , quindi se la configurazione iniziale è decrescente le macchine hanno davanti a sé una strada meno trafficata rispetto a dove sono, e il traffico tende a snellirsi. Nel caso di dati iniziali crescenti, al contrario, le macchine hanno davanti a sé un traffico maggiore e c'è tendenza a formare congestioni, in quanto le macchine davanti fluiscono più a piano di quelle dietro, dato che q ( u ) {\displaystyle q'(u)} è decrescente.

Note

  1. ^ Eric Weisstein, MathWorld - Characteristic, su mathworld.wolfram.com, 2012.

Bibliografia

  • (EN) Lawrence C. Evans, Partial Differential Equations, American Mathematical Society, 1998, ISBN 0-8218-0772-2.
  • (EN) R. LeVeque, Numerical Methods for Conservation Laws. Birkhauser, 1992.
  • (EN) J. Cooper, Introduction to Partial Differential Equations with MATLAB. Birkhauser, 1998.
  • (EN) J. Thomas, Numerical Partial Differential Equations: Conservation Laws and Elliptic Equations. Springer, 1999.
  • (EN) G.B. Whitham, Linear and Nonlinear Waves. Wiley, 1974.
  • (EN) Stanley J. Farlow, Partial Differential Equations for Scientists and Engineers. Dover Publications, 1982.
  • (EN) Gilbert Strang, Introduction to Applied Mathematics. Wellesley-Cambridge Press, 1986.
  • (EN) Fritz John, Partial Differential Equations, 4th edition. Springer, 1982.

Voci correlate

Collegamenti esterni

  • Prof. Scott Sarra tutorial on Method of Characteristics, su scottsarra.org.
  • Prof. Alan Hood tutorial on Method of Characteristics, su www-solar.mcs.st-and.ac.uk.
  • (EN) Thermopedia, "Method of Characteristics"
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica