Nelineárna klasifikácia a predpoveď magnetosférickej odozvy
 

Z. Vörös, D. Jankovičová, P. Dolinský, F. Valach
Geofyzikálny ústav SAV, Hurbanovo, geomag @geomag.sk
 
 
 

Abstrakt
Cieľom tejto práce je poukázať na opodstatnenosť použitia niektorých nelineárnychmetód pre klasifikáciu a predpoveď magnetosférickej odozvy. Geomagnetické fluktuácie na časovej škále subbúrok a búrok sme modelovali pomocou multiplikatívneho P-modelu. Odlišnú dynamiku vykazujú fluktuácie na menších časových škálach. Predpoveď priebehu Dst indexu pomocou neurálnych sietí ukazuje, že viac než 70% variácií Dst indexu sú reprodukovateľné zo zmien dvoch hlavných komponentov vysvetľujúcich podstatnú časť fluktuácií parametrov v slnečnom vetre.
 

1. ÚVOD

     Časové rady získavané na geomagnetických observatóriach, ako aj na umelých družiciach, reprezentujú komplexný priebeh rôznych lineárnych ale aj nelineárne viazaných fyzikálnych procesov. Tieto procesy väčšinou prebiehajú aj na rôznych časových a priestorových škálach a dynamika veľkoškálových procesov často určuje priebeh mikroprocesov a naopak. V dôsledku tejto rozmanitosti prispievajúcich fyzikálnych zdrojov, typické variácie merateľných fyzikálnych veličín vykazujú okrem kvázi-periodických zmien aj fluktuácie neperiodické so spojitým spektrom, ktoré sú najčastejšie považované za biely alebo farebný šum (Takalo et al., 1993). V skutočnosti, fluktuácie merateľných veličín môžu byť užitočným zdrojom informácie pri klasifikácii alebo predpovede jednotlivých fyzikálnych procesov a ich príčin, hlavne ak okrem tradičného popisu druhého rádu (spektrálna analýza, korelácie) uvažujeme aj iné, nelineárne charakteristiky časových radov alebo analyzujeme nelineárne väzby medzi nimi.
     V tejto práci v krátkosti načrtneme podstatu multifraktálového prístupu pri analýze fluktuácií GMP a pomocou neurálnych sietí zavedieme metódu nelineárnej predikcie indexu Dst.

2. MULTIFRAKTÁLOVÝ PRÍSTUP

     Na rozdiel od spektrálnej analýzy, multifraktálový prístup umožňuje charakterizovať časové rady z hľadiska ich singularít a. Singularitu v bode Xo definujeme ako (Muzy et al., 1993):

a(Xo) = lim log m (BXo(h )) / log h                                                                    (1)
                                                                                                       0

kde BXo(h ) symbolizuje kruh s centrom v bode Xo, polomeru hm je miera definovaná vždy na základe konkrétnej fyzikálnej situácie. Ak napr. m je pravdepodobnostná miera, tak mvyjadruje pravdepodobnosť istej hodnoty v uvažovanom priestore alebo čase a rovnica (1) vyjadruje mocninový zákon, ktorým sa m riadi pri zmene rozlíšenia h . Exponent a charakterizuje singularitu fluktuácií m v bode Xo (jednoduchšie, ale menej presne povedané "kostrbatosť" časového radu v čase t).
     Lepšie pochopíme tento formalizmus na konkrétnom prípade geomagnetických fluktuácií.
     Analyzujeme 1-minútové priemery variácie H-zložky z geomagnetického observatória THULE z obdobia 1994-1997 (2 102 400 minutových hodnôt). V prvom kroku, transformáciami (2-5) definujeme pravdepodobnostnú mieru s (j) z časového radu zložky H GMP:

D H(ti) = H(ti + t ) - H(ti)                                                                                  (2)

E(ti) = D H3 (ti)                                                                                                  (3)

                                                                                                               N
 E(i) = E(ti) / S E(ti)                                                                                            (4)
                                                                                                              i=1
                                                                                               j=i+T
s (j) = S E(i) D t                                                                                                 (5)
                                                                                                     i

kde t je časový posun a rovnica (2) reprezentuje hornopriepustný filter; rovnica (3) je prebratá z teórie turbulencie (niekedy sa používa druhá mocnina, ktorá je úmerná energii signálu); rovnica (4) je normalizácia; a (5) môžeme považovať za pravdepodobnostnú mieru. Kostrbatosť alebo mieru diferencovateľnosti fluktuácií s (j) chceme charakterizovať v každom bode exponentom a (j) (1). V prípade tzv. multifraktálovej miery sa a mení z bodu na bod a tzv. Hausdorffova (fraktálna) dimenzia f(a ) poskytuje geometrický popis podmnožín s(j) s rovnakou hodnotou a(j). Zo štatistického hľadiska f(a ) môžeme považovať za rozdeľovaciu funkciu singularít a. f(a) vlastne udáva počet podmnožín N(a) s rovnakým apri rozlíšení (škále) h (Tél, 1988):

N(a,h) µh-f(a )                                                                                                                                 (6)
     Na odhad spektra singularít (a,f(a )) sme použili metódu tzv. veľkých odchýlok (Véhel and Vojak, 1998, Vörös, 1998).
     Na Obr. 1 a, b vidíme tento odhad v závislosti od parametrov t pri T=konšt.= 60 [min] (Obr. 1a) a T pri t =konšt.=60 [min] (Obr. 1b). V rovine (a,f(a ),t=3000, resp. T=3000[min]) sme znázornili priebehy všetkých kriviek.
 
 

Obr. 1. Spektrá singularít odhadnuté z variácií zložky H GMP. a.) T=konšt.; b.) t =konšt.

     Na Obr. 1a sme písmenom A  označili spektrá singularít, ktoré zodpovedajú fluktuáciam magnetosférického pôvodu, a písmenom B spektrá, ktoré charakterizujú fluktuácie so zdrojom v slnečnom vetre (Vörös, In Press). Prechod (spektrálny zlom) z podmnožiny A do B pri t=100 – 300 [min] bol známy aj zo spektrálnej analýzy indexov AE (Tsurutani et al., 1990).
     Na Obr. 1b máme tiež dve skupiny kriviek. Prvá skupina, pre T< 15 [min] a f(a )» 1 pre všetky hodnoty a, zodpovedá priamej disipácii energie v magnetosfére. Druhá skupina kriviek kvázi-parabolického tvaru, pre T>15 [min], popisuje fluktuácie GMP súvisiacich s predbežnou akumuláciou energie v magnetosférickom chvoste a následnou búrlivou disipáciou energie v rôznych oblastiach magnetosféricko- ionosférického systému (loading-unloading). Aj tento prechod medzi rôznymi režimami disipácie energie bol známy z lineárnej analýzy, konkrétne z aplikácie lineárnych filtrov pri výskume magnetosférickej odozvy (Bargatze et al., 1985). Vysvetlíme to tak, že rovnica (5) vypočítaná pre rôzne hodnoty T napodobňuje lineárne filtre dané vzťahom: O(t)=SjH(j)I(t-jdt); kde I(t), O(t) sú hodnoty na vstupe (parameter zo slnečného vetra) a výstupe (magnetosférický parameter) a H(j) je samotný filter.
     Vyvstáva otázka, aké dodatočné, pre lineárnu analýzu neprístupné, informácie sa dajú ešte z Obr. 1a, b vyčítať. Hlavne z Obr. 1b je vidieť, že na časovej škále subbúrok a búrok (T>15 [min]) majú krivky parabolický tvar. Je možné modelovať multifraktálové spektrá takéhoto tvaru pomocou tzv. nelineárneho P-modelu, daného vzťahom (Halsey et al., 1986):
 

a = -(log2p+(w-1) log2(1-p)) / w                                                                      (7)

f(a) = - ((w-1) log2(w-1) - w log2w) / w                                                            (8)


kde w je voľný parameter. Tento 1D model v teórii turbulencie popisuje procesy, v ktorých tok energie yL , definovaný na úsečku dĺžky L, kaskádovite prúdi do rozmerov 2xL/2, 4xL/4, ..., atď. V prvom kroku yL je rozdelený na čiastky yL . p1 a yL . p2 medzi dve úsečky dĺžky L/2 s pravdepodobnosťou p1 a p2, pričom p1+p2=1. V ďalších krokoch sa rozdvojenie úsečiek opakuje. Celkový tok energie na každej ”škále” NxL/2N sa nemení, ale na každej individuálnej úsečke, dĺžky L/2N, je tok energie úmerný istej multiplikatívnej kombinácii parametrov p1 a p2. Parameter p ? p1=1-p2 určuje charakter prenosu energie medzi škálami. Ak p=p1=p2=0.5 prenos energie je homogénny, kým p>0.5 generuje výsledné pole, ktoré je intermitentné so spektrom singularít (a,f(a ); vzorce 7,8).
     Na Obr. 1b je P-model parabolického tvaru. Fitovaný parameter p má hodnotu 0.790 ±0.005 a je zvýraznený hrubšou čiarou v rovine (a,f(a ), T=0 resp. T=3000 [min]). Z obrázku je zrejmé , že napriek jeho jednoduchosti, P-model je vhodným nástrojom pre modelovanie energetických procesov na časovej škále subbúrok a búrok (T>15 [min]). Na druhej strane procesy súvisiace s priamou disipáciou energie (T<15 [min]) sa nedajú opísať multiplikatívnym modelom prenosu energie.
     Ďalšiu klasifikáciu umožňujú malé odchýlky (a,f(a )) kriviek od parabolického tvaru ako je to znázornené na Obr. 1a. Odchýlky sa dajú vysvetliť uvažovaním viacerých od seba nezávislých multiplikatívnych procesov (Radons and Stoop, 1996), t.j. fyzikálne procesy, sú v princípe rozlíšitelné na základe ich spektier singularít.
     Najdôležitejší záver aplikovania multifraktálového prístupu je však ten, že na rozdiel od iných stochastických procesov, ktoré sa dajú charakterizovať jedným singulárnym exponentom a, na adekvátny popis fluktuácií GMP je nutné zaviesť celé spektrum singularít.

3. NEURÁLNE SIETE AKO NELINEÁRNY MODEL

     Predpovede magnetických búrok, na základe parametrov slnečného vetra získaných satelitnými pozorovaniami, sú jedným z dôležitých cieľov v rámci výskumu kozmického počasia.V našej práci sme použili časové rady vlastností slnečného vetra, získané satelitom ACE. Niektoré z týchto parametrov, hlavne n,v, Bz kontrolujú veľkú časť geomagnetickej aktivity (n – koncentrácia častíc slnečného vetra, v – rýchlosť slnečného vetra, Bz – severo-južná zložka medziplanetárneho magnetického poľa ).
     Počet riadiacich parametrov môže byť aj väčší a vzhľadom na to, že nepoznáme ich počet a vlastnosti, v prvom kroku, pomocou analýzy hlavných komponentov, sa pokúsime určiť takú lineárnu kombináciu týchto parametrov, ktorá vysvetľuje najväčšiu časť variácií slnečného vetra.
     Hlavnou myšlienkou analýzy hlavných komponentov je popis rozptylu p-bodov v N-dimenzionálnom priestore zavedením nového súboru ortogonálnych lineárnych súradníc tzv.hlavných komponentov. Prvý hlavný komponent je taký, kde projekcia daných bodov naň má maximum variácie spomedzi všetkých možných lineárnych súradníc, druhý komponent má maximum variácie v smere kolmom na prvý atď. Geometrická interpretácia analýzy hlavných komponentov je nasledovná. Hlavné komponenty predstavujú osi koncentrických elipsoidov umiestnených v tažisku vzorky bodov. Tieto elipsoidy môžeme popísať kvadratickou formou

                                                                            _                     _

( X - X )' S -1 ( X - X ) = c                                                                             (9)


kde c>0, S-kovariančná matica, X-matica dát p x N (p-počet vzoriek, N-počet meraných parametrov) (Rayment et al., 1996).
     Výsledky tejto analýzy sme použili pri modelovaní magnetických búrok, charakterizovaných Dst indexom, pomocou nelineárnej metódy neurálnych sietí.
     Model neurálnych sietí (NN) je založený na schopnosti učiť sa vzťahy medzi vstupmi a výstupmi. Použili sme multivrstvový model neurálnych sietí, ktorý predstavuje zobrazenie
 

g:  RN ® Rm.                                                                                                 (10)


     Skladajú sa zo vstupnej vrstvy s N vstupmi, jednej skrytej vrstvy s q jednotkami a jednej výstupnej vrstvy s m výstupmi. Výstup tohto modelu možno vyjadriť ako

                                                                                                         q                   N

ym=Fm(S Wmj(a)fj(S Wjl(b)x l+W j0(b))+Wm0(a))                                                                 (11)
                                                                                                        j=1              l=1
 

[Norgaard, 1997], kde Wmj(a) sú váhy medzi j a m jednotkami vstupu a skrytej vrstvy a Wjl(b) váhy medzi skrytou vrstvou a výstupom. Aktivačná funkcia Fm(x) je lineárna a fj(x) nelineárna ( tu f(x)=tanh(x) ). Pre daný časový súbor s veľkosťou M definujeme normalizovanú strednú kvadratickú chybu

                                                                                                           M

NMSE = (S (ysout-yspred)2) / M2                                                                                           (12)
                                                                                                          s=1

kde yout predstavuje skutočný – daný výstup a ypred výstup daný neurálnymi sieťami. Cieľom je minimalizácia NMSE výberom vhodných váh na základe metódy poklesu gradientu

W mj(a,b)new= W mj(a,b)old + D W mj                                                                                      (13)
kde
D W mj = - h d (NMSE)/dW mj + bDW mj                                                                          (14)
kde h je rýchlosť učenia (h « 1), b je inerciálny člen z <0,1>. Kvalitu modelu môžeme charakterizovať korelačným koeficientom r

                                                                                                            M

r = (1/M)(S (yjout- youtmean) (yjpred - ypredmean))/syoutsypred                        (15)
                                                                                                           j=1

a priemernou relatívnou variáciou ARV (Casdagli, 1998; Weigend et al., 1992)

                                                                                                   M                                   M

ARV= S (yjout- yjpred)2 / S(yjout- youtmean)2                                                                   (16)
                                                                                                  j=1                                  j=1
 

kde yout je nameraný výstup, youtmean je stredná hodnota nameraného výstupu, ypred je predpovedaný výstup, ypredmean je stredná hodnota predpovedaného výstupu.
     Na analýzu sme použili časové rady parametrov slnečného vetra získaných z ACE satelitu a Dst indexu s rozlíšením Dt = 1 hod za obdobie 1998-1999. Vstupné časové rady sme normalizovali pomocou

xnorm = (x-mean(x))/std(x)                                                                                 (17)
kde mean(x) je stredná hodnota a std(x) smerodajná odchýlka. V analýze hlavných komponentov sme použili
 
 
X = [Bx, By, Bz, |B|, n, v, nv, n|B|, v|B|, vn|B|, dBx/dt, dBy/dt, dBz/dt, dB/dt, dv/dt, dn/dt, e]           (18)
kde Bx, By, Bz, |B| -zložky resp. absolútna hodnota medziplanetárneho magnetického poľa, e- Akasofu parameter.V našom prípade prvé dva hlavné komponenty vysvetľujú hlavnú časť variácií
 
 
pca1 = 0.31 B + 0.35 nv + 0.41 nB + 0.35 vB +0.43 vnB + 0.28 dBy/dt – 0.28 dB/dt                    (19)

pca2 = - 0.24 Bz + 0.41 B + 0.46 v + 0.31 vB + 0.41 e                                                                  (20)

     Týmto spôsobom sa počet vstupných parametrov redukoval z 10 na 2, čo predstavuje urýchlenie výpočtov neurálnych sietí. Ako vstup do NN sme vzali pca1 a pca2 a za výstup časový rad Dst indexu. V intervale 1998-1999 sme vybrali 12 období extrémnych búrok. Dané intervaly sme rozdelili na tréningové (1), testovacie (3) a intervaly, na ktorých sme skúšali predpovede (8). Parametre neurálnych sietí sme zobrali h = 0,000001, q=5, N=6, m=1, parametre slnečného vetra sme uvažovali s časovým posunom DT=1hod. Priemerná hodnota korelačného koeficientu je r = 0,86, NMSE = 0,40 a ARV = 0,27, čím sme ukázali, že ~73% (~r2) pozorovanej Dst variácie je predpovedateľná zo slnečného vetra. Z výsledkov vyplýva, že časť variácie Dst indexu je spôsobená samotnou dynamikou magnetosféry. V opačnom prípade, keby variácie Dst indexu bol schopný úplne celý predpovedať slnečný vietor, magnetosféru by sme museli považovať za lineárny systém bez vlastnej dynamiky.
     Metóda neurálnych sietí bola použitá aj pri predpovediach AE indexu pomocou PC indexu (Takalo and Timonen, 1999 ), s úspešnosťou 77% a AL indexu pomocou v.Bs (Hernandez et al.1993) s výsledkom 72%.

Obr.2   a. Hlavný komponent pca1; b. pca2; c. normalizovaná kvadratická chyba; d. korelácia medzi indexom Dst a predpovedanou hodnotou Dst.

Obr.3 Ukážka predpovede Dst indexu na jeden krok dopredu, t.j. 1 hod. , súvislá čiara reprezentuje predpoveď
 

4. ZÁVER

     Uvedené nelineárne metódy prevyšujú lineárne postupy v tom zmysle, že poskytujú dodatočné, pre lineárnu analýzu neprístupné informácie o fyzikálnych procesoch, zároveň reprodukujú aj výsledky dosiahnuté pomocou lineárnych techník. Ich vhodná kombinácia môže upresniť naše predstravy o dynamike magnetosféry.
 

POĎAKOVANIE

Práca bola pripravená v rámci projektu VEGA 2/6040/99.
 

LITERATÚRA

Akasofu, S. Chapman, S., Solar terrestrial physics, 1972,
Bargatze, L.F., Baker, D.N., McPherron, R.L., Hones, E.W., Magnetospheric impulse response for many levels of
     geomagnetic activity, J.Geophys.Res., 90, 6387, 1985,
Casdagli, M., Nonlinear prediction of chaotic time series, Physica D, 35, 335, 1989,
Halsey, T.C., Kadanoff, J.M.H., Procaccia, L.P., Shraiman, B.I., Fractal measures and their singularities, Phys.Rev.A, 33,
     1141, 1986,
Hernandez, J.V., Tajima, T., Horton, W., Neural net forecasting for geomagnetic activity, Geophys.Res. Lett., 20, 2707,
     1993,
Jacobs, J.A., Geomagnetism, Vol. 3, 1989,
Muzy, J.F., Bacry, E., Arneodo, A., Multifractal formalism for fractal signals, Phys.Rev.E, 47, 875, 1993,
Norgaard, M., Neural network based system identification toolbox, 1997,
Radons, G., Stoop, R., Superpositions of multifractals, J. Stat. Phys., 82, 1063, 1996,
Reyment, R., Jöreskog, K.G., Applied factor analysis in the natural sciences, 1996,
Rumelhart, D.E., Hinton, G.E., Williams, R.J., Learning representations by back-propagating errors, Nature, 323,533, 1986,
Takalo, J., Timonen ,J., Neural network prediction of the AE index from the PC index, Phys.Chem.Earth, 24, 89, 1999,
Takalo, J., Timonen, J., and Koskinen, H., Correlation dimension and affinity of AE data and bicolored noise,
     Geophys.Res.Lett., 20, 1527, 1993,
Tél, T., Fractals, multifractals and thermodynamics, Z. Naturforsch., 43a, 1154, 1988,
Tsurutani, B.T., Sugiura, M., Iyemori, T., Goldstein, B.E., Gonzalez,
W.D., Akasofu, S.I., Smith, E.J., The nonlinear response of AE to the IMF Bs driver, Geophys.Res. Lett.,17, 279, 1990,
Véhel, J.L. , Vojak, R., Multifractal analysis of Choquet capacities, Adv. Appl. Math., 20(1), 1, 1998,
Vörös, Z., Multifractal analysis of geomagnetic data, Revista Geofisica, 48, 77, 1988,
Vörös, Z., On multifractality of high latitude geomagnetic fluctuations, Ann. Geophysicae, In Press,
Weigend, A.S., Hubermand, B.A., Rumelhart, D.E., Predicting sunspots and exchange rates with connectionist networks, in
     Nonlinear Modeling and Forecasting, M. Casdagli and S. Eubanks, EDs. (Addison-Wesley, 1992).