10 Лабораторна робота № 10

Тема. Дослідження складних систем із використанням інструментарію неекстенсивної статистики

Мета. Оволодіти методологією та інструментарієм неекстенсивної статистики стосовно критичних і кризових явищ

10.1 Теоретичні відомості

10.1.1 Неекстенсивна термодинаміка і кризи фінансово-економічних систем

Великий виклик теорії складності, що лежить в основі сучасної наукової парадигми, бере початок ще із старих та таких важливих проблем, як: стріла часу, існування простого та фундаментального фізичного рівня для єдиного опису макроскопічного та мікроскопічного рівнів, взаємозв’язок між спостерігачем та досліджуваним об’єктом, і т. д. Загалом, що стосується теорії складності та кожного нового рівня реальності, потрібні нові концепції та нові класифікації.

Зокрема, теорія складності включає: хаотичну динаміку в просторі станів, далеку від рівноважних фазових переходів, довготривалі кореляції, самоорганізацію та мультимасштабність, фрактальні процеси в просторі і часі та інші значущі явища [1]. Теорія складності розглядається як третя наукова революція минулого століття (після теорії відносності та квантової теорії). Однак теорія складності ще далека від своєї академічної зрілості. У цьому напрямку вагомий внесок щодо питання “що таке складність” можна знайти в книзі Г. Ніколісa та І. Пригожина [2]. Як правило, ми можемо узагальнити основну концепцію теорії складності наступним чином:

Теорія складності — це узагальнення статистичної фізики для критичних станів термодинамічної рівноваги та для далеких від рівноваги процесів.
Складність — це поширення динаміки на нелінійність і дивну динаміку.
Також, згідно Іллі Пригожину, теорія складності пов’язана з динамікою кореляцій замість динаміки траєкторій або хвильових функцій.

Згідно з теорією складності, різні фізичні явища, що відбуваються в розподілених фізичних системах, таких як космічна плазма, рідини або тверді тіла, хімія, біологія, екосистеми, динаміка ДНК, соціально-економічні чи інформаційні системи, мережі можна описати і зрозуміти подібним чином. Цей опис базується на принципі максимізації ентропії. Також згідно з теорією складності, вказані системи є цілісно стійкими дисипативними структурами, що утворюються загальним природним процесом, спрямованим на максимізацію ентропії. З точки зору складності, немає суттєвої диференціації між групою галактик, зірками, тваринами, квітами або елементарними частинками, оскільки скрізь ми маємо відкриті, динамічні та самоорганізовані системи і всюди природа працює з метою максимізації ентропії.

Під час дослідження складних фізичних систем та явищ, зокрема, самоорганізаційних і фрактальних структур, субдифузії, турбулентності, хімічних реакцій, а також різних економічних, соціальних і біологічних систем розподіл Гіббса не забезпечує узгодження із спостережуваними явищами. Як виявляється у багатьох дослідженнях, для таких систем характерні степеневі розподіли [3]. Вони не отримуються з принципу максимуму ентропії Гіббса-Шеннона, на якому ґрунтується як рівноважна, так і нерівноважна статистична термодинаміка [4–6]. Це спричинило численні спроби побудови узагальненої статистики, яка б забезпечила степеневу асимптотику функції розподілу. Таку узагальнену статистику можна будувати на основі кількох ентропій. Серед них важливе місце посідає ентропія Тсалліса (Tsallis entropy).

Дослідження в області механіки неекстенсивних (неадитивних) систем стали останнім часом предметом значного інтересу в зв’язку з проявами неаддитивних властивостей в аномальних фізичних явищах. Це пояснюється як новизною виникаючих тут загальнотеоретичних проблем, так і важливістю практичних застосувань (див. бібліографію, представлену на сайті, яка постійно оновлюється). Початок систематичного вивчення в цьому напрямку пов’язаний з роботою К. Тсалліса, в якій автором була введена параметрична формула статистичної \(q\)-ентропії, залежної від деякого дійсного числа \(q\) (так званого параметра деформації) і неадитивної для сукупності незалежних складних систем. Теорія неекстенсивних систем, заснована на ентропії Тсалліса, в даний час інтенсивно розвивається. Ці роботи стали значним кроком у розвитку теоретико-інформаційного підходу і при розробці принципів неекстенсивної статистичної механіки та рівноважної термодинаміки відкритих систем. При цьому важливо відзначити, що діапазон застосування цих та багатьох інших неекстенсивних параметричних ентропій в даний час постійно розширюється, охоплюючи різні напрямки в науці, такі як космологія і космогонія, теорія плазми, квантова механіка і статистика, нелінійна динаміка і фрактали, геофізика, біомедицина і багато інших.

Економічну динаміку з фізичної точки зору можна розглядати як просторово розподілену динаміку та пов’язану із загальною категорією нелінійних розподілених систем. Аналіз економічних часових рядів демонструє складну та хаотичну динаміку у фазовому просторі. Теорема Такенса (за допомогою методу затримок) дозволяє реконструювати топологічний еквівалент до вихідного фазового простору, який зберігає основні геометричні та динамічні властивості, такі як ступені свободи, фрактальна розмірність, мультифрактальність, показники Ляпунова, матриця прогнозування тощо. Реконструйований фазовий простір може бути використаний для оцінки всіх вищезазначених величин, а також фазових переходів, статистичної поведінки, генерування ентропії тощо. Крім того, фазовий простір може мати мультифрактальні властивості та характеристики переривчастої турбулентності, які вказують на існування дальніх взаємодій у просторі та часі, а також мультимасштабну взаємодію.

Ці характеристики також вказують на існування дробової динаміки у фазовому просторі, яку можна описати за допомогою дробово-диференціальних рівнянь Фоккера-Планка та аномальних дифузійних рівнянь. Рішеннями цих рівнянь є дробові просторово-часові функції та негаусові функції розподілу, які належать до категорії розподілів Леві та розподілів Тсалліса. Нерівноважні стаціонарні стани економічної динаміки походять від процесів сильної самоорганізації, що відповідає локальним максимумам ентропії Тсалліса, тоді як зміни параметрів управління економічної системи можуть спричинити фазовий перехід та зміщення економічної динаміки до нової стійкої рівноваги, стійкого стану з максимальною ентропією Тсалліса. Цей фазовий перехід призводить до мультифрактальної зміни у формуванні фазового простору та до зміни феноменології економічної системи. Нарешті, статистику динаміки в мультифрактальному фазовому просторі можна описати за допомогою степеневих функцій розподілу Тсалліса з “важкими” хвостами, які можуть бути використані для вдосконалення методів прогнозування.

В останні роки статистична механіка розширила своє початкове призначення: застосування статистики до великих систем, стани яких регулюються якимись гамільтоновими функціоналами [3]. Їх здатність пов’язувати мікроскопічні стани окремих складових системи з макроскопічними властивостями сьогодні використовується повсюдно [4]. Безумовно, найважливішим із цих зв’язків все-таки є визначення термодинамічних властивостей через відповідність між поняттям ентропії, спочатку введеним Рудольфом Клаузіусом в 1865 р., та кількістю дозволених мікроскопічних станів, введеним Людвігом Больцманом близько 1877 р. коли він вивчав підхід до рівноваги ідеального газу [6]. Цей зв’язок можна виразити як

\[ S = k\ln{W}, \tag{10.1}\]

де \(k\) — позитивна константа, а \(W\) — кількість мікростанів, сумісних з макроскопічним станом ізольованої системи. Це рівняння, відоме як принцип Больцмана, є одним із наріжних каменів стандартної статистичної механіки. Коли система не ізольована, а замість цього контактує з деяким великим резервуаром, можна модифікувати рівняння (10.1) і отримати ентропію Больцмана-Гіббса (БГ-BG):

\[ S_{BG} = -k\sum_{i=1}^{W}p_i\ln{p_i}, \tag{10.2}\]

де \(p_i\) — ймовірність мікроскопічної конфігурації \(i\) [3]. Статистична механіка BG все ще ґрунтується на таких гіпотезах, як молекулярний хаос [2] та ергодичність [7]. Незважаючи на відсутність фактичного фундаментального виведення, статистика BG, безсумнівно, мала успіх у вивченні систем, в яких домінують короткі просторово-часові взаємодії. Отже, цілком можливо, що інші фізичні ентропії, крім BG, можуть бути визначені для належного опису аномальних систем, для яких спрощена гіпотеза про ергодичність та/або незалежність не виконується. Натхненний такими концепціями в 1988 р. Константіно Тсалліс (Constantino Tsallis) запропонував узагальнення статистичної механіки BG, яка охоплює системи, що порушують ергодичність, системи, мікроскопічні конфігурації яких не можна вважати незалежними. Це узагальнення базується на неадитивних ентропіях, \(S_q\), що характеризується індексом \(q\) і призводить до неекстенсивної статистики

\[ S_q = -k \left( 1-\sum_{i=1}^{W}p_{i}^{q} \right) \Bigg/ (1-q), \tag{10.3}\]

\(p_i\) — ймовірності, пов’язані з мікроскопічними конфігураціями, \(W\) — їх загальне число, \(q\) — дійсне число, і \(k\) — постійна Больцмана. Значення \(q\) є мірою неекстенсивності системи. При цьому, \(q=1\) відповідає стандартній статистиці BG. Вираз (10.3) модифікує \(S_{BG}\) (\(\lim q\to 1, S_q = S_{BG}\)), як основу можливого узагальнення статистичної механіки BG [8,9]. Значення ентропійного індексу \(q\) для конкретної системи повинно визначатися апріорі з мікроскопічної динаміки.

З часу своєї появи ентропія Тсалліса (10.3) стала джерелом кількох важливих результатів як у фундаментальній, так і в прикладній фізиці, а також в інших наукових областях, таких як біологія, хімія, економіка, геофізика та медицина [10].

10.1.2 Неекстенсивна ентропія і триплет Тсалліса

Системи, що характеризуються статистичною механікою Больцмана-Гіббса, мають такі характеристики: (i) їх функції розподілу для енергій пропорційні експоненціальній функції; (ii) вони мають сильну чутливість до початкових умов, яка з часом зростає в геометричній прогресії (хаос), характеризуючись позитивним максимальним показником Ляпунова; (iii) їх релаксація відбувається експоненційно з певним часом релаксації. Іншими словами, ці три способи поведінки описуються експоненціальними функціями (тобто \(q=1\)). Однак встановлено, що для систем, які можна вивчати в рамках неекстенсивної статистичної механіки, функція щільності ймовірності енергії (пов’язана зі стаціонарністю або рівновагою), чутливість до початкових умов та релаксація описуються трьома ентропійними індексами \(q_{stat}, q_{sens}, q_{rel}\), які отримали назву триплета Тсалліса (Tsallis triplet), або \(q\)-триплета Тсалліса [4,11].

Неекстенсивна статистична теорія математично базується на нелінійному рівнянні

\[ \frac{dy}{dx} = y^{q}, \tag{10.4}\]

розв’язком якого є \(q\)-експоненціальна функція

\[ \exp_q(x) = \begin{cases} \left( 1+(1-q)x \right)^{1 / (1-q)}, & \text{якщо} \; 1+(1-q)x > 0,\\ 0, & \text{якщо} \; 1+(1-q)x \leq 0. \end{cases} \tag{10.5}\]

Для \(q\to1\) \(q\)-Гаусіан відповідає звичайному розподілу Гауса.

Розв’язок рівняння (10.4) можна реалізувати трьома різними способами, включеними до \(q\)-триплету Тсалліса: (\(q_{sens}, q_{stat}, q_{rel}\)). Ці величини характеризують три фізичні процеси, які узагальнені тут, тоді як значення \(q\)-триплету характеризують атракторний набір динаміки у фазовому просторі динаміки, і вони можуть змінюватися, коли динаміка системи притягується до іншого набору атракторів.

Для неекстенсивної системи величина \(q\)-індексу залежить від оцінюваних властивостей динаміки і фазового простору системи. Для динамічних систем оцінюється \(q\)–триплет, що відображає три властивості системи (Рис. 10.1). Індекс \(q_{stat}\) оцінюється на основі рівноважної моделі рангового розподілу з використанням методів нелінійного оцінювання [12]. Цей індекс є параметром області атракції системи. Індекс \(q_{sens}\) відображає чутливість системи до початкових умов та виробництво ентропії і визначається за мультифрактальним спектром [13]. Релаксаційний індекс \(q_{rel}\) знаходять на основі автокореляції і характеристик дифузійних процесів [14].

Рис. 10.1: Часова періодизація періодів виробництва \(q\)-ентропії. Перший період відповідає виробництву ентропії через параметр \(q_{sens}\) \(q\)-триплету Тсалліса. Другий період відповідає певному процесу релаксації через параметр \(q_{rel}\). Система виявляє коливання через параметр \(q_{stat}\) \(q\)-триплету Тсалліса

10.1.2.1 Стаціонарність \(q=q_{stat}\)

Значення \(q\) для стаціонарного стану оцінюють із функції розподілу прибутковостей, що в свою чергу отримується шляхом підгонки \(q\)-Гаусіана:

\[ P_q(\beta, x) = \left( \sqrt{\beta} \bigg/ C_q \right)\exp(-\beta rx^2) \tag{10.6}\]

для емпірично побудованої гістограми \(\{ p(x_i)\;|\;i=1,...,N \}\) та різних значень \(\beta\), що підбираються шляхом мінімізації \(\sum_i \left[ P_{q_{stat}}(\beta, x_i) - p(x_i) \right]^2\). У залежності від значення \(q\), \(C_q\) може приймати наступні види:

\[ C_q = \begin{cases} 2\sqrt{\pi}\,\Gamma\left( \frac{1}{1-q} \right) \Big/ (3-q)\sqrt{1-q}\,\Gamma\left( \frac{3-q}{2(1-q)} \right), & \text{якщо} \; -\infty<q<1,\\ \sqrt{\pi}, & \text{якщо} \; q=1,\\ \sqrt{\pi}\,\Gamma\left( \frac{3-q}{2(q-1)} \right) \Big/ \sqrt{q-1}\,\Gamma\left( \frac{1}{q-1} \right), & \text{якщо} \; 1<q<3. \end{cases} \tag{10.7}\]

Для оцінки динаміки значення \(q\) будується графік залежності \(\ln_q[p(x)]\) від \(x^2\) для вибраного інтервалу \(q\) (наприклад, від 1 до 5), що забезпечує найкраще лінійне наближення (оцінюється за максимальним коефіцієнтом детермінації \(R^2\)) [15]. Зрозуміло, що значення \(p(x)\) стають помітно негаусівськими вздовж хвостів, і замість цього можуть бути описані степеневим законом.

10.1.2.2 Релаксація \(q=q_{rel}\)

Для часових рядів складних систем (особливо у задачах з «пам’яттю» в амплітуді/волатильності) корисно розглядати негативно-ненасичену автокореляцію модулів інкрементів (або інших релевантних спостережуваних величин), нормовану до одиниці на нульовому лаґу. Відповідно до (⁠{#eq-10-8}⁠):

\[ C(\tau) = \frac{\sum_{t}|g_{t+\tau}|\cdot|g_t|}{\sum_{t}|g_t|^2}, \qquad \tau=0,1,2,\dots \tag{10.8}\]

де \((g_t)\) - обрана величина (напр., (\(|\Delta x_t|\)) для інтенсивності змін).

У екстенсивній статистиці Больцмана-Гіббса (BG) характерне експоненціальне згасання \(C(\tau)\sim e^{-\tau/\tau_0}\). Для неекстенсивних систем, що демонструють слабкий хаос, довгі кореляції чи мультифрактність, природною є \(q\)-експоненціальна релаксація (див. нижче).

Розглянемо \(q\)-експоненту та \(q\)-логарифм, які переходять у класичні \(e^x\) і \(\ln y\) при \(q\to 1\). У термінах \(e_q\) релаксація моделюється як

\[ C(\tau) \approx A e_q (-\tau/\tau_0) = A\big[ 1+(q-1)\tau/\tau_0 \big]^{-1/(q-1)}. \tag{10.9}\]

У граничних режимах:

\(q\to 1\): \(C(\tau)\to Ae^{-\tau/\tau_0}\) (BG-випадок);
\(q>1\): при великих \(\tau\) маємо степеневий «хвіст» \(C(\tau)\sim \tau^{-\gamma}\) із \(\gamma=\tfrac{1}{q-1}\).

Звідси лінійна лінеаризація у \(q\)-логарифмі:

\[ \ln_q C(\tau) = \ln_q A - (\tau/\tau_0), \tag{10.10}\]

тобто графік \(\ln_q C(\tau)\) проти \(\tau\) є майже прямою із кутовим коефіцієнтом \(-1/\tau_0\). Практично це і є суть «класичної» процедури підбору \(q\), про яку йшлося до цього: обрати те \(q\), для якого \(\ln_q C(\tau)\) найкраще лінеаризує експериментальні дані.

Оновлена реалізація передбачає дві еквівалентні у змісті, але різні технічно процедури:

Степеневий «хвіст» (power-law fit)

Якщо на графіку в подвійному логарифмічному масштабі спостерігаємо лінійну залежність для хвоста \(C(\tau)\), припускаємо

\[ C(\tau)\ \sim\ \tau^{-\gamma},\qquad \gamma>0. \tag{10.11}\]

Регресія \(\log C(\tau)\) на \(\log \tau\) дає нахил \(s\), і \(\widehat{\gamma}=-s\). Далі

\[ \widehat{q}_{\mathrm{rel}} = 1+(1/\widehat{\gamma}). \tag{10.12}\]

У реалізації. Функція бере лише додатні значення \(C(\tau)\) (логарифм від’ємних значень не визначений і не описує оболонку), перевіряє наявність щонайменше min_points точок у хвості; за нестачею – намагається використати останні додатні точки. Якщо \(\widehat{\gamma}\le 0\) або хвіст неякісний – повертає попередження та NaN.

\(q\)-експоненційна підгонка

Коли автокореляційна залежність не проявляє явної лінійної залежності в подвійному логарифмічному масштабі, доречно шукати \(q_{rel}\) напряму із наступного виразу:

\[ C(\tau)\ \approx\ A[1+(q-1) \tau/\tau_0]^{-1/(q-1)}. \tag{10.13}\]

Нелінійна апроксимація за методом найменших квадратів (за додатними \(C(\tau)\)) оцінює \((A, q, \tau_0)\). Початкові припущення ініціалізуються грубою оцінкою «нахилу» та характерного масштабу загасання.

Інтерпретація

Якщо дані ближчі до умов BG, апроксимація повертає \(\hat q_{\mathrm{rel}}\approx 1^+\) і скінченне \(\tau_0\). Якщо хвіст істотно повільніший, \(\hat q_{\mathrm{rel}}>1\) і (3.3) асимптотично узгоджується з (Рівняння 10.13) через \(\gamma = 1/(q-1)\).

10.1.2.3 Чутливість до початкових умов \(q=q_{sens}\)

Виробництво ентропії пов’язане із загальним характером атракторної множини. Цей атрактор може бути описаний мультифрактальністю, а також чутливістю до початкових умов. Чутливість до початкових умов можна виразити як:

\[ \frac{d\xi}{dt} = \lambda_1\xi + (\lambda_q - \lambda_1)\xi^q, \tag{10.14}\]

де \(\xi\) — відхилення траєкторії у фазовому просторі: \(\xi \equiv \lim_{\delta \to 0} \left[ \delta(t)/\delta(0) \right]\), і \(\delta(t)\) — це відстань між сусідніми траєкторіями через час \(t\). Розв’язок рівняння (10.14) може бути представлений у вигляді:

\[ \xi = \left[ 1 - (\lambda_{q_{sens}} \big/ \lambda_{1}) + (\lambda_{q_{sens}} \big/ \lambda_{1}) \exp{\left( \left( 1-q_{sens} \right)\lambda_{1}t \right)} \right]^{1 / (1-q_{sens})}. \tag{10.15}\]

Спочатку було висловлено гіпотезу, а згодом доведено для часових рядів неекстенсивних систем різної природи, що має місце таке співвідношення [16]:

\[ 1 \big/ (1-q_{sens}) = 1 \big/ \alpha_{min} - 1 \big/ \alpha_{max}, \tag{10.16}\]

де \(\alpha_{min}\) та \(\alpha_{max}\) — відповідно мінімальні та максимальні значення \(\alpha\) відповідного мультифрактального спектру \(f(\alpha)\).

Спектр мультифрактальності, в свою чергу, випливає з процедури мультифрактального аналізу детрендованих флуктуацій (МФ-АДФ), що дозволяє розрахувати показник Херста для різних часових масштабів.

10.2 Хід роботи

Розглянемо як можна застосовувати зазначені показники в якості індикаторів кризових станів.

Спочатку імпортуємо необхідні бібліотеки:

import matplotlib.pyplot as plt 
import numpy as np
import yfinance as yf
import pandas as pd
import scienceplots
import neurokit2 as nk
import warnings
from numpy.polynomial.polynomial import polyfit
from dataclasses import dataclass
from math import isfinite
import importlib.util
import fathon
from typing import Tuple, Dict, Optional, Sequence
import scipy
from fathon import fathonUtils as fu
from scipy import optimize, stats, special
from scipy.optimize import curve_fit
from tqdm import tqdm

%matplotlib inline

Далі виконаємо налаштування формату виведення рисунків:

plt.style.use(['science', 'notebook', 'grid']) # стиль, що використовуватиметься
                                               # для виведення рисунків

size = 22
params = {
    'figure.figsize': (8, 6),            # встановлюємо ширину та висоту рисунків за замовчуванням
    'font.size': size,                   # розмір фонтів рисунку
    'lines.linewidth': 2,                # товщина ліній
    'axes.titlesize': 'small',           # розмір титулки над рисунком
    'axes.labelsize': size,              # розмір підписів по осям
    'legend.fontsize': size,             # розмір легенди
    'xtick.labelsize': size,             # розмір розмітки по осі Ох
    'ytick.labelsize': size,             # розмір розмітки по осі Ох
    "font.family": "Serif",              # сімейство стилів підписів 
    "font.serif": ["Times New Roman"],   # стиль підпису
    'savefig.dpi': 300,                  # якість збережених зображень
    'axes.grid': False                   # побудова сітки на самому рисунку
}

plt.rcParams.update(params)              # оновлення стилю згідно налаштувань

Та визначимо необхідні функції для подальшої роботи:

# функція автокореляцій для обчислення q_rel
def acf_fft(x: np.ndarray, max_lag: Optional[int] = None) -> np.ndarray:
    """
    Швидка (на основі FFT) незміщена автокореляційна функція для 1D масиву. 
    Повертає acf з затримкою 0..max_lag (включно).
    """
    x = np.asarray(x, dtype=float)
    x = x - np.nanmean(x)
    n = len(x)
    if max_lag is None:
        max_lag = n - 1

    nfft = 1 << (2*len(x) - 1).bit_length()
    fx = np.fft.rfft(x, nfft)
    sxx = fx * np.conjugate(fx)
    acf_full = np.fft.irfft(sxx, nfft)[:n]
   
    norm = np.arange(n, 0, -1, dtype=float)
    acf_unbiased = acf_full / norm
    acf_unbiased /= acf_unbiased[0]
    return acf_unbiased[:max_lag + 1]

# функція для обчислення прибутковостей ряду чи його стандартизації
def transformation(signal, ret_type):

    for_rec = signal.copy()

    if ret_type == 1:       # Зважаючи на вид ряду, виконуємо
                            # необхідні перетворення
        pass
    elif ret_type == 2:
        for_rec = for_rec.diff()
    elif ret_type == 3:
        for_rec = for_rec.pct_change()
    elif ret_type == 4:
        for_rec = for_rec.pct_change()
        for_rec -= for_rec.mean()
        for_rec /= for_rec.std()
    elif ret_type == 5: 
        for_rec = for_rec.pct_change()
        for_rec -= for_rec.mean()
        for_rec /= for_rec.std()
        for_rec = for_rec.abs()
    elif ret_type == 6:
        for_rec -= for_rec.mean()
        for_rec /= for_rec.std()

    for_rec = for_rec.dropna().values.squeeze()

    return for_rec

# функція для побудови парних графіків
def plot_pair(x_values, 
              y1_values,
              y2_values,  
              y1_label, 
              y2_label,
              x_label, 
              file_name, clr="magenta"):

    fig, ax = plt.subplots()

    ax2 = ax.twinx()
    ax2.spines.right.set_position(("axes", 1.03))

    p1, = ax.plot(x_values, 
                  y1_values, 
                  "b-", label=fr"{y1_label}")
    p2, = ax2.plot(x_values,
                   y2_values, 
                   color=clr, 
                   label=y2_label)

    ax.set_xlabel(x_label)
    ax.set_ylabel(f"{y1_label}")
    ax.yaxis.label.set_color(p1.get_color())
    ax2.yaxis.label.set_color(p2.get_color())

    tkw = dict(size=2, width=1.5)

    ax.tick_params(axis='x', rotation=45, **tkw)
    ax.tick_params(axis='y', colors=p1.get_color(), **tkw)
    ax2.tick_params(axis='y', colors=p2.get_color(), **tkw)
    ax2.legend(handles=[p1, p2])

    plt.savefig(file_name + ".jpg")
        
    plt.show();

У цій роботі розглянемо динаміку неекстенсивних показників на прикладі фондового індексу S&P 500, але дивитимемось на ряд, починаючи з 2016 року. Для отримання значень індексу скористаємось бібліотекою yfinance.

symbol = '^DJI'          # Символ індексу
start = "2016-01-01"     # Дата початку зчитування даних
end = "2023-12-01"       # Дата закінчення зчитування даних

data = yf.download(symbol, start, end)  # вивантажуємо дані
time_ser = data['Close'].copy()     # зберігаємо саме ціни закриття

xlabel = 'time, days'    # підпис по вісі Ох 
ylabel = symbol          # підпис по вісі Оу

YF.download() has changed argument auto_adjust default to True

[*********************100%***********************]  1 of 1 completed

Увага

Виконайте цей блок, якщо хочете зчитати дані не з Yahoo! Finance, а із власного файлу. Зрозуміло, що й аналіз результатів, і висновки залежать від того, з яким рядом ми працюємо

symbol = 'sMpa11'                  # Символ індексу

path = "databases\sMpa11.txt"      # шлях по якому здійснюється зчитування файлу
data = pd.read_csv(path,           # зчитування даних 
                   names=[symbol])
time_ser = data[symbol].copy()     # копіюємо значення кривої 
                                   # "напруга-видовження" до окремої змінної

xlabel = r'$\varepsilon$'          # підпис по вісі Ох 
ylabel = symbol                    # підпис по вісі Оу

Виводимо досліджуваний ряд:

fig, ax = plt.subplots(1, 1)               # Створюємо порожній графік
ax.plot(time_ser.index, time_ser.values)   # Додаємо дані до графіку
ax.legend([symbol])                        # Додаємо легенду
ax.set_xlabel(xlabel)                      # Встановимо підпис по вісі Ох
ax.set_ylabel(ylabel)                      # Встановимо підпис по вісі Oy

plt.xticks(rotation=45)                    # оберт позначок по осі Ох на 45 градусів

plt.savefig(f'{symbol}.jpg')               # Зберігаємо графік 
plt.show();                                # Виводимо графік

Рис. 10.2: Динаміка щоденних змін фондового індексу Доу Джонса

10.2.1 Розрахунок показника \(q_{stat}\)

def estimate_q_stat_student_t(
    x: np.ndarray,
    random_state: Optional[int] = None,
    floc_zero: bool = False
) -> Dict[str, float]:
    """
    Оцінка показника q_stat шляхом підгонки (MLE) одномірного розподілу Стьюдента
    до даних і подальшого відображення ступенів свободи ν у параметр q за формулою
    q = 1 + 2 / (ν + 1). Для важкохвостих випадків (q > 1) це еквівалентно q-гаусіану.

    Параметри
    ----------
    x : array-like
        Вхідний часовий ряд (одновимірний). Бажано попередньо очистити від трендів/викидів
        та працювати з інкрементами, якщо це доречно для предметної області.
    random_state : int або None
        Опціонально: зерно ГВЧ (не впливає на MLE через SciPy, але залишено для сумісності інтерфейсу).
    floc_zero : bool
        Якщо True, фіксуємо параметр зсуву (loc) рівним 0 під час MLE (корисно для центрованих рядів).

    Повертає
    -------
    dict
        Словник з оцінками:
            - 'q_stat' : оцінка q за формулою 1 + 2/(ν + 1)
            - 'nu'     : оцінка ступенів свободи ν (df) розподілу Стьюдента
            - 'loc'    : оцінка параметра зсуву (μ)
            - 'scale'  : оцінка масштабу (s)

    Зауваги
    -------
    - Якщо істинний розподіл має компактну підтримку (q < 1), відображення через ν не застосовується.
    - SciPy повертає параметри у форматі (df, loc, scale); ми прямо мапимо df → q.
    """
    # --- Перетворення у масив та відкидання недопустимих значень ---
    x = np.asarray(x, dtype=float)
    x = x[np.isfinite(x)]

    # --- Мінімальна вимога до обсягу даних для надійності MLE ---
    if x.size < 50:
        raise ValueError("Потрібно щонайменше 50 скінченних спостережень для надійної оцінки q_stat.")

    # --- Підгонка розподілу Стьюдента: t.fit -> (df, loc, scale) ---
    #     floc_zero=True фіксує середнє в нулі (корисно для рядів з нульовим очікуванням).
    with warnings.catch_warnings():
        # При MLE можуть виникати RuntimeWarning (наприклад, у проміжних ітераціях);
        # приглушуємо їх, щоб не засмічувати лог повідомленнями, які не впливають на результат.
        warnings.simplefilter("ignore", category=RuntimeWarning)
        if floc_zero:
            df_hat, loc_hat, scale_hat = stats.t.fit(x, floc=0.0)
        else:
            df_hat, loc_hat, scale_hat = stats.t.fit(x)

    # --- Відображення ν → q за співвідношенням q = 1 + 2/(ν + 1) ---
    q_stat = 1.0 + 2.0 / (df_hat + 1.0)

    # --- Повернення результату у зручному форматі ---
    return {
        "q_stat": float(q_stat),
        "nu": float(df_hat),
        "loc": float(loc_hat),
        "scale": float(scale_hat)
    }

10.2.1.1 Побудова \(q\)-Гаусіана для всього ряду

q_stat_time_ser = time_ser.copy()
ret_type = 4 # визначення типу ряду для його перетворення
q_stat_time_ser = transformation(q_stat_time_ser, ret_type)

mu_hat = float(np.mean(q_stat_time_ser))
sigma_hat = float(np.std(q_stat_time_ser, ddof=1))

xs = np.linspace(np.min(q_stat_time_ser), np.max(q_stat_time_ser), 1800)
normal_pdf = stats.norm.pdf(xs, loc=mu_hat, scale=sigma_hat)

res = estimate_q_stat_student_t(x=q_stat_time_ser,  
                                random_state=0,
                                floc_zero=False)

q_hat = res["q_stat"]
nu_hat = res["nu"]
loc_hat = res["loc"]
scale_hat = res["scale"]

# Map Student-t to q-Gaussian parameters
inv_qm1 = 1.0/(q_hat - 1.0)
beta_hat = 1.0 / ((q_hat - 1.0) * nu_hat * (scale_hat**2))
A_q = np.sqrt((q_hat - 1.0) * beta_hat) * special.gamma(inv_qm1 - 0.5) / (special.gamma(inv_qm1) * np.sqrt(np.pi))

def q_gaussian_pdf(x, mu, q, beta, A):
    z = 1.0 + (q - 1.0) * beta * (x - mu)**2
    return A * np.power(z, -1.0/(q - 1.0))

qg_pdf = q_gaussian_pdf(xs, loc_hat, q_hat, beta_hat, A_q)

fig, ax = plt.subplots(1, 2, figsize=(16, 8))

ax[0].hist(q_stat_time_ser, bins=100, density=True, alpha=0.5, label="Empirical (hist of x)")
ax[0].plot(xs, normal_pdf, label=f"Normal PDF (μ={mu_hat:.3f}, σ={sigma_hat:.3f})")
ax[0].plot(xs, qg_pdf, label=f"q‑Gaussian PDF (q={q_hat:.3f}, ν={nu_hat:.2f})")
ax[0].set_title("Empirical vs Normal and q‑Gaussian (linear y)")
ax[0].set_xlabel("x")
ax[0].set_ylabel("Density")
ax[0].legend(fontsize=18)

ax[1].hist(q_stat_time_ser, bins=100, density=True, alpha=0.5, label="Empirical (hist of x)")
ax[1].plot(xs, normal_pdf, label=f"Normal PDF (μ={mu_hat:.3f}, σ={sigma_hat:.3f})")
ax[1].plot(xs, qg_pdf, label=f"q‑Gaussian PDF (q={q_hat:.3f}, ν={nu_hat:.2f})")
ax[1].set_yscale("log")
ax[1].set_title("Empirical vs Normal and q‑Gaussian (semi‑log y)")
ax[1].set_xlabel("x")
ax[1].set_ylabel("Density (log scale)")

plt.savefig("q_stat_dist.jpg", dpi=150, bbox_inches="tight")
plt.show()

Рис. 10.3: Функція розподілу нормалізованих прибутковостей для Доу Джонса в порівнянні з Гаусіан та \(q\)-гаусіаном

На Рис. 10.3 видно, що стандартизовані прибутковості для індексу Доу Джонса виходять за межі \(\pm 10\sigma\). Як можна бачити, теоретичний розподіл Гауса значно недооцінює появу екстремально високих і низьких прибутковостей. Якщо логарифм емпіричної імовірності для таких прибутковостей знаходиться на рівні \(10^{-1}\), то розподіл Гауса становить приблизно \(10^{-25}\). Тобто, розподіл Гауса недооцінює еміричну ймовірність у \(10^{24}\) рази. Хоча \(q\)-Гаусіан також не представляється ідеальним для опису таких прибутковостей, але недооцінка важких хвостів у випадку неекстенсивної статистики набагато менша в порівнянні зі звичайним Гаусіаном.

10.2.1.2 Розрахунок \(q_{stat}\) у віконній процедурі

window = 250    # розмір вікна
tstep = 1       # крок вікна
ret_type = 4    # вид ряду: 
                # 1 - вихідний, 
                # 2 - детрендований (різниця між теп. значенням та попереднім)
                # 3 - прибутковості звичайні, 
                # 4 - стандартизовані прибутковості, 
                # 5 - абсолютні значення (волатильності)
                # 6 - стандартизований ряд

length = len(time_ser)

q_stats = []

for i in tqdm(range(0,length-window,tstep)):

    fragm = time_ser.iloc[i:i+window].copy()  # відбираємо фрагмент

    fragm = transformation(fragm, ret_type)   # виконуємо процедуру 
                                              # трансформації ряду

    res = estimate_q_stat_student_t(x=fragm, random_state=0, floc_zero=False)
    
    q_stat = res["q_stat"]
    
    q_stats.append(q_stat)

100%|██████████| 1742/1742 [01:20<00:00, 21.71it/s]

Зберігаємо отримані результати в текстовому файлі:

name = f"q_stat_name={symbol}_window={window}_step={tstep}_rettype={ret_type}.txt"

np.savetxt(name, q_stats)

Визначаємо параметри для збереження рисунків:

# позначення показника q_stat в легенді рисунку 
label_q_stat = r'$q_{stat}$'  

# назва рисунку
file_name = f"q_stat_name={symbol}_window={window}_step={tstep}_rettype={ret_type}"

# колір показника
color = 'brown'

plot_pair(time_ser.index[window:length:tstep],
          time_ser.values[window:length:tstep],
          q_stats, 
          ylabel, 
          label_q_stat,
          xlabel,
          file_name,
          color)

Рис. 10.4: Порівняльна динаміка коливань ціни індексу Доу Джонса та показника \(q_{stat}\)

Як ми можемо бачити на Рис. 10.4, показник \(q_{stat}\) зростає під час крахових явищ на фондовому ринку. Це вказує на значне зростання ступеня впливу важких хвостів у розподілі прибутковостей досліджуваного індексу.

10.2.2 Розрахунок показника \(q_{rel}\)

def estimate_q_rel_from_acf(
    x: np.ndarray,
    max_lag: Optional[int] = None,
    method: str = "powerlaw",
    min_points: int = 8,
) -> Dict[str, float]:
    """
    Оцінювання показника q_rel зі спаду автокореляційної функції C(t).

    Ідея:
      Для систем зі слабким хаосом/довгою пам'яттю загасання кореляцій часто
      має степеневий або q-експоненційний характер. Звідси оцінюємо q_rel
      двома підходами.

    Режими (method):
      - "powerlaw": лінійна аппроксимація хвоста на лог-лог шкалі:
                    C(t) ~ t^{-γ} → γ = -slope; тоді q_rel = 1 + 1/γ.
                    Для регресії беремо лише додатні значення C(t).
      - "qexp":     нелінійна найменшоквадратична апроксимація
                    C(t) ~ A * e_q(-t/τ); повертаємо q як q_rel.

    Параметри
    ----------
    x : array-like
        Вхідний часовий ряд (для багатьох застосувань доцільно брати інкременти).
    max_lag : int або None
        Максимальне відставання (лаг) для ACF; типово N//10 (де N — довжина ряду).
    method : {"powerlaw","qexp"}
        Вибір моделі загасання (степенева або q-експоненціальна).
    min_points : int
        Мінімальна кількість точок у хвості для надійної оцінки.

    Повертає
    -------
    dict з ключами:
        {'q_rel', 'gamma', 'A', 'tau', 'method', 'used_lags'}
        де поля, неактуальні для обраного методу, матимуть NaN.
    """
    # --- підготовка ряду: відкидаємо недопустимі значення, перевіряємо довжину ---
    x = np.asarray(x, dtype=float)
    x = x[np.isfinite(x)]
    n = len(x)
    if n < 200:
        warnings.warn("Короткий ряд; оцінка q_rel може бути ненадійною (<200 спостережень).")

    # --- вибір максимальної затримки для ACF (якщо не задано) ---
    if max_lag is None:
        max_lag = max(50, n // 10)

    # --- обчислення ACF до max_lag (передбачається, що функція acf_fft вже визначена) ---
    acf = acf_fft(x, max_lag=max_lag)
    lags = np.arange(len(acf))
    # пропускаємо нульовий лаг (ACF(0)=1), працюємо з 1..max_lag
    acf1 = acf[1:]
    lags1 = lags[1:]

    # --- за замовчуванням повертаємо NaN, якщо оцінка не вдасться ---
    result = {
        "q_rel": np.nan, "gamma": np.nan, "A": np.nan, "tau": np.nan,
        "method": method, "used_lags": np.nan
    }

    if method == "powerlaw":
        # --- вибираємо додатну частину ACF (логарифм від'ємних значень некоректний) ---
        mask = (acf1 > 0)
        if mask.sum() < min_points:
            # резервний варіант: беремо останні min_points додатних точок
            pos = np.where(acf1 > 0)[0]
            if pos.size >= min_points:
                idx = pos[-min_points:]
                mask = np.zeros_like(acf1, dtype=bool)
                mask[idx] = True
        if mask.sum() < min_points:
            warnings.warn("Недостатньо точок у хвості для степеневого фіту; повертаю NaN.")
            return result

        # --- лінійна регресія на лог-лог шкалі: log C = a + s*log t, γ = -s ---
        xlog = np.log(lags1[mask])
        ylog = np.log(acf1[mask])
        coeffs = np.polyfit(xlog, ylog, deg=1)
        slope = coeffs[0]
        intercept = coeffs[1]
        gamma = -slope

        if gamma <= 0:
            warnings.warn("Оцінена γ ≤ 0; степеневий фіт некоректний для цього хвоста.")
            return result

        q_rel = 1.0 + 1.0 / gamma
        A = np.exp(intercept)

        result.update({
            "q_rel": float(q_rel),
            "gamma": float(gamma),
            "A": float(A),
            "tau": np.nan,
            "method": "powerlaw",
            "used_lags": int(mask.sum())
        })
        return result

    elif method == "qexp":
        # --- підгонка C(t) ~ A * e_q(-t/τ), де q>1, τ>0, A>0 ---
        def model(lag, A, q, tau):
            # e_q(-lag/τ) = [1 + (q-1)*(lag/τ)]^{-1/(q-1)}
            return A * np.power(1.0 + (q - 1.0) * (lag / tau), -1.0 / (q - 1.0))

        # працюємо з додатними значеннями ACF як із оболонкою загасання
        mask = (acf1 > 0)
        lags_fit = lags1[mask]
        acf_fit = acf1[mask]
        if lags_fit.size < min_points:
            warnings.warn("Замало додатних значень ACF для q-експоненційного фіту; повертаю NaN.")
            return result

        # --- початкові наближення параметрів ---
        A0 = acf_fit[0]
        # груба оцінка нахилу (для стартового gamma0) і перетворення у стартове припущення q
        xlog = np.log(lags_fit[:max(5, lags_fit.size // 3)])
        ylog = np.log(acf_fit[:max(5, lags_fit.size // 3)])
        try:
            slope, intercept = np.polyfit(xlog, ylog, deg=1)
            gamma0 = -slope if slope < 0 else 1.0
        except Exception:
            gamma0 = 1.0
        q0 = 1.0 + 1.0 / max(1e-6, gamma0)
        # характерний масштаб τ0: де ACF впала приблизно в e разів, або середній лаг
        tau0 = max(
            1.0,
            lags_fit[np.argmax(acf_fit < A0 / np.e)] if np.any(acf_fit < A0 / np.e)
            else lags_fit[len(lags_fit) // 3]
        )

        # межі для параметрів (щоб уникнути вироджених/нефізичних рішень)
        bounds = ([1e-8, 1.0 + 1e-6, 1e-6], [10.0, np.inf, 1e6])

        try:
            popt, pcov = optimize.curve_fit(
                model, lags_fit, acf_fit, p0=[A0, q0, tau0], bounds=bounds
            )
            A_hat, q_hat, tau_hat = popt
            result.update({
                "q_rel": float(q_hat),
                "gamma": float(1.0 / (q_hat - 1.0)),
                "A": float(A_hat),
                "tau": float(tau_hat),
                "method": "qexp",
                "used_lags": int(lags_fit.size)
            })
        except Exception as e:
            warnings.warn(f"Помилка q-експоненційної підгонки: {e}")
        return result

    else:
        # некоректне ім'я методу
        raise ValueError("Аргумент 'method' має бути 'powerlaw' або 'qexp'.")

window = 250    # розмір вікна
tstep = 1       # крок вікна
ret_type = 1   # вид ряду: 
                # 1 - вихідний, 
                # 2 - детрендований (різниця між теп. значенням та попереднім)
                # 3 - прибутковості звичайні, 
                # 4 - стандартизовані прибутковості, 
                # 5 - абсолютні значення (волатильності)
                # 6 - стандартизований ряд

max_lag = None
method = "powerlaw" # powerlaw, qexp

length = len(time_ser)

q_rels = []

for i in tqdm(range(0,length-window,tstep)):

    fragm = time_ser.iloc[i:i+window].copy()  # відбираємо фрагмент

    fragm = transformation(fragm, ret_type)   # виконуємо процедуру 
                                              # трансформації ряду

    res = estimate_q_rel_from_acf(x=fragm, max_lag=max_lag, method=method, min_points=8)

    q_rel = res['q_rel']
    
    q_rels.append(q_rel)

100%|██████████| 1742/1742 [00:01<00:00, 1539.54it/s]

Зберігаємо отримані результати в текстовому файлі:

name = f"q_rel_name={symbol}_window={window}_step={tstep}_rettype={ret_type}_maxlag={max_lag}.txt"

np.savetxt(name, q_rels)

Визначаємо параметри для збереження рисунків:

# позначення показника q_rel в легенді рисунку 
label_q_rel = r'$q_{rel}$'  

# назва рисунку
file_name = f"q_rel_name={symbol}_window={window}_step={tstep}_rettype={ret_type}_maxlag={max_lag}"

# колір показника
color = 'red'

Виводимо результат:

plot_pair(time_ser.index[window:length:tstep],
          time_ser.values[window:length:tstep],
          q_rels, 
          ylabel, 
          label_q_rel,
          xlabel,
          file_name,
          color)

Рис. 10.5: Порівняльна динаміка коливань ціни індексу Доу Джонса та показника \(q_{rel}\)

Для досліджуваного показника на Рис. 10.5 видно, що ступінь релаксації зростає саме в передкризовий стан системи, що є індикатором зростання самоорганізації трейдерів через певні зовнішні показники. Дана динаміка узгоджується зі зростанням ступеня автокореляції під час кризових подій, що ми мали змогу спостерігати в першій лабораторній.

10.2.3 Розрахунок показника \(q_{sens}\)

window = 250    # розмір вікна
tstep = 1       # крок вікна
ret_type = 1    # вид ряду: 
                # 1 - вихідний, 
                # 2 - детрендований (різниця між теп. значенням та попереднім)
                # 3 - прибутковості звичайні, 
                # 4 - стандартизовані прибутковості, 
                # 5 - абсолютні значення (волатильності)
                # 6 - стандартизований ряд

rev = True         # Чи повторювати розрахунок ф-ції флуктуацій з кінця
accumulate = False # Повторна акумуляція детрендованого ряду для роботи із сильно антиколрельованими рядами

q_min = -5         # мінімальне значення q
q_max = 5          # максимальне значення q
q_inc = 1          # крок збільшення q

win_beg = 10       # Початкова ширина сегменту
win_end = window-1 # Кінцева ширина сегменту

length = len(time_ser)

q = np.arange(q_min, q_max+q_inc, q_inc)
q = np.round_(q, decimals = 1)

order = 1          # порядок поліному для детрендування (MF-DFA)

q_sens_values = []

for i in tqdm(range(0,length-window,tstep)):

    fragm = time_ser.iloc[i:i+window].copy()  # відбираємо фрагмент

    fragm = transformation(fragm, ret_type)   # виконуємо процедуру 
                                              # трансформації ряду

    if accumulate == True:
        fragm = np.cumsum(fragm-np.mean(fragm))

    a = fu.toAggregated(fragm)

    pymfdfa = fathon.MFDFA(a)

    wins = fu.linRangeByStep(win_beg, win_end)

    n, F = pymfdfa.computeFlucVec(wins, q, revSeg=rev, polOrd=order)
    list_H, list_H_intercept = pymfdfa.fitFlucVec()

    if accumulate == True:
        list_H = list_H - 1
    
    # розрахунок значень tau(q)
    tau = q * list_H - 1

    # розрахунок значень сингулярності
    alpha = np.gradient(tau, q, edge_order=2)

    # максимальне значення сингулярності
    maximal_alpha = alpha.max()

    # мінімальне значення сингулярності
    minimal_alpha = alpha.min()

    # розрахунок q_sens
    q_sens = (maximal_alpha-minimal_alpha-maximal_alpha*minimal_alpha)/(maximal_alpha-minimal_alpha)

    q_sens_values.append(q_sens)

100%|██████████| 1742/1742 [01:06<00:00, 26.13it/s]

Зберігаємо отримані результати в текстовому файлі:

name = f"q_sens_name={symbol}_ret={ret_type}_qmin={q_min}_qmax={q_max}_qinc={q_inc}_wind={window}_step={tstep}.txt"

np.savetxt(name, q_sens_values)

Визначаємо параметри для збереження рисунків:

# позначення показника q_rel в легенді рисунку 
label_q_sens = r'$q_{sens}$'  

# назва рисунку
file_name = f"q_sens_name={symbol}_ret={ret_type}_qmin={q_min}_qmax={q_max}_qinc={q_inc}_wind={window}_step={tstep}"

# колір показника
color = 'green'

Виводимо результат:

plot_pair(time_ser.index[window:length:tstep],
          time_ser.values[window:length:tstep],
          q_sens_values, 
          ylabel, 
          label_q_sens,
          xlabel,
          file_name,
          color)

Рис. 10.6: Порівняльна динаміка коливань ціни індексу Доу Джонса та показника \(q_{sens}\)

Для показника \(q_{sens}\) спостерігається спад у передкризові періоди, що вказує на особливу чутливість ринку саме в ці моменти часу. Для повністю ідентичних та незалежно розподілених значень \(q_{sens}\) залишався б на рівні 1. У передкризові стани \(q_{sens}\) прямує до від’ємних значень, що говорить про конвергенцію атрактора системи до сингулярності, тобто збіжність траєкторій один до одного.

10.2.4 Розрахунок ентропії Тсалліса

window = 250    # розмір вікна
tstep = 1       # крок вікна
ret_type = 1    # вид ряду: 
                # 1 - вихідний, 
                # 2 - детрендований (різниця між теп. значенням та попереднім)
                # 3 - прибутковості звичайні, 
                # 4 - стандартизовані прибутковості, 
                # 5 - абсолютні значення (волатильності)
                # 6 - стандартизований ряд

length = len(time_ser)

tsallis_en = []

for i in tqdm(range(0,length-window,tstep)):
    
    fragm = time_ser.iloc[i:i+window].copy()  # відбираємо фрагмент

    fragm = transformation(fragm, ret_type)   # виконуємо процедуру 
                                              # трансформації ряду

    p, be = np.histogram(fragm,               # розраховуємо щільність ймовірностей
                        bins='auto', 
                        density=True)  
    r = be[1:] - be[:-1]                      # знаходимо dx
    P = p * r                                 # представляємо ймовірність як f(x)*dx
    P = P[P!=0]                               # фільтруємо по всім ненульовим ймовірностям
    
    tsen, _ = nk.entropy_tsallis(freq=P, 
                                 q=1, 
                                 base=np.exp(1))
    tsen /= np.log(len(P))
    
    tsallis_en.append(tsen)

100%|██████████| 1742/1742 [00:01<00:00, 1212.78it/s]

Зберігаємо отримані результати в текстовому файлі:

name = f"tsen_name={symbol}_ret={ret_type}_wind={window}_step={tstep}.txt"

np.savetxt(name, tsallis_en)

Визначаємо параметри для збереження рисунків:

# позначення ентропії Тсалліса в легенді рисунку 
label_ts_en = r'$TsEn$'  

# назва рисунку
file_name = f"tsen_name={symbol}_ret={ret_type}_wind={window}_step={tstep}"

# колір показника
color = 'purple'

Виводимо результат:

plot_pair(time_ser.index[window:length:tstep],
          time_ser.values[window:length:tstep],
          tsallis_en, 
          ylabel, 
          label_ts_en,
          xlabel,
          file_name,
          color)

Рис. 10.7: Порівняльна динаміка коливань ціни індексу Доу Джонса та ентропії Тсалліса

З Рис. 10.7 видно, що неекстенсивна ентропія Тсалліса спадає в передкризові періоди, що вказує на зростання ступеня неадитивності (самоорганізованої динаміки) ринку.

10.3 Висновок

У даній лабораторній роботі було представлено неекстенсивний підхід статистичної механіки до динаміки щоденних історичних значень ціни Доу Джонса та його прибутковостей. Встановлено, що індекс Доу Джонса підпорядковується статистиці Тсалліса. Було промодельовано часову динаміку \(q\)-триплету, що дало можливість при співставленні з вихідним часовим рядом отримати реакцію компонентів триплету на формування та протікання кризових явищ. Величина \(q_{stat}\) у періоди криз зростає, оскільки зростають власне цінові флуктуації. Значення \(q_{rel}\) зростає у передкризові періоди, що, очевидно, зумовлено переходом системи в нерівноважний стан і подальшою релаксацією. Нарешті, \(q_{sens}\) має мінімальне значення в передкризовий період, вказуючи на особливу чутливість системи поблизу точки біфуркації, якою і є сама криза.

Перспективним представляється дослідження особливостей \(q\)-триплету для складних мережних структур, що отримуються при перетворенні часового ряду в мережу одним з відомих методів. Цікавим також є пошук альтернативних компонентів неекстенсивності як, наприклад, міри незворотності часового ряду, чи міри рекурентності тощо. Очевидно, що означені підходи можуть забезпечити необхідний прогрес як на фундаментальному, так і на прикладному рівнях щодо досягнення більш глибокого розуміння природи складних систем.

10.4 Завдання для самостійного виконання

Оберіть часовий ряд згідно вашого варіанту
Побудуйте емпіричний розподіл прибутковостей вашого ряду та теоретичні адитивний і неекстенсивний розподіли Гауса
Побудуйте та проаналізуйте динаміку триплету Тсалліса та неекстенсивної ентропії для кризових подій
Сформуйте звіт і зробіть висновки

[1]

A. Bielinskyi, S. Semerikov, O. Serdyuk, V. Solovieva, V.N. Soloviev, L. Pichl, Econophysics of sustainability indices, in: A. Kiv (Ed.), Proceedings of the Selected Papers of the Special Edition of International Conference on Monitoring, Modeling & Management of Emergent Economy (M3E2-MLPEED 2020), Odessa, Ukraine, July 13-18, 2020, CEUR-WS.org, 2020: pp. 372–392. https://ceur-ws.org/Vol-2713/paper41.pdf.

[2]

G. Nicolis, I. Prigogine, W.H. Freeman, Company, Exploring complexity: An introduction, W.H. Freeman, 1989.

[3]

C. Tsallis, Possible generalization of boltzmann-gibbs statistics, Journal of Statistical Physics 52 (1988) 479–487. https://doi.org/10.1007/BF01016429.

[4]

C. Tsallis, Dynamical scenario for nonextensive statistical mechanics, Physica A: Statistical Mechanics and Its Applications 340 (2004) 1–10. https://doi.org/10.1016/j.physa.2004.03.072.

[5]

C. Tsallis, M. Gell-Mann, Y. Sato, Asymptotically scale-invariant occupancy of phase space makes the entropy <i>s<sub>q</sub></i> extensive, Proceedings of the National Academy of Sciences 102 (2005) 15377–15382. https://doi.org/10.1073/pnas.0503807102.

[6]

C. Tsallis, Economics and finance: Q-statistical stylized features galore, Entropy 19 (2017). https://doi.org/10.3390/e19090457.

[7]

C. Tsallis, Beyond boltzmann–gibbs–shannon in physics and elsewhere, Entropy 21 (2019). https://doi.org/10.3390/e21070696.

[8]

E.G. Pavlos, O.E. Malandraki, O.V. Khabarova, L.P. Karakatsanis, G.P. Pavlos, G. Livadiotis, Non-extensive statistical analysis of energetic particle flux enhancements caused by the interplanetary coronal mass ejection-heliospheric current sheet interaction, Entropy 21 (2019). https://doi.org/10.3390/e21070648.

[9]

R. de Oliveira, S. Brito, L. da Silva, C. Tsallis, Connecting complex networks to nonadditive entropies, Scientific Reports 11 (2021) 1130.

[10]

G. Pavlos, A. Iliopoulos, L. Karakatsanis, M. Xenakis, E. Pavlos, Complexity of economical systems., Journal of Engineering Science & Technology Review 8 (2015). https://www.academia.edu/download/37828856/Complexity_of_Economical_Systems.pdf.

[11]

G.L. Ferri, M.F. Reynoso Savio, A. Plastino, Tsallis’ q-triplet and the ozone layer, Physica A: Statistical Mechanics and Its Applications 389 (2010) 1829–1833. https://doi.org/https://doi.org/10.1016/j.physa.2009.12.020.

[12]

S. Umarov, C. Tsallis, S. Steinberg, On aq-central limit theorem consistent with nonextensive statistical mechanics, Milan Journal of Mathematics 76 (2008) 307–328. https://doi.org/10.1007/s00032-008-0087-y.

[13]

C. Anteneodo, C. Tsallis, Breakdown of exponential sensitivity to initial conditions: Role of the range of interactions, Phys. Rev. Lett. 80 (1998) 5313–5316. https://doi.org/10.1103/PhysRevLett.80.5313.

[14]

C. TSALLIS, Some open problems in nonextensive statistical mechanics, International Journal of Bifurcation and Chaos 22 (2012) 1230030. https://doi.org/10.1142/S0218127412300303.

[15]

D. Stosic, D. Stosic, T.B. Ludermir, T. Stosic, Nonextensive triplets in cryptocurrency exchanges, Physica A: Statistical Mechanics and Its Applications 505 (2018) 1069–1074. https://doi.org/https://doi.org/10.1016/j.physa.2018.04.066.

[16]

A.O. Bielinskyi, A.V. Matviychuk, O.A. Serdyuk, S.O. Semerikov, V.V. Solovieva, V.N. Soloviev, Correlational and non-extensive nature of carbon dioxide pricing market, in: O. Ignatenko, V. Kharchenko, V. Kobets, H. Kravtsov, Y. Tarasich, V. Ermolayev, D. Esteban, V. Yakovyna, A. Spivakovsky (Eds.), ICTERI 2021 Workshops, Springer International Publishing, Cham, 2022: pp. 183–199. https://doi.org/10.1007/978-3-031-14841-5_12.