ISSN 2225-7551

О.В. Кувшинов, д-р техн. наук

Національний технічний університет України “КПІ”, м. Київ, Україна

С.В. Зайцев, канд. техн. наук

Чернігівський державний технологічний університет, м. Чернігів, Україна

математична модель системи РАДІОЗВ’ЯЗКУ на базі теорії ігор

Розглядається задача функціонального аналізу системи радіозв’язку під час впливу навмисних завад. Запропонована математична модель адаптивної системи радіозв’язку, яка діє в умовах активної радіоелектронної протидії та апріорної невизначеності щодо умов ведення зв’язку, сигнальної та завадової обставин. Модель доповнена ігровим підходом, який враховує різноманітність і ефективність стра­тегій в умовах невизначеності.

Вступ

Провідні країни світу приділяють велику увагу розробці та удосконаленню систем та засобів радіоелектронної боротьби [1-3]. Засоби радіоелектронного придушення (РЕП), що знаходяться на їх озброєнні, здатні з високою ефективністю та у короткий час подавити систему радіозв’язку, побудовану на традиційних принципах. Враховуючі це, стає досить складним завдання забезпечення стійкого радіозв’язку в умовах РЕП. Успішне її вирішення неможливе без застосування спеціальних технічних і організаційних заходів по забезпеченню завадозахищеності систем радіозв’язку.

Процес функціонування системи радіозв’язку (СРЗ) в умовах складної радіоелектронної обстановки з достатнім ступенем точності може бути представлений сукупністю моделей фізичного, канального та мережного рівнів [4; 5]. Для вирішення завдань структурного і функціонального аналізу, а також синтезу алгоритмів функціонування СРЗ необхідно розглянути моделі, що найбільш повно описують об’єкт дослідження та умови його функціонування.

Аналіз досліджень і публікацій

Відомі моделі СРЗ [4-6] дозволяють враховувати умови функціонування СРЗ відповідно до цільової функції. Однак їх недоліком є відсутність алгоритмічного опису адаптивних властивостей, без яких неможливо успішне функціонування СРЗ в умовах стохастичного характеру змін завадової обстановки. В умовах антагоністичної протидії СРЗ і системи РЕП модель адаптивної системи радіозв’язку доцільно доповнити ігровим підходом, який враховує різноманітність і ефективність стра­тегій в умовах невизначеності.

Формулювання цілей статті

Метою даної роботи є розробка математичної моделі системи радіозв’язку під час впливу навмисних завад на базі методів теорії ігор.

Виклад основного матеріалу

Процес передачі інформації може бути поданий як конфлікт між системою радіозв’язку та джерелом завад, оскільки він відповідає формальним ознакам конфлікту. При цьому джерелом завад є середовище поширення сигналів і постановники організованих завад (система РЕП). Під час аналізу роботи системи радіозв’язку часто зручно вважати, що “середовище поширення” також поводиться як розумний супротивник, прагнучи створити якнайгірші умови для зв’язку. Система радіозв’язку і джерело завад мають набір альтернатив – режимів роботи. Вони можуть вплинути на якість процесу передачі інформації, вибравши відповідний режим. Необхідно визначити, як здійснювати цей вибір, тобто сформувати стратегію управління режимами роботи.

Формалізувати опис конфлікту дозволяє теорія ігор. Теорія ігор і її застосування при вирішенні різних задач розглядається в працях учених [7-9]. Оскільки інтереси системи радіозв’язку і джерела завад прямо протилежні і немає причин для узгодження їх дій, застосуємо апарат скінченних матричних антагоністичних ігор.

Реальний конфлікт може моделюватися скінченною антагоністичною грою, якщо він відповідає наступним умовам [7]:

  • конфлікт визначається антагоністичною взаємодією двох сторін, кожна з яких має лише скінченну кількість можливих дій;
  • свої дії сторони роблять незалежно одна від одної, тобто кожна з них не має інформації про дію, що здійснюється іншою стороною. Результат цих дій оцінюється дійсним числом, яке визначає корисність ситуації, що склалася для однієї із сторін. Через антагоністичність конфлікту можна вважати, що корисність такої ситуації для іншої сторони дорівнює цьому числу, узятому з від’ємним знаком;
  • кожна з конфліктуючих сторін оцінює як для себе, так і для супротивника корисність будь-якої можливої ситуації, яка може скластися в результаті їх взаємодії;
  • дії конфліктуючих сторін за своєю природою є нерозчленованими й однократними, тобто структура кожного з них не має формальних відмінних властивостей. Це дозволяє інтерпретувати дії сторін як елементи деяких абстрактних множин, відрізняючи різні дії одної від іншої лише за ступенем корисності ситуації, що склалася.

Апарат скінченних антагоністичних ігор може бути використаний у тих випадках, коли система зв’язку і джерело завад мають скінченний набір режимів роботи, наприклад, декілька градацій потужності, обмежений набір робочих частот, сигнально-кодових конструкцій тощо. Можливим є вибір і зміна режиму роботи. При цьому необхідно мати кількісні оцінки ситуацій, що відповідають всім можливим режимам, які вибираються учасниками конфлікту.

Нехай СРЗ відомий час, за який система РЕП зможе оцінити обстановку, прийняти рішення і змінити свої робочі параметри. В цьому випадку обидва учасники конфлікту здійснюватимуть зміну режиму, не маючи відомостей про дії протилежної сторони.

Таким чином, при відзначених припущеннях процес передачі може бути описаний у вигляді скінченної, антагоністичної, багатокрокової, динамічної в дискретному часі гри

 

Г = <F, SСРЗ, SРЕП>,                                                    (1)

 

де SСРЗ - множина можливих режимів роботи, а значить, і дій гравця 1; SРЕП - множина можливих режимів роботи (дій) гравця 2; F - функція виграшу гравця 1.

Гравцем 1 є СРЗ, а гравцем 2 - джерело завад (система РЕП та середовище поширення). У термінології теорії ігор множини SСРЗ і SРЕП називаються множинами стратегій гравця 1 і гравця 2 відповідно. Елементи цих множин називаються чистими стратегіями гравців.

Кожну зі стратегій можна пронумерувати і надалі вважати, що SСРЗ = [0, 1, ..., n - 1], SРЕП = {0,1, ..., m - 1}, де n і m - кількість чистих стратегій гравців. Тоді значення функції F легко представити у вигляді матриці виграшів:

 

F = [fij], fij = F(i, j), 0 ≤ i ≤ n - 1, 0 ≤ j ≤ m - 1,                               (2)

 

де fij - виграш гравця 1 при виборі ним i-ї чистої стратегії, якщо гравець 2 обере j-у чисту стратегію.

Антагоністичні ігри є іграми з нульовою сумою, оскільки виграш гравця 2 дорівнює виграшу гравця 1, узятому зі зворотним знаком, тобто його програшу. Поняття виграшу і програшу дещо умовні, оскільки величина fij може бути від’ємною.

Під час гри кожен гравець намагається максимізувати свій виграш за рахунок програшу іншого гравця. При знаходженні оптимальних стратегій гравців рішення задачі зводиться до знаходження рівноважної ситуації:

 

,                                       (3)

 

де Ф(.) - функція виграшу при різних стратегіях сторін для (b, а);  а*, b* - оптимальні стратегії сторін; а Î SСРЗ, b Î SРЕП.

Структурна схема ігрової моделі зображена на рис. 1, де a = (a1, a2, …an) - вектор оптимальних стратегій СРЗ; b = (b1, b2, …bm) - вектор оптимальних стратегій системи РЕП; DtСРЗ - час реакції системи радіозв’язку; DtРЕП - час реакції системи РЕП.

 


Для знаходження оптимальних стратегій управління в рівноважній ситуації може бути застосована відома в теорії ігор теорема про достатні умови існування оптимальних чистих стратегій в антагоністичній матричній грі [7; 8].

Якщо рішень у чистих стратегіях не існує, то матрична гра має рішення в змішаних стратегіях. У цьому випадку знаходження квазіоптимальної стратегії (стратегій) у тій або іншій ігровій ситуації полягатиме у визначенні математичного очікування дискретної випадкової величини на двовимірній щільності розподілу ймовірності застосування чистих стратегій СРЗ і системи РЕП. При великій розмірності ігрових матриць такі розподіли можуть мати полімодальний характер, що ускладнює завдання.

Якщо, наприклад, один гравець застосовує свої чисті стратегії  ймовірностями , то його фіксована змішана стратегія є цим набором ймовірностей, і його можна позначити буквою Р, тобто

 

,                                                           (4)

 

де п – кількість чистих стратегій даного гравця.

Аналогічно для іншого гравця фіксована змішана стратегія:

 

.                                                          (5)

 

Якщо один гравець застосовує змішану оптимальну стратегію Р, інший – Q, то математичне очікування виграшу гравця 1:

 

                                  (6)

 

Вираз (6) можна перетворити, внаслідок чого одержимо математичне очікування виграшу гравця 1 при використанні обома гравцями фіксованих змішаних стратегій Р і Q відповідно:

                                                 (7)

 

Якщо позначити

 

як дві довільні змішані стратегії відповідно гравців 1 і 2, то:

 

                                               (8)

 

буде математичним очікуванням виграшу гравця 1, що використовує стратегію , за умови, що гравець 2 використовує стратегію Q.

При використанні гравцем 1 стратегії Р, а гравцем 2 стратегії , математичне очікування виграшу стратега 1:

 

                                           (9)

 

Отже, якщо визначити  виразами (6), (8), (9) відповідно і, крім того,

 

,                                                      (10)

 

то Р і Q називаються оптимальними змішаними стратегіями відповідно стратегів 1 і 2.

Для існування рівноваги в змішаних стратегіях достатніми умовами є безперервність функції виграшу і компактність множин стратегій SСРЗ і SРЕП. Цих умов достатньо для існування рівноважної ситуації за Нешем [10]. Необхідність у змішаних стратегіях може виникати, наприклад, якщо обидві сторони (СРЗ і система РЕП) мають недостатню інформованість про застосування тих або інших стратегій у різних ігрових ситуаціях.

У процесі багатокрокової гри при накопиченні стратегій з однієї та іншої сторони зростання розмірності ігрових матриць призводить до експоненціального зростання кількості елементарних обчислювальних операцій, що веде до неприпустимого зростання тривалості циклу управління і зниження коефіцієнта адаптації ka стосовно функції виграшу СРЗ:

 

ka(t) = ,                                                      (11)

 

де ka - коефіцієнт адаптації, усереднений по всіх інформаційних напрямах СРЗ (показник якості управління);  - час реакції, відповідно СРЗ і джерела завад (системи РЕП), який дорівнює тривалості циклів управління; a - коригувальний і нормуючий множник, що визначає ступінь впливу відношення  на коефіцієнт адаптації. Для зниження розмірності ігрових матриць обидві сторони використовують різні алгоритми [5; 10], які видаляють найменш ефективні і рідко використовувані стратегії за результатами прогнозування. При цьому результат гри багато в чому залежатиме від ступеня інформованості сторін про ймовірність використання тієї або іншої стратегії супротивника [5; 7; 8]. Чисельно ступінь інформованості сторін може бути виражена у вагових коефіцієнтах інформованості:  і , відповідно, СРЗ і системи РЕП. Показник  відповідає повній інформованості про гру.

Якщо гра, зважаючи на обмежену кількість стратегій, залишається невизначеною, може знадобитися розширення множин допустимих стратегій одного або кожного з гравців так, щоб нова гра стала визначеною: SСРЗ(t) = SВСРЗ(t - 1)+{аi+1…аi+m}, SРЕП(t) = SРЕП(t - 1)+{bj+1…bj+n}, де , причому в цьому зацікавлені обидві сторони, оскільки ймовірність виграшу сторони з великою кількістю стратегій вище.

Необхідність розширення числа допустимих стратегій і переходу від  до розширеної матриці  виникає за умови, що  де  - допустиме значення відносних втрат в циклі t (для СРЗ, наприклад, ймовірність помилкового прий­мання сигналів).

Підвищення інформованості сторін у результаті аналізу всієї попередньої інформації про вживані стратегії і їх ефективність у різних умовах сприяє реалізації процесу довготривалого прогнозування.

Одна з найважливіших переваг прогнозування полягає в тому, що цей процес може проходити паралельно з рішенням поточної ігрової ситуації. Тому він не здійснює прямого впливу на збільшення тривалості поточного циклу управління, в той же час прямо і побічно сприяє її скороченню на подальших циклах.

У класичній постановці матриця гри може бути задана табличним способом (табл. 1). Особливість полягає в принципах формування елементів матриці.

При розв’язанні гри в чистих стратегіях у якості елементів стовпців і рядків S виступають стратегії СРЗ і системи РЕП: ; , на перетині яких знаходиться відповідний їм відносний показник модифікованого виграшу СРЗ . Елементи матриці S отримують в результаті перемноження однойменних елементів двох матриць - матриці  прогнозованого відносного виграшу від взаємного використання стратегій СРЗ і системи РЕП в циклі t + 1 і кореляційної матриці , що має елементи вигляду:

 

                               (12)

 

з урахуванням нормуючого коефіцієнта kN, коефіцієнта важливості kв, коефіцієнта адаптації ka і коефіцієнта помилки прогнозування kпр:

 

                                               (13)

Таблиця 1

Матриця гри

SСРЗ

SРЕП

b1

b2

bj

ФСРЗ

а1

Ф11

Ф12

Ф1j

а2

Ф21

Ф22

Ф2j

а3

Ф31

Ф32

Ф3j

а4

Ф41

Ф42

Ф4j

аj

Фi1

Фi2

Фij

ФРЕП

 

 

 

Завдяки нормуючому коефіцієнту kN, який може змінюватися на кожному кроці гри і в процесі обчислень, формуються також вектори ймовірностей збереження поточного і переходу в подальші стани ВСРЗ  що необхідно для формування змішаних стратегій у разі неможливості або недоцільності рішення гри в чистих стратегіях. У найпростішому випадку  При цьому в момент оцінки забезпечується  що відповідає сумі ймовірностей несумісних подій і є однією з визначальних умов ланцюгів Маркова. Елемент  - ймовірність збереження поточної стратегії СРЗ в черговому циклі управління. Переходи з попереднього в подальший стан можуть бути описані апаратом неоднорідних марківських ланцюгів з дискретними станами в дискретному часі. Коефіцієнт важливості kв задається на кожному циклі t. Він визначає ступінь важливості даного циклу управління при виконанні цільової функції. Якщо припустити, що  то  де  - коефіцієнт короткочасного прогнозування в циклі (t + 1).

Висновки

Таким чином, відповідно до марківського підходу враховується передісторія поточного процесу, що виражається в оцінці крутизни характеристики відносного виграшу для прогнозування подальших кроків. Значення  можуть бути розраховані, виходячи з передбачуваних стратегій і відповідних їм можливостей СРЗ і системи РЕП.

Одним з можливих рішень ігор у змішаних стратегіях є збільшення швидкості реакції (зниження часу адаптації) однієї зі сторін, що дозволяє підвищити результативність використання стратегій.

Запропонована ігрова математична модель функціонування СРЗ може бути застосована на етапі ідентифікації адаптивної СРЗ під час реалізації механізму захисту від навмисних завад.

 

Список використаних джерел

1. Кондратьев А. Перспективный комплекс РРТР и РЭВ сухопутных войск США „Профет” / Кондратьев А. // Зарубежное военное обозрение. - 2008. - № 7. - С. 22-28.

2. Азов В. О реализации в США концепции ведения военных действий в едином информационном пространстве / Азов В. // Зарубежное военное обозрение. - 2004. - №6. - с. 10-17.

3. Стрелецкий А. Американский перспективный наземный комплекс ведения радиоэлектронной войны „Вулфпак” / Стрелецкий А. // Зарубежное военное обозрение. - 2002. - № 10. - с. 27-28.

4. Голяницкий И.А. Математические модели и методы в радиосвязи / Голяницкий И.А.; под ред. Ю.А. Громакова. - М.: Эко-Трендз, 2005. - 440 с.

5. Григорьев В. А. Сети и системы радиодоступа / В. А. Григорьев, О. И. Лагутенко, Ю. А. Распаев. - М.: Око-Трендз, 2005. - 384 с.

6. Цыпкин Я. З. Адаптация и обучение в автоматических системах / Цыпкин Я. З. – М.: Наука, 1968. – 400 с.

7. Оуэн Г. Теория игр / Оуэн Г. - М.: Мир, 1971. – 230 с.

8. Петросян Л. Теория игр / Л. А. Петросян, Н. А. Зенкевич, Е. А. Семина. - М.: Высшая школа, 1998. – 304 с.

9. Стеклов В. К. Оптимізація та моделювання пристроїв і систем зв’язку: підручник для вищ. навч. закл. / Стеклов В. К. - К.: Техніка, 2004. - 576 с.