Леонід Соломонович Файнзільберг, к.т.н.
Показано, що в умовах обмеженої апріорної інформації синтез ІТ обробки сигналів повинен базуватися на двох етапах: конструюванні потенційно корисних ознак і самоорганізації моделей. Наведено практичні результати, які підтверджують ефективність використання алгоритмів самоорганізації при вирішенні складних прикладних завдань.
Введення.
Запропонований А.Г. Івахненко індуктивний метод самоорганізації моделей складних систем (метод МГУА) досить докладно описаний у роботах [1-4]. Автор даної статті ставиться до тієї численної групи дослідників, які, в силу своєї професійної діяльності, так чи інакше потребують використання методів побудови залежностей за експериментальними даними. Саме тому виникло гостре бажання поділитися своїми міркуваннями про роль і місце алгоритмів самоорганізації МГУА в задачі синтезу інформаційних технологій обробки сигналів, глянувши на ці алгоритми з боку споживача. Іншими словами, виконати роль одного з "зовнішніх критеріїв", хай простить мене школа А.Г. Івахненко за таке вільне тлумачення відомого терміна.
Слід зауважити, що, крім реалізму, у середовищі потенційних споживачів алгоритмів МГУА, побутує як необгрунтований песимізм, так і невиправданий оптимізм (рис. 1). Більш того, надмірні оптимісти нерідко переходять в протилежний табір тільки через перших невдач, отриманих при використанні конкретного алгоритму для вирішення власних проблем.
Зрозуміло, такі протилежні погляду невірні як будь-які крайності і виникають, головним чином, через непорозуміння самої суті алгоритмів МГУА. Зрозуміло, що істина лежить десь між цими судженнями, про що неодноразово говорили самі розробники алгоритмів МГУА.
Рис.1. Вульгаризація ідей самоорганізації моделей
Метою даної статті є спроба продемонструвати реалістичний погляд на можливість використання алгоритмів МГУА при синтезі прикладних інформаційних технологій (ІТ) обробки сигналів різної фізичної природи і на прикладах розв'язання практичних завдань показати переваги даного методу.
Завдання синтезу ІТ обробки сигналу. Під інформаційною технологією будемо розуміти [5] сукупність методів і засобів, об'єднаних у технологічний ланцюжок, на вхід якої надходять вихідні дані (сировина), а на виході утворюється інформаційний продукт, підготовлений відповідно до потреб конкретних користувачів в тій чи іншої предметної області (рис . 2).
Розглянемо таку задачу. Є певний технічний або біологічний об'єкт, про стан Z якого необхідно отримати кількісну та / або якісну інформацію (рис. 3). У першому випадку користувача цікавлять значення інтервальних змінних - компонент вектора , А в другому - значення категоріальної змінної , Що характеризує належність поточного стану об'єкта до одного з класів заданої множини .
Рис.3. Опис стану об'єкта
Існують приклади завдань, коли визначення параметра Z не представляє особливої праці: є достатньо надійні засоби вимірювання (датчики та індикатори), які дозволяють безпосередньо отримати цікаву користувача інформацію про стан об'єкта. Однак досить часто на практиці зустрічаються завдання, коли безпосереднє визначення Z неможливо. Наприклад, агресивність і висока температура середовища перешкоджає створенню датчиків для безпосереднього визначення вмісту вуглецю та інших легуючих елементів в розплавленому металі. Неможливо також при масових обстеженнях визначати стан внутрішніх органів людини на основі прямих (інвазивних) методів діагностики, наприклад методу коронарографії для діагностики захворювань серцево-судинної системи: цей метод досить дорогий і, найголовніше, небезпечний для обстежуваного.
Аналогічні приклади досить часто зустрічаються в техніці, медицині та інших областях програми.
Рішення подібних завдань є головною метою ІТ для непрямого контролю параметрів та діагностики стану об'єкта.
Яку ж робочу гіпотезу розумно покласти в основу синтезу таких технологій?
Припустимо, що при фіксованому значенні Z на виході об'єкта породжується нестаціонарне скалярний або векторне поле (електричне, магнітне, температурне і т.п.). Будемо вважати, що величина цього поля визначається функцією
, (1)
залежить від параметра Z, де - Час, - Точка простору, -Величина поля в цій точці. При вимірі поля (1) у фіксованій точці функція вироджується в функцію часу . Якщо ж датчики для вимірювання поля (1) встановити в кількох точках , То (1) можна представити сукупністю функцій часу
, (2)
представляють собою сигнали на виході датчиків.
Для зручності будемо записувати (2) у вигляді одного співвідношення
, (3)
розуміючи під скалярну функцію часу, якщо сигнал вимірюється в одній точці, або вектор-функцію , Якщо вимірювання поля проводиться в декількох точках.
Оскільки ми припускаємо, що сигнал (3) залежить від стану Z, то з формальної точки зору ІТ, взагалі кажучи, повинна забезпечувати рішення оберненої задачі: потрібно оцінити невідоме значення Z за результатами спостереження сигналу на фіксованому відрізку спостереження (Рис. 4).
Слід, однак, зауважити, що на практиці функція найчастіше невідома. Зазвичай конструктору ІТ доводиться стикатися з досить складними об'єктами і процесами, а знання в даній предметній області слабко структуровані і формалізації піддаються лише окремі фрагменти загальної постановки [6]. Для спрощення вивчення фізичних закономірностей часто розглядають "ідеалізовані" умови, в результаті чого отримані таким способом моделі призводить до значних похибок.
І хоча є всі підстави вважати, що модель виду (1) існує, її одержання тільки на основі фізичних уявлень важко, а іноді й просто неможливо.
Так, наприклад, добре відомо, що електричне і магнітне поле серця, зареєстровані протягом кардіоциклу, несуть інформацію про стан серцево-судинної системи живого організму [7], проте до цього часу не отримано і навряд чи будуть отримані в найближчому майбутньому "хороші" моделі, які адекватно описують процес породження таких полів.
Є всі підстави вважати, що температурне поле, утворене всередині і навколо злитку кристалізується металу, несе інформацію про його механічні властивості і хімічний склад. У той же час, згідно [8], процес кристалізації являє собою тісне переплетення фізико-хімічних (зародження і зростання кристалів, дифузія елементів, коагуляція домішок), гідродинамічних (рух розплаву всередині злитку) і теплових явищ. Складність цих процесів перешкоджає побудови моделі виду (1), адекватно описує формування температурного поля в процесі кристалізації.
Перелік подібних прикладом можна було б продовжити.
Тому модель (1) можна розглядати лише як робочу гіпотезу, що дозволяє обгрунтувати принципову можливість оцінки параметра стану об'єкта за спостережуваними сигналам.
Мабуть, до задачі синтезу ІТ обробки сигналів на сучасному етапі розвитку науки слід підходити не стільки з позицій математичної проблеми, що вимагає формального дозволу, а як до наукової методології вирішення конкретних завдань. При цьому доречно нагадати, що сам термін "технологія" походить від грецького слова "téchnë" (мистецтво, майстерність, вміння), а завдання технології як науки полягає у виявлення закономірностей з метою визначення та використання на практиці найбільш ефективних і економних виробничих процесів [9 ].
Цілком зрозуміло, що алгоритми самоорганізації МГУА, орієнтовані на структурну і параметричну ідентифікацію моделей за експериментальними даними, є одним з елементів таких технологій. Головним достоїнством алгоритмів МГУА, що відрізняє їх від інших методів ідентифікації, є поділ наявних спостережень на дві вибірки: навчальну, по якій проводиться ідентифікація моделей заданого класу структур, і контрольну, забезпечує селекцію моделей оптимальної складності з точки зору деякого зовнішнього критерію.
Роль алгоритмів самоорганізації в ІТ обробки сигналів. Розглянемо три об'єкти різної фізичної природи - розплав железоуглеродістиє металу, серце людини і біологічну рідину (кров, слина і т.п.). Незважаючи на відмінність фізичної природи цих об'єктів, для них правомірна спільна робоча гіпотеза (1): об'єкти породжують сигнали, які мають цінну інформацію про їх стан (рис. 5).
Рис.5. Приклади практичних завдань
Зупинимося спочатку на першому прикладі. Відомо [10], що всяке кристалічне тіло даного хімічного складу має цілком певну температуру плавлення (затвердіння). Саме цей закономірний факт і був покладений нами в основу ІТ "Термограф" для непрямого контролю хімічного складу та прогнозування механічних властивостей ливарних чавунів [11]. Природно, що при реалізації такої технології нам довелося займатися ідентифікацією моделей, що зв'язують вихідні параметри з ознаками термограми.
Беручи до уваги мета даної статті, саме про цей бік завдання варто поговорити більш детально, оскільки саме на цьому прикладі можна продемонструвати "вульгаризацію" ідей МГУА, при якій необгрунтований оптимізм може призвести до невиправданого песимізму.
Для цього гранично спростимо завдання, припустивши, що кінцевого користувача ІТ (металурга) цікавить тільки один технологічний параметр - процентний вміст вуглецю в металі .
Звернемося до рис. 6, в лівій частині якого в координатах температура T (температура) - C (вміст вуглецю) показаний фрагмент відомої діаграми стану Fe-C сплаву. На діаграмі є дві лінії - ліквідусу і солідусу. Вище лінії ліквідусу метал знаходиться в рідкому стані (область L), нижче лінії солідусу - у твердому стані (область S), а між цими лініями - у перехідному стані (область L + S).
Як видно з малюнка, лінія ліквідусу не паралельна осі температур, а значить при зміні змісту вуглецю змінюється температура початку кристалізації металу (температура ліквідусу TL) - чим вищий вміст вуглецю, тим при більш низькій температурі починається процес кристалізації розплаву. Тому невідоме вміст вуглецю C можна визначити по температурі ліквідусу TL
Однак сталь є складним за хімічним складом сплавом і, крім вуглецю, в ній є ще й цілий ряд інших домішок, таких як марганець, кремній, фосфор, сірка та ін, також впливають на температуру ліквідусу. Тому залежність між вмістом вуглецю і температурою ліквідусу, взагалі кажучи, відрізняється від теоретичної залежності, яка випливає з діаграми стану Fe-C сплаву.
Рис.6. Ілюстрація ідеї непрямого контролю З
У той же час виявилося, що якщо скористатися найпростішою моделлю у вигляді лінійного рівняння регресії
, (4)
побудованої для умов конкретного підприємства, то невідоме вміст вуглецю можна побічно оцінити по температурі ліквідусу з досить високою точність (порядку 0.02 абс.% С).
Зрозуміло, така порівняно висока точність може бути досягнута тільки в тій випадку, коли буде правильно визначена сама температура ліквідусу . Однак виникає питання: яким чином визначити температуру ліквідусу?
Природа пішла назустріч у вирішенні цієї проблеми. Справа в тому, що в момент початку кристалізації відбувається екзотермічна реакція - виділення прихованої теплоти кристалізації. Тому, якщо зареєструвати процес охолодження розплаву (див. праву частину рис. 6), то на графіку процесу (Термограмме) при досягненні температури ліквідусу з'являється своєрідний фрагмент у вигляді температурної зупинки (майданчики). Виявивши такий інформативний фрагмент термограмми можна визначити температуру , А потім і процентний вміст вуглецю за моделлю (4).
Припустимо тепер, що нам відома лише перша частина описаних вище закономірностей, тобто тільки гіпотеза про те, що термограмма несе інформацію про цікавить нас параметрі , Але невідомо яким чином. Чи можна в цих умовах скористатися ідеями самоорганізації для відновлення залежності (4) за експериментальними даними?
На перший погляд може здатися, що таке завдання має просте рішення в класі алгоритмів самоорганізації, але в цьому якраз і полягає "вульгаризація" ідеї МГУА!
Нехай у нашому розпорядженні є вибірка термограмм, зареєстрованих для W проб металу, і для кожної такої проби на основі результатів хімічного аналізу відомо точне значення вмісту вуглецю C1, ..., CW. Будемо вважати, що кожна з W термограмм представлена своїми дискретними значеннями .
Оскільки у векторах міститься вся доступна нам інформація про термограмме, то можна вважати значення потенційними регресорів, для яких відомо точне значення відгуку . Іншими словами вважати, що в нашому розпорядженні є вибірка, що містить W точок спостережень, що утворюють матрицю регресорів і W-мірний вектор відгуку (див. таблицю 1).
Здавалося б, маючи таку вибірку, легко можна відновити закономірність (4), задавши клас базисних функцій у вигляді всілякими лінійних структур
Таблиця 1. Гіпотетична вибірка спостережень
№ | Регресорів (Аргументи моделі) | Відгук (Вихід) | ||||
T1 | T2 | T3 | ... | TK | ||
1 | T1 [1] | T2 [1] | T3 [1] | ... | TK [1] | C1 |
2 | T1 [2] | T2 [2] | T3 [2] | ... | TK [2] | C2 |
... | ... | ... | ... | ... | ... | ... |
W | T1 [W] | T2 [W] | T3 [W] | ... | TK [W] | CW |
Насправді ж це не так! Справа в тому, що момент початку кристалізації, визначається безліччю зовнішніх факторів (початковою температурою розплаву, умовами теплообміну і т.п.). А це означає, що для різних спостережень у вибірці, температурі ліквідусу TL будуть відповідати різні номери дискретних значень . Тому цілком очевидно, що без залучення додаткової інформації при скільки завгодно великому обсязі W вибірки неможливо відновити справжню залежність (4) в класі структур (5), оскільки для різних спостережень аргумент істинної залежності (4) - температура TL - буде відповідати різним аргументів моделей ( 5).
До того ж при великих значеннях виникають непереборні обчислювальні проблеми у використанні відомих алгоритмів МГУА, але це вже інші проблеми.
Звідси випливає, що важливим етапом синтезу ІТ обробки сигналів, що передує структурно-параметричної ідентифікації, є перехід від простору спостережень до простору потенційно корисних ознак меншої розмірності ( ), А потім вже етап використання цих ознак в якості аргументів моделей непрямого контролю та діагностики, селектіруемих тим чи іншим алгоритмом самоорганізації на основі навчальної та контрольної вибірок.
Саме такий погляд на роль алгоритмів МГУА при синтезі прикладних ІТ обробки сигналів в умовах обмеженої апріорної інформації видається авторові найбільш реалістичним. Структура інструментальної системи "СІДІГРАФ", що реалізує такий підхід, обговорювалася в роботах [5,12].
Практичні результати. Як вже зазначалося, розглянутий у попередньому розділі приклад оцінки тільки одного змісту вуглецю є спрощеною схемою завдання, яка була покладена в основу синтезу ІТ "Термограф". Виявилося, що використовуючи всього лише інформацію про дискретних значеннях температури в процесі охолодження проби вдається оцінити з прийнятною точністю цілий ряд інших хімічних елементів розплаву (вміст кремнію , Хрому , Фосфору , Марганцю , Та ін), а також прогнозувати механічні властивості металу, зокрема міцність на розтяг і твердість .
Перехід від простору спостережень розмірності до економного простору ознак здійснювався на основі спеціальних обчислювальних процедур, що дозволяють автоматично виділити на термограмме і її першої похідної інформативні фрагменти (див. рис. 7). Межі цих фрагментів (точки) відповідають характерним тепловим ефектів фазових перетворень металу, а саме
А - максимальному тепловому ефекту дендритной кристалізації;
B - максимальної швидкості охолодження після періоду дендритной кристалізації;
C - температурі початку кристалізації евтектики;
D - температурі метастабільного перетворення розплаву;
E - максимальному тепловому ефекту процесу кристалізації евтектики;
F - температурі солідусу розплаву;
G - максимальному зміни швидкості охолодження під час кристалізації евтектики;
H - температурі закінчення кристалізації евтектики;
J - момент часу, при якому температура розплаву стає рівною T = 1050 град С.
Рис.7. Термограмма і її перша похідна
Для кожної із зазначених дев'яти точок визначалася трійка величин , ( ), Що представляють собою момент часу, при якій вона з'явилася, а також значення температури і оцінка її першої похідної в цей момент часу. Тим самим здійснювався перехід від початкового простору спостережень розмірності до економного простору ознак розмірності (Таблиця 2).
Таблиця 2. Потенційно корисні ознаки термограми
ЗНАЧЕННЯ Ознаки | ХАРАКТЕРНІ ТОЧКИ термограмм | ||||||||
A | B | C | D | E | F | G | H | J | |
, C | 22 | 43 | 101 | 159 | 178 | 209 | 267 | 286 | 307 |
, Град C | 1200 | 1186 | 1138 | 1116 | 1119 | 1125 | 1108 | 1083 | 1050 |
, Град / c | -0.20 | -1.11 | -0.59 | 0.00 | 0.27 | 0.00 | -0.75 | -2.02 | -1.30 |
Саме ці ознаки запропоновано використовувати в якості аргументів моделей для непрямої оцінки хімічного складу та прогнозування механічних характеристик ливарного чавуну.
Структурна і параметрична ідентифікація таких моделей проводилося на основі використання двох вибірок термограмм (навчальної та контрольної) з відомими значеннями технологічних параметрів. Побудовані таким чином моделі для умов Куп'янського ливарного заводу мали вигляд:
де - Середньоквадратичне відхилення модельних і точних значень відповідного параметра для спостережень контрольної вибірки.
Аналогічна схема була покладена в основу синтезу інших ІТ обробки сигналів, зокрема, медичних ІТ для діагностики захворювань людини за кривими біохемілюмінісценсіі (БХЛ), електрокардіограмі (ЕКГ) і магнітокардіограмме (МКГ).
На відміну від прийнятого в кардіологічній практиці амплітудно-часового аналізу був запропонований новий підхід до обробки ЕКГ [13-16], заснований на її представленні у фазовому просторі координат. Застосування цього підходу для обробки ЕКГ у 12 стандартних відведеннях дозволило виявити нові діагностичні ознаки для розпізнавання хворих на ревматоїдний артрит з незміненими параметрами ЕКГ згідно з традиційними уявленнями [17].
Одне із завдань досліджень, що проводяться в рамках міжнародного контракту № 01 KX 96115 / 1 з німецькою фірмою LUM GmbH (м. Берлін), була спрямована на вивчення взаємозв'язку параметрів ЕКГ (в тимчасовій області і в фазовому просторі) з параметрами крові, що відображають активність запального процесу. Для вивчення цих залежностей був притягнутий комбінаторний алгоритм МГУА [3]. В якості потенційних регресорів використовувалися 33 показника результатів аналізу венозної крові піддослідних - розгорнутий загальний аналіз, коагулограма, печінкові проби і ревмопроби (таблиця 3).
Таблиця 3. Потенційні регресорів
Позначення | Найменування |
ERY | Еритроцити, x10e12 |
HGB | Гемоглобін, г / л |
COL | Кольоровий показник |
RET | Ретикулоцити,% |
LEU | Лейкоцити, x10e9 |
BAS | Базофіли,% |
EOS | Еозинофіли,% |
PLN | Паличкоядерних нейтрофілів,% |
SGN | Сегментоядерние нейтрофіли,% |
LYM | Лімфоцити,% |
MON | Моноцити,% |
SOE | Швидкість осідання еритроцитів, мм / г |
PTI | Протомбіновий індекс,% |
REC | Час рекальцифікації, сек. |
FIB | Фібрин, мг |
FBG | Фібриноген, мг / л |
BNA | Бета-нафтоловий тест |
ETH | Етаноловий тест |
BIL | Біллірубін загальний, мікромоля / л |
TIM | Тимолова проба |
FRM | Фермоловая проба |
ALT | Аланіновой трансфераза |
AST | Аспаргиновой трансфераза |
MUK | Мукопротеіни |
BEL | Загальний білок, г / л |
ALB | Альбуміни,% |
GLB | Глобуліни,% |
A1G | Aльфа-1 глобулін,% |
A2G | Aльфа-2 глобулін,% |
BGL | Бета-глобулін,% |
GGL | Гамма-глобулін,% |
ASL | Антістрептоміцін-O, МВ / мл |
CRP | C-реактивний протеїн |
У результаті селекції побудовані моделі, що зв'язують показники ЕКГ (відгуки) з вказаними регресорів у вигляді лінійних рівнянь множинної регресії оптимальної складності. Так, наприклад, встановлено, що існують надійні статистичні зв'язки відносних кутів орієнтації усередненої фазової траєкторії ЕКГ у другому стандартному (відгук ) І в п'ятому грудному (відгук ) Відведеннях з параметрами крові. Ці моделі мають вигляд:
де - Коефіцієнтом множинної кореляції, а - Число спостережень.
Висновок. У статті показано, що вульгаризація ідеї методу самоорганізації моделей, викликана непорозуміння його основної суті, може призводити до необгрунтованого песимізму в оцінці практичної цінності алгоритмів МГУА.
Показано, що реалістичний підхід до використання алгоритмів самоорганізації в задачі синтезу ІТ обробки сигналів, заснований на двохетапному вирішенні задачі. Перший етап передбачає перехід від початкового простору спостережень до обгрунтованого набору потенційно корисних ознак (потенційних регресорів) на основі наявної апріорної інформації або розумних евристик. У результаті на другому етапі застосування алгоритмів МГУА дозволяє сконструювати моделі оптимальної складності, що дозволяють побічно оцінювати параметри об'єкта і діагностувати його функціональний стан.
Наведено практичні результати застосування такого підходу, які ще раз підтверджують ефективність розумного використання алгоритмів самоорганізації для вирішення складних прикладних завдань.
Список літератури
Івахненко А.Г. Індуктивний метод самоорганізації моделей складних систем. - К.: Наук. думка, 1982. - 360 с.
Івахненко А.Г., Мюллер І.А. Самоорганізація прогнозуючих моделей .- К.: Техніка, 1984 .- 350 с.
Івахненко А.Г., Степашко В.С. Завадостійке моделювання. - К.: Наук. Думка, 1985 .- 300 с.
Івахненко А.Г., Юрачківська Ю.П. Моделювання складних систем за експериментальними даними .- М.: Радіо і зв'язок, 1987 .- 120 с.
Файнзільберг Л.С. Синтез інформаційних технологій обробки сигналів у задачах непрямого контролю та діагностики / / УСиМ. - 1998. - № 2 .- С. 40-47.
Бєлкін А.В., Левін М.Ш. Прийняття рішень: комбінаторні моделі апроксимації інформації. - М.: Наука, 1990 .- 160 с.
Мурашко В.В., Струтинський О.В. Електрокардіографія .- М.: Медицина, 1991 .- 288 с.
Іванцов Г.П. Теплообмін між злитком і изложницей .- М.: Металлургиздат, 1951 .- 39 с.
Технологія / / Радянський енциклопедичний словник .- М.: Радянська енциклопедія, 1988 .- С. 1330.
Гуляєв А.П. Металознавство .- М.: Металургія, 1966 .- 478 с.
Скуріхін В.І., Файнзільберг Л.С., Потапова Т.П. , Шовковий. Е.А. Система комп'ютерної обробки термограмм .- УСиМ .- 1990 .- № 4 .- С.82-88.
Скуріхін В.І., Файнзільберг Л.С., Потапова Т.П. Інструментальна система "СІДІГРАФ" для синтезу інформаційних технологій обробки сигналів / / УСиМ .- 1996 .- № 6 .- С. 36-45.
Спосіб інтегральної оцінкі поточного стану серцево-судінної системи людини. Патент 24517 (Україна) .- МКИ А 61 В 5 / 024 / Л.С. Файнзільберг .- Заявл. 21.05.98; опубл. 30.10.98 .- Бюл. № 5. - 4 с. мул.
Файнзільберг Л.С. Інформаційна технологія для діагностики функціонального стану оператора / / УСиМ. - 1998, N 4 - С. 40-45.
Fainzilberg L., Potapova T. Computer Analysis and Recognition of Cognitive Phase Space Electro-Cardio Graphic Image / / Proc.of the 6-th Int. Conf. on Computer Analysis of Images and Patterns (Prague, Sept. 1995). - Prague: Springer, 1995. p. 668-673.
Fainzilberg LS Heart Functional State Diagnostic Using Pattern Recognition of Phase Space ECG-Images .- Proceeding of The 6th European Congress on Intelligent Techniques and Soft Computing (EUFIT '98, Aachen, Germany, September 7 - 10, 1998) .- Nr: B -27, Vol. 3, pp 1878-1882.
Файнзільберг Л.С., Клубова А.Ф. , Стаднюк Л.А., Чайковський І.А., Дітмар Лерхе Новий метод аналізу ЕКГ хворих на ревматоїдний артрит / / Український ревматологічний журнал. - 2001, № 2 (4) .- С.48-51.