Бази знань як сучасні інтелектуальні інформаційні системи

Санкт-Петербурзький державний

ІНЖЕНЕРНО-ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ

РЕФЕРАТ

Бази знань як сучасні інтелектуальні інформаційні системи

Санкт-Петербург

2009

Зміст

Введення

1 Загальні положення

1.1 Класифікація баз знань

1.2 Застосування бази знань

2 Інтелектуальна інформаційна система

2.1 Класифікація завдань, вирішуваних ІІС

3 Бази знань в інтелектуальній системі

3.1 Машинне навчання

3.1.1 Загальна постановка задачі навчання по прецедентах

3.1.2 Способи машинного навчання

3.1.3 Класичні завдання вирішуються за допомогою машинного навчання

3.1.4 Типи вхідних даних при навчанні

3.1.5 Типи функціоналів якості

3.1.6 Практичні сфери застосування

3.2 Автоматичне доведення

Введення

База знань, БЗ (англ. Knowledge base, KB) - це особливого роду база даних, розроблена для управління знаннями (метаданими), тобто збором, зберіганням, пошуком і видачею знань. Розділ штучного інтелекту, що вивчає бази знань і методи роботи зі знаннями, називається інженерією знань.

Під базами знань розуміється сукупність фактів і правил виводу, що допускають логічний висновок і осмислену обробку інформація. Наприклад, у мові Пролог бази знань описуються у формі конкретних фактів і правил логічного висновку над базами даних і процедурами обробки інформації, які подають відомості та знання про людей, предмети, факти події та процеси в логічній формі.

Найбільш важливою властивістю інформації, що зберігається в базах знань, є достовірність конкретних і узагальнених відомостей у базі даних і релевантності інформації, одержуваної з використанням правил виведення, закладених в базу знань. У відповідях на найпростіші запити до баз знань системи логічного програмування Пролог, видає значення «істина» і «брехня» залежно від наявності відповідних фактів.

Узагальнені відомості в мові Пролог задаються за допомогою правил логічного висновку, що виконують роль визначення понять, а також логічних процедур, які складаються з наборів правил логічного висновку. Достовірність узагальнених відомостей залежить від наявності необхідних фактів та достовірності даних у базах знань.

Найбільш важливий параметр БЗ - якість знань. Кращі БЗ містять релевантну, достовірну і свіжу інформацію, мають довершені системи пошуку інформації і ретельно продуману структуру і формат знань.

1. Загальні положення

1.1 Класифікація баз знань

Залежно від рівня складності систем, в яких застосовуються бази знань, розрізняють:

1) БЗ всесвітнього масштабу - наприклад, Інтернет чи Вікіпедія

2) БЗ національні - наприклад, Вікіпедія

3) БЗ галузеві наприклад, автомобільної енциклопедії

4) БЗ організацій

5) БЗ експертних систем

6) БЗ фахівців

1.2 Застосування бази знань

Прості бази знань можуть використовуватися для створення експертних систем і зберігання даних про організації: документації, інструкцій, статей технічного забезпечення. Головна мета створення таких баз - допомогти менш досвідченішим людям знайти існуючий опис способу вирішення якої-небудь проблеми предметної області.

Онтологія може служити для представлення в базі знань ієрархії понять і відношень. Онтологія, яка ще і екземпляри об'єктів не що інше, як база знань.

База знань - важливий компонент інтелектуальної системи. Найбільш відомий клас таких програм - експертні системи. Вони призначені для знаходження способу вирішення специфічних проблем, базуючись на записах БЗ і на користувацькому описі ситуації.

Створення і використання систем штучного інтелекту потребує величезних баз знань.

2. Інтелектуальна інформаційна система

Інтелектуальна інформаційна система (ІІС) - це один з видів автоматизованих інформаційних систем, інколи ІІС називають системою, засновану на знаннях. ІІС є комплексом програмних, лінгвістичних і логіко-математичних засобів для реалізації основного завдання: здійснення підтримки діяльності людини і пошуку інформації в режимі розширеного діалогу на природній мові.

ІІС можуть розміщуватися на якому-небудь сайті, де користувач ставить системі питання на природній мові (якщо це запитально-відповідальна система) або, відповідаючи на питання системи, знаходить необхідну інформацію (якщо це експертна система). Але, як правило, ЕС в інтернеті виконують рекламно-інформаційні функції (інтерактивні банери), а серйозні системи (такі, як, наприклад, ЕС діагностику устаткування) використовуються локально, оскільки виконують конкретні специфічні завдання.

Інтелектуальні пошукові системи відрізняються від віртуальних співбесідників тим, що вони досить безликі і у відповідь на питання видають деякий витяг з джерел знань (іноді досить великого обсягу), а співбесідники володіють «характером», особливою манерою спілкування (можуть використовувати сленг, ненормативну лексику), і їх відповіді мають бути гранично лаконічними (іноді навіть просто у формі смайликів, якщо це відповідає контексту :-)).

Для розробки ІІС раніше використовувалися логічні мови (Пролог, Лісп і т. д.), а зараз використовуються різні процедурні мови. Логіко-математичне забезпечення розробляється як для самих модулів систем, так і для стикування цих модулів. Однак на сьогоднішній день не існує універсальної логіко-математичної системи, яка могла б задовольнити потреби будь-якого розробника ІІС, тому доводиться або комбінувати накопичений досвід, або розробляти логіку системи самостійно. В області лінгвістики теж існує безліч проблем, наприклад, для забезпечення роботи системи в режимі діалогу з користувачем на природній мові необхідно закласти в систему алгоритми формалізації природної мови, а це завдання виявилося куди складнішим, ніж передбачалося на зорі розвитку інтелектуальних систем. Ще одна проблема - постійна мінливість мови, яка обов'язково повинна бути відбита в системах штучного інтелекту.

2.1 Класифікація завдань, вирішуваних ІІС

1) Інтерпретація даних. Це одна з традиційних завдань для експертних систем. Під інтерпретацією розуміється процес визначення змісту даних, результати якого мають бути погодженими і коректними. Зазвичай передбачається багатоваріантний аналіз даних.

2) Діагностика. Під діагностикою розуміється процес співвідношення об'єкту з деяким класом об'єктів і виявлення несправності в деякій системі. Несправність - це відхилення від норми. Таке трактування дозволяє з єдиних теоретичних позицій розглядати і несправність устаткування в технічних системах, і захворювання живих організмів, і всілякі природні аномалії. Важливою специфікою є тут необхідність розуміння функціональної структури («анатомії») діагностуючої системи.

3) Моніторинг. Основне завдання моніторингу - безперервна інтерпретація даних в реальному масштабі часу і сигналізація про вихід тих або інших параметрів за допустимі межі. Головні проблеми - «пропуск» тривожної ситуації і інверсна завдання «помилкового» спрацьовування. Складність цих проблем в розмитості симптомів тривожних ситуацій і необхідність обліку тимчасового контексту.

4) Проектування. Проектування полягає в підготовці специфікацій на створення «об'єктів» із заздалегідь визначеними властивостями. Під специфікацією розуміється весь набір необхідних документів - креслення, пояснювальна записка і т.д. Основні проблеми тут - здобуття чіткого структурного опису знань про об'єкт і проблема «сліду». Для організації ефективного проектування і в ще більшому ступені перепроектування необхідно формувати не лише самі проектні рішення, але і мотиви їх прийняття. Таким чином, в завданнях проектування тісно зв'язуються два основні процеси, виконуваних в рамках відповідної ЕС: процес виведення рішення і процес пояснення.

5) Прогнозування. Прогнозування дозволяє передбачати наслідки деяких подій або явищ на підставі аналізу наявних даних. Прогнозують системи логічно виводять вірогідні наслідки з заданих ситуацій. У прогнозуючій системі зазвичай використовується параметрична динамічна модель, в якій значення параметрів «підганяються» під задану ситуацію. Виводяться з цієї моделі, складають основу для прогнозів з ймовірними оцінками.

6) Планування. Під плануванням розуміється знаходження планів дій, що відносяться до об'єктів, здатних виконувати деякі функції. У таких ЕС використовуються моделі поведінки реальних об'єктів з тим, щоб логічно вивести наслідки планованої діяльності.

7) Навчання. Під навчанням розуміється використання комп'ютера для навчання деякої дисципліни або предмету. Системи вчення діагностують помилки при вивченні якої-небудь дисципліни за допомогою ЕОМ і підказують правильні рішення. Вони акумулюють знання про гіпотетичного «учня» і його характерних помилках, потім в роботі вони здатні діагностувати слабкості в пізнаннях учнів і знаходити відповідні засоби для їх ліквідації. Крім того, вони планують акт спілкування з учнем залежно від успіхів учня з метою передачі знань.

8) Управління. Під керуванням розуміється функція організованої системи, що підтримує певний режим діяльності. Такого роду ЕС здійснюють управління поведінкою складних систем відповідно до заданих специфікацій.

9) Підтримка прийняття рішень. Підтримка прийняття рішень - це сукупність процедур, що забезпечує особу, яка приймає рішення, необхідною інформацією і рекомендаціями, що полегшують процес ухвалення рішення. Ці ЕС допомагають фахівцям вибрати і сформувати потрібну альтернативу серед безлічі виборів при ухваленні відповідальних рішень.

У загальному випадку всі системи, засновані на знаннях, можна підрозділити на системи, що вирішують завдання аналізу, і на системи, які вирішують завдання синтезу. Основна відмінність завдань аналізу від завдань синтезу полягає в тому, що якщо в завданнях аналізу безліч рішень може бути перераховане і включене в систему, то в завданнях синтезу безліч рішень потенційно не обмежена і будується з вирішень компонент або проблем. Завданнями аналізу є: інтерпретація даних, діагностика, підтримка ухвалення рішення; до завдань синтезу відносяться проектування, планування, управління. Комбіновані: навчання, моніторинг, прогнозування.

3. Бази знань в інтелектуальній системі

Нижче перераховані цікаві особливості, які можуть (але не зобов'язані) бути в інтелектуальній системі, і які стосуються баз знань.

1) Машинне навчання: Це модифікація своєї БЗ в процесі роботи інтелектуальної системи, адаптація до проблемної області. Аналогічна можливості людини "набиратися досвіду".

2) Автоматичне доведення (висновки) Здатність системи виводити нові знання із старих, знаходити закономірності в БЗ. Деякі автори вважають, що БЗ відрізняється від бази даних наявністю механізму виведення.

3) Інтроспекція: Знаходження протиріч, нестиковок в БЗ, відслідковування правильної організації і БЗ.

4) Доведення висновку: Здатність системи "пояснювати" хід її думок при знаходження вирішення задачі, причому на першу вимогу ».

3.1 Машинне навчання

Машинне навчання (англ. Machine Learning) - великий підрозділ штучного інтелекту, що вивчає методи побудови алгоритмів, здатних навчатися. Розрізняють два типи навчання. Навчання по прецедентах, або індуктивне навчання, засноване на виявленні закономірностей в емпіричних даних. Дедуктивне навчання передбачає формалізацію знань експертів і їх перенесення в комп'ютер у вигляді бази знань. Дедуктивне навчання прийнято відносити до області експертних систем, тому терміни машинне навчання і навчання по прецедентах можна вважати синонімами.

Машинне навчання знаходиться на стику математичної статистики, методів оптимізації та дискретної математики, але має також і власну специфіку, пов'язану з проблемами обчислювальної ефективності і перенавчання. Багато методів індуктивного навчання розроблялися як альтернатива класичним статистичним підходам. Багато методи тісно пов'язані з витяганням інформації, інтелектуальним аналізом даних.

3.1.1 Загальна постановка задачі навчання по прецедентах

Є безліч об'єктів (ситуацій) і безліч можливих відповідей (відгуків, реакцій). Існує деяка залежність між відповідями та об'єктами, але вона не відома. Відома лише кінцева сукупність прецедентів - пар «об'єкт, відповідь», звана навчальною вибіркою. На основі цих даних потрібно відновити залежність, тобто побудувати алгоритм, здатний для будь-якого об'єкта видати досить точну відповідь. Для вимірювання точності відповідей певним чином вводиться функціонал якості.

Дана постановка є узагальненням класичних задач апроксимації функцій. У класичних задачах апроксимації об'єктами є дійсні числа або вектори. У реальних прикладних задачах вхідні дані про об'єкти можуть бути неповними, неточними, нечисловими, різнорідними. Ці особливості призводять до великої різноманітності методів машинного навчання.

3.1.2 Способи машинного навчання

Так як розділ машинного навчання, з одного боку, утворився в результаті поділу науки про нейромережах на методи навчання мереж і види топологій архітектури мереж, а з іншого, увібрав в себе методи математичної статистики, то зазначені нижче способи машинного навчання виходять з нейромереж. Тобто базові види нейромереж, такі як перцептрон і багатошаровий перцептрон (а так само їх модифікації) можуть навчатися як з учителем, без вчителя, з підкріпленням, і активно. Але деякі нейромережі і більшість статистичних методів можна віднести тільки до одного зі способів навчання. Тому якщо потрібно класифікувати методи машинного навчання в залежності від способу навчання, то, стосовно нейромереж, не коректно їх відносити до певного виду, а правильніше класифікувати алгоритми навчання нейронних мереж.

1) Навчання з учителем - для кожного прецеденту задається пара «ситуація, необхідну рішення»:

- Метод корекції помилки

- Метод зворотного поширення помилки

2) Навчання без учителя - для кожного прецеденту задається тільки «ситуація», потрібно згрупувати об'єкти в кластери, використовуючи дані про попарному схожості об'єктів, та / або знизити розмірність даних:

- Альфа-система підкріплення

- Гамма-система підкріплення

- Метод найближчих сусідів

3) Навчання з підкріпленням - для кожного прецеденту є пара «ситуація, прийняте рішення»:

4) Активне навчання - відрізняється тим, що учень алгоритм має можливість самостійно призначати наступну досліджувану ситуацію, на якій стане відомий вірну відповідь:

5) Навчання з частковим залученням вчителя (semi-supervised learning) - для частини прецедентів задається пара «ситуація, необхідну рішення», а для частини - тільки «ситуація»

6) Трансдуктівное навчання (transduction) - навчання з частковим залученням вчителя, коли прогноз передбачається робити тільки для прецедентів з тестової вибірки

7) Багатозадачні навчання (multi-task learning) - одночасне навчання групи взаємопов'язаних завдань, для кожної з яких задаються свої пари «ситуація, необхідну рішення»

8) різноманітне навчання (multi-instant learning) - навчання, коли прецеденти можуть бути об'єднані в групи, в кожній з яких для всіх прецедентів є «ситуація», але тільки для одного з них (причому, невідомо якого) є пара «ситуація, потрібного рішення »

3.1.3 Класичні завдання вирішуються за допомогою машинного навчання

- Класифікація як правило, виконується за допомогою навчання з учителем на етапі власне навчання.

- Кластеризація як правило, виконується за допомогою навчання без учителя

- Регресія як правило, виконується за допомогою навчання з учителем на етапі тестування, є окремим випадком завдань прогнозування.

- Зниження розмірності даних та їх візуалізація виконується за допомогою навчання без учителя

- Відновлення щільності розподілу ймовірності по набору даних

- Однокласовій класифікація і виявлення новизни

- Побудова рангових залежностей

3.1.4 Типи вхідних даних при навчанні

- Ознакове опис об'єктів - найбільш поширений випадок.

- Опис взаємин між об'єктами, частіше за все відносини попарного подібності, висловлені за допомогою матриці відстаней, ядер або графа даних

- Тимчасової ряд або сигнал.

- Зображення або відеоряд.

3.1.5 Типи функціоналів якості

При навчанні з учителем - функціонал якості може визначається як середня помилка відповідей. Передбачається, що шуканий алгоритм повинен його мінімізувати. Для запобігання перенавчання в мінімізіруемий функціонал якості часто в явному або неявному вигляді додають регуляризатора.

При навчанні без вчителя - функціонали якості можуть визначатися по-різному, наприклад, як відношення середніх межкластерних і внутрікластерних відстаней.

При навчанні з підкріпленням - функціонали якості визначаються фізичним середовищем, що показує якість пристосування агента.

3.1.6 Практичні сфери застосування

Метою машинного навчання є часткова або повна автоматизація вирішення складних професійних завдань в самих різних областях людської діяльності.

- Машинне навчання має широкий спектр програм:

- Розпізнавання мовлення

- Розпізнавання зображень

- Розпізнавання рукописного введення

- Технічна діагностика

- Медична діагностика

- Прогнозування часових рядів

- Біоінформатика

- Виявлення шахрайства

- Виявлення спаму

- Категоризація документів

- Біржовий технічний аналіз

- Фінансовий нагляд

- Кредитний скоринг

- Пророкування втрати клієнтів

- Хемоінформатика

Сфера застосувань машинного навчання постійно розширюється. Повсюдна інформатизація призводить до накопичення величезних обсягів даних у науці, виробництві, бізнесі, транспорті, охороні здоров'я. Виникаючі при цьому завдання прогнозування, управління та прийняття рішень часто зводяться до навчання по прецедентах. Раніше, коли таких даних не було, ці завдання або взагалі не ставилися, або вирішувалися зовсім іншими методами.

3.2 Автоматичне доведення

Автоматичне доведення-доказ, що реалізовується програмно. В основі лежить апарат математичної логіки. Використовуються ідеї теорії штучного інтелекту. Процес докази грунтується на логіці висловлювань і логіці предикатів.

Логіка висловлювань (або пропозіціональная логіка) - це формальна теорія, основним об'єктом якої служить поняття логічного висловлювання. З точки зору виразності, її можна охарактеризувати як класичну логіку нульового порядку. Логіка висловлювань є найпростішою логікою, максимально близькою до людської логіки неформальних міркувань і відома ще з часів античності.

Логіка першого порядку (обчислення предикатів) - формальне числення, що допускає висловлювання відносно змінних, фіксованих функцій, і предикатів. Розширює логіку висловлювань. У свою чергу є окремим випадком логіки вищого порядку.