Забезпечення взаємодії з ЕОМ на природній мові

Забезпечення взаємодії з ЕОМ природною мовою (ПМ) є найважливішим завданням досліджень з штучного інтелекту (ШІ). Бази даних, пакети прикладних програм і експертні системи, засновані на ШІ, вимагають оснащення їх гнучким інтерфейсом для численних користувачів, що не бажають спілкуватися з комп'ютером на штучній мові. У той час як багато фундаментальних проблем в області обробки ПМ (Natural Language Processing, NLP) ще не вирішені, прикладні системи можуть оснащуватися інтерфейсом, розуміючому ЕЯ за певних обмежень.

Існують два види і, отже, дві концепції обробки природної мови:

для окремих пропозицій;

для ведення інтерактивного діалогу.

Природа обробки природної мови

Обробка природної мови - це формулювання та дослідження комп'ютерно-ефективних механізмів для забезпечення комунікації з ЕОМ на ПМ. Об'єктами досліджень є:

власне природні мови;

використання ЕЯ як у комунікації між людьми, так і в комунікації людини з ЕОМ.

Завдання досліджень - створення комп'ютерно-ефективних моделей комунікації на ПМ. Саме така постановка задачі відрізняє NLP від задач традиційної лінгвістики та інших дисциплін, що вивчають ПМ, і дозволяє віднести її до області ШІ. Проблемою NLP займаються дві дисципліни: лінгвістика та когнітивна психологія.

Традиційно лінгвісти займалися створенням формальних, загальних, структурних моделей ПМ, і тому віддавали перевагу тим з них, які дозволяли витягати якнайбільше мовних закономірностей і робити узагальнення. Практично жодної уваги не приділялося питанню про придатність моделей з точки зору комп'ютерну ефективність їх застосування. Таким чином, виявилося, що лінгвістичні моделі, характеризуючи власне мову, не розглядали механізми його породження і розпізнавання. Хорошим прикладом тому служить породжує граматика Хомського, що виявилася абсолютно непридатною на практиці як основи для комп'ютерного розпізнавання ПМ.

Завданням же когнітивної психології є моделювання не структури мови, а його використання. Фахівці в цій області також не надавали великого значення питанню про комп'ютерну ефективність.

Розрізняються загальна й прикладна NLP. Завданням загальної NLP є розробка моделей використання мови людиною, є при цьому комп'ютерно-ефективними. Основою для цього є загальне розуміння текстів, як це мається на увазі в роботах Чарняка, Шенка, Карбонелл та ін Безсумнівно, загальна NLP потребує величезних знань про реальний світ, і велика частина робіт зосереджена на поданні таких знань і їхньому застосуванні при розпізнаванні надходить повідомлення на ПМ . На сьогоднішній день ШІ ще не досяг того рівня розвитку, коли для вирішення подібних завдань у великому обсязі використовувалися б знання про реальний світ, і існуючі системи можна називати лише експериментальними, оскільки вони працюють з обмеженою кількістю ретельно відібраних шаблонів на ПМ.

Прикладна NLP займається зазвичай не моделюванням, а безпосередньо можливістю комунікації людини з ЕОМ на ПМ. У цьому випадку не так важливо, як введена фраза буде зрозуміла з точки зору знань про реальний світ, а важливо витяг інформації про те, чим і як ЕОМ може бути корисною користувачеві (прикладом може служити інтерфейс експертних систем). Крім розуміння ЕЯ, в таких системах важливо також і розпізнавання помилок і їх корекція.

Основна проблема обробки природної мови

Основною проблемою NLP є мовна неоднозначність. Існують різні види неоднозначності:

Синтаксична (структурна) неоднозначність: у фразі Time flies like an arrow для ЕОМ неясно, чи йде мова про час, який летить, або про комах, тобто чи є слово flies дієсловом чи іменником.

Смислова неоднозначність: у фразі The man went to the bank to get some money and jumped in слово bank може означати як банк, так і берег.

Відмінкова неоднозначність: прийменник in в пропозиціях He ran the mile in four minutes / He ran the mile in the Olympics позначає або час, або місце, тобто представлені абсолютно різні відносини.

Референційна неоднозначність: для системи, що не володіє знаннями про реальний світ, буде важко визначити, з яким словом - table або cake - співвідноситься займенник it у фразі I took the cake from the table and ate it.

Літерація (Literalness): у діалозі Can you open the door? - I feel cold ні прохання, ні відповідь виражені нестандартним способом. В інших обставинах на питання може бути отриманий пряма відповідь yes / no, але в даному випадку в питанні імпліцитно висловлено прохання відчинити двері.

Центральна проблема як для загальної, так і для прикладної NLP - дозвіл такого роду неоднозначностей - вирішується за допомогою перекладу зовнішнього представлення на ПМ в якусь внутрішню структуру. Для загальної NLP таке перетворення вимагає набору знань про реальний світ. Так, для аналізу фрази Jack took the bread from the supermarket shelf, paid for it, and left і для коректної відповіді на такі питання, як What did Jack pay for?, What did Jack leave? і Did Jack have the bread with him when he left? необхідні знання про супермаркети, процеси покупки та продажу і деякі інші.

Прикладні системи NLP мають перевагу перед загальними, тому що працюють у вузьких предметних областях. Наприклад, системі, яка використовується продавцями в магазинах по продажу комп'ютерів, не потрібно "роздумувати" над неоднозначністю слова terminals в питанні How many terminals are there in the order?.

Тим не менш, створення систем, що мають можливість спілкування на ПМ в широких областях, можливо, хоча поки результати далекі від задовільних.

Технології аналізу природної мови

Під технологією аналізу ПМ мається на увазі переклад деякого виразу на ПМ у внутрішнє представлення. Фактично всі системи аналізу ЕЯ можуть бути розподілені на такі категорії: підбір шаблона (Pattern Matching), синтаксичний аналіз, семантичні граматики, аналіз за допомогою відмінкових фреймів, "чекай і дивися" (Wait And See), словниковий експертний (Word Expert), конекціоністські , "ковзний" (Skimming) аналіз. Нижче піде мова про деякі найбільш поширених методах, описаних у статті.

Підбір шаблону. Сутність даного підходу полягає в інтерпретації введення в цілому, а не в інтерпретації змісту і структури його окремих складових на більш низькому рівні. При використанні цього методу відбувається порівняння вже наявних у системі шаблонів-зразків з текстом, що надійшов на вхід. Зазвичай шаблони представлені у вигляді простого списку відповідностей між класами висловлень і інтерпретаціями. Іноді вони доповнені семантичними елементами або іншими компонентами більш високого рівня. За таким принципом працює система Еліза, що імітує діалог з психотерапевтом. Насправді система нічого не розуміє, а лише підтримує діалог, порівнюючи репліки пацієнта із шаблонами і присвоєними їм відповідними відповідними репліками, такими, як:

X завжди Y:	Ви можете привести який-небудь приклад?
	Коли?
	Дійсно, завжди?
X Ви Y мене:	Чому Ви думаєте, що я Y Вас?
	Вам подобається думати, що я Y Вас, чи не так?
	Уявіть, що я Y Вас. Що Ви про це думаєте?

У результаті Еліза здатна вести такий діалог:

Пац.:	Люди завжди пильно дивляться на мене.	підбір по 1-му шаблоном з урахуванням завжди
Ел.:	Ви можете привести який-небудь приклад?	перша відповідь по 1-му шаблоном
Пац.:	Наприклад, зараз ти дивишся на мене.	підбір по 2-му шаблоном, Y = дивитись
Ел.:	Чому Ви думаєте, що я дивлюся на Вас?	перша відповідь по 2-му шаблоном
Пац.:	Тому що ти ненавидиш мене.	підбір по 2-му шаблоном, Y = ненавидіти
Ел.:	Вам подобається думати, що я ненавиджу Вас, чи не так? і т.д.	друга відповідь по 2-му шаблоном

Синтаксичний аналіз. При використанні синтаксичного аналізу відбувається інтерпретація окремих частин висловлювання, а не всього висловлювання в цілому. Зазвичай спочатку проводиться повний синтаксичний аналіз, а потім будується внутрішньо подання введеного тексту, або виробляється інтерпретація.

Дерева аналізу і вільно-контекстні граматики. Більшість способів синтаксичного аналізу реалізовано у вигляді дерев. Одна з найпростіших різновидів - вільно-контекстна граматика, що складається з правил типу S = NP + VP або VP = V + NP і що визначає, що ліва частина правила може бути замінена на праву без урахування контексту. Вільно-контекстна граматика широко використовується в машинних мовах, і з її допомогою створено високоефективні методи аналізу. Недолік цього методу - відсутність заборони на граматично неправильні фрази, де, наприклад, підмет не погоджено з присудком у числі. Для вирішення цієї проблеми необхідна наявність двох окремих, паралельно працюючих граматик: однієї - для єдиного, інший - для множини. Крім того, необхідна своя граматика для пасивних пропозицій і т.д. Семантично неправильне пропозиція може породити величезна кількість варіантів розбору, з яких один буде перетворений на семантичну запис. Все це робить кількість правил величезним і, у свою чергу, вільно-контекстні граматики непридатними для NLP.

Трансформаційна граматика. Трансформаційна граматика була створена з урахуванням згаданих вище недоліків і більш раціонального використання правил ЕЯ, але виявилася непридатною для NLP. Трансформаційна граматика створювалася Хомським як породжує, що, отже, робило дуже скрутним зворотну дію, тобто аналіз.

Розширена мережа переходів. Розширена мережа переходів була розроблена Бобровим (Bobrow), Фрейзером (Fraser) та значною мірою Вудсом (Woods) як продовження ідей синтаксичного аналізу і вільно-контекстних граматик зокрема. Вона являє собою вузли і спрямовані стрілки, "розширені" (тобто доповнені) поруч тестів (правил), на підставі яких вибирається шлях для подальшого аналізу. Проміжні результати записуються в осередки (регістри). Нижче наводиться приклад такої мережі, що дозволяє аналізувати прості пропозиції всіх типів (включаючи пасив), що складаються з підмета, присудка і прямого доповнення, таких, як The rabbit nibbles the carrot (Кролик гризе моркву). Позначення у стрілок означають номер тесту, а також які ознаки, аналогічні вживаним у вільно-контекстних граматиках (NP), які конкретні слова (by). Тести написані на мові LISP і являють собою правила типу якщо умова = істина, то привласнити анализируемому речі ознака Х і записати його у відповідну клітинку.

Розберемо алгоритм роботи мережі на вищенаведеному прикладі. Аналіз починається зліва, тобто з першого слова в реченні. Словосполучення the rabbit проходить тест, який з'ясовує, що воно не є допоміжним дієсловом (Aux, стрілка 1), але є іменним групою (NP, стрілка 2). Тому the rabbit кладеться в комірку Subj, і пропозиція отримує ознака TypeDeclarative, тобто розповідне, і система переходить до другого вузла. Тут додатковий тест не потрібно, оскільки він відсутній у списку тестів, записаних на LISP. Отже, слово, що стоїть після the rabbit - тобто nibbles - дієслово-присудок (позначення V на стрілці), і nibbles записується в комірку з ім'ям V. Перекреслений вузол означає, що в ньому аналіз пропозиції може в принципі закінчитися. Але в нашому прикладі є ще й доповнення the carrot, так що аналіз триває по стрілці 6 (вибір між стрілками 5 і 6 здійснюється знову за допомогою спеціального тесту), і словосполучення the carrot кладеться в комірку з ім'ям Obj. На цьому аналіз закінчується (останній вузол був би використаний у разі аналізу такого пасивного пропозиції, як The carrot was nibbled by the rabbit). Таким чином, в результаті заповнені регістри (комірки) Subj, Type, V та Obj, використовуючи які, можна отримати будь-яке уявлення (наприклад, дерево).

Розширена мережа переходів має свої недоліки:

немодульность;

складність при модифікації, що викликає непередбачені побічні ефекти;

крихкість (коли єдина неграмматічность у пропозиції унеможливлює подальший правильний аналіз);

неефективність при переборі з поверненнями, тому що помилки на проміжних стадіях аналізу не зберігаються;

неефективність з точки зору сенсу, коли за допомогою отриманого синтаксичного представлення виявляється неможливим створити правильне семантичне уявлення.

Семантичні граматики. Аналіз ЕЯ, заснований на використанні семантичних граматик, дуже схожий на синтаксичний, з тією різницею, що замість синтаксичних категорій використовуються семантичні. Природно, семантичні граматики працюють у вузьких предметних областях. Прикладом служить система Ladder, вбудована в базу даних американських судів. Її граматика містить записи типу:

S ® the of

® what is | [can you] tell me

® the | class ship

Така граматика дозволяє аналізувати такі запити, як Can you tell me the class of the Enterprise? (Enterprise - назва корабля). У даній системі аналізатор складає на основі запиту користувача запит на мові бази даних.

Недоліки семантичних граматик полягають у тому, що, по-перше, необхідна розробка окремої граматики для кожної предметної області, а по-друге, вони дуже швидко збільшуються в розмірах. Способи виправлення цих недоліків - використання синтаксичного аналізу перед семантичним, застосування семантичних граматик тільки в рамках реляційних баз даних з абстрагуванням від загальномовних проблем і комбінація декількох методів (включаючи власне семантичну граматику).

Аналіз за допомогою відмінкових фреймів. Зі створенням відмінкових фреймів пов'язаний великий стрибок у розвитку NLP. Вони набули популярності після роботи Філлмора "Справа про відмінку". На сьогоднішній день відмінкові фрейми - один з найбільш часто використовуваних методів NLP, тому що він є найбільш комп'ютерно-ефективним при аналізі як знизу вгору (від складових до цілого), так і зверху вниз (від цілого до складових).

Відмінковий фрейм складається із заголовка і набору ролей (відмінків), пов'язаних певним чином із заголовком. Фрейм для комп'ютерного аналізу відрізняється від звичайного фрейма тим, що відносини між заголовком і ролями визначається семантично, а не синтаксично, тому що в принципі одного й те ж слово може приписуватися різні ролі, наприклад, іменник може бути як інструментом дії, так і його об'єктом.

Загальна структура фрейму така:

[Заголовний дієслово

[Відмінковий фрейм

агент:

об'єкт:

інструмент:

реципієнт:

напрям:

місце:

бенефіціант:

коагент:

]]

Наприклад, для фрази Іван дав м'яч Каті відмінковий фрейм виглядає так:

[Давати

[Відмінковий фрейм

агент: Іван

об'єкт: м'яч

реципієнт: Катя]

[Грам

час: бавовняні

застава: акт]

]

Існують обов'язкові, необов'язкові і заборонені відмінки. Так, для дієслова розбити обов'язковим буде відмінок об'єкт - без нього висловлювання буде незавершеним. Місце і коагент будуть в даному прикладі необов'язковими відмінками, а напрямок і реципієнт - забороненими.

Часто в NLP буває корисним використовувати семантичне подання до як можна більш канонічній формі. Найбільш відомим способом такої репрезентації є метод концептуальних залежностей, розроблений Шенком для дієслів дії. Він полягає в тому, що кожна дія представлено у вигляді одного або більше найпростіших дій.

Наприклад, для пропозицій Іван дав м'яч Каті (1) і Катя взяла м'яч в Івана (2), що розрізняються синтаксично, але обидва позначають акт передачі, можуть бути побудовані такі репрезентації з використанням найпростішого дії Atrans, що застосовується в граматиці концептуальних залежностей:

(1)	(2)
[Atrans	[Atrans
отн: володіння	отн: володіння
агент: Іван	агент: Катя
об'єкт: м'яч	об'єкт: м'яч
джерело: Іван	джерело: Іван
реципієнт: Катя]	реципієнт: Катя]

За допомогою такого подання легко виявляються подібності і відмінності фраз.

Для полегшення аналізу також використовується розподіл ролі на лексичний маркер і заповнювач. Так, для ролі об'єкт може бути встановлений маркер пряме доповнення, для ролі джерело - маркер виду = з | від | ...

Загалом аналіз тексту за допомогою відмінкових фреймів складається з наступних кроків:

Використовуючи існуючі фрейми, підібрати підходящий для заголовка. Якщо такого немає, текст не може бути проаналізовано.

Повернути в систему відповідний фрейм з відповідним заголовком-дієсловом.

Спробувати провести аналіз по всіх обов'язкових відмінках. Якщо один або більше обов'язкових заповнювачів відмінків не знайдені, повернути в систему код помилки. Такий випадок може означати наявність еліпсис, невірний вибір фрейма, невірно введений текст або недолік граматики. Наступні кроки використовуються вже для аналізу і виправлення таких ситуацій.

Провести аналіз по всіх необов'язковим відмінках.

Якщо після цього у введеному тексті залишилися непроаналізірованние елементи, видати повідомлення про помилку, пов'язаної з неправильним введенням, недостатністю даного аналізу або необхідністю провести інший, більш гнучкий аналіз.

Переваги використання відмінкових фреймів такі:

суміщення двох стратегій аналізу (зверху вниз і знизу вгору);

комбінування синтаксису і семантики;

зручність при використанні модульних програм.

Стійкість аналізу

Певні труднощі при аналізі представляє варіативність одного і того ж запиту. Наприклад, на вхід системи, що управляє зарахуванням і перерозподілом учнів на курсах різних спеціальностей, може надійти запит типу Переведіть Петрова, якщо це можливо, з математики на, скажімо, економіку.

Найбільш легко такі труднощі долаються при використанні відмінкових фреймів. Правило, сформульоване Карбонелл і Гейзом, говорить: "Слід пропускати невідомі введені елементи доти, поки не буде знайдений відмінковий маркер; пропущені елементи слід аналізувати з урахуванням незаповнених відмінків, використовуючи тільки семантику".

Діалог

Поряд з проблемою розпізнавання тексту існує і проблема підтримки інтерактивного діалогу. При цьому виникають додаткові особливості, характерні для діалогів, а саме:

анафора (тобто використання займенників замість їх анафоріческіх антецедентів - самостійних частин мови);

еліпсис;

екстраграмматіческіе пропозиції (пропуск артиклів, друкарські помилки, вживання вигуків і т.п.);

металінгвістичних пропозиції (тобто спроба виправлення введеного раніше).

Крім того, користувачі систем з природно-мовним інтерфейсом намагаються виражатися як можна коротше, що в ряді випадків також ускладнює аналіз.

Використання відмінкових фреймів, а саме злиття поточного сайта з попереднім, забезпечує відновлення еліпсис.

Висновок

Таким чином, процес розробки систем, які забезпечують розуміння ПМ, потребує створення механізмів, відмінних від традиційних способів уявлень ЕЯ, а системи з природно-мовними інтерфейсами застосовуються тільки у вузьких предметних областях.

Список літератури

Encyclopaedia of Artificial Intelligence. Entry Natural Language Understanding, pp. 660-677

Для підготовки даної роботи були використані матеріали з сайту http://www.ed.vseved.ru/