РЕФЕРАТ

Тема: лінгвістичне забезпечення штучного інтелекту

Зміст
1. Введення ------------------------------------------------- -------------------- 1
2. Штучний інтелект ------------------------------------------------ 2
Ø Завдання штучного інтелекту ------------------------------------- 2
Ø Історія розробки систем штучного інтелекту ---------- 2
Ø Зв'язок штучного інтелекту з іншими дисциплінами ----- 3
Ø Напрямки критики штучного інтелекту ----------------- 4
Ø Інформатика в суспільстві ---------------------------------------------- --- 4
3. Психолінгвістика ------------------------------------------------- --------- 5
Ø Історія розвитку психолінгвістики ---------------------------------- 6
Ø Моделі творчої діяльності -------------------------------------- 7
4. Лінгвопсихології ------------------------------------------------- -------- 8
5. Теорія інтерпретації ------------------------------------------------ ---- 9
Ø Загальні поняття теорії інтерпретації ----------------------------- 9
Ø Знання як основа інтерпретації ------------------------------------ 11
Ø Принципи інтерпретації ---------------------------------------------- 12
6. Обчислювальна лінгвістика ------------------------------------------ 13
Ø Обробка природної мови (ОЕЯ) ----------------------------- 13
Ø Історія ОЕЯ ----------------------------------------------- --------------- 15
Ø Система, «розуміюча» природну мову ----------------------- 16
7. Висновок ------------------------------------------------- ---------------- 19
8. Використана література -------------------------------------------- 20

Введення
Інформацією люди оперували вже задовго до появи комп'ютерів. Починаючи з древнього абака, який дожив до наших днів у вигляді конторських рахунків, створювалися пристосування для обробки числової інформації. Механічні пристрої типу арифмометрів, лічильні електричні клавішні машини, лічильно-аналітична техніка та багато інших прилади були націлені на вирішення тих же завдань, які в повному обсязі стали реалізовуватися в комп'ютерах.
Але щоб ефективно використовувати техніку людині необхідно знайти з нею «спільну мову» або навчити її говорити на своєму.
Метою даної роботи є розгляд лінгвістичного забезпечення штучного інтелекту.
Об'єктом даного дослідження є штучний інтелект, тому вважається доцільним розглянути історію розвитку, основні напрямки розробки, що вживали раніше і вживаються в даний час, і загальні питання, що стосуються проблем створення штучного розуму. Так як штучний інтелект є результатом досліджень, проведених в рамках такої науки як інформатика або компьютерологія, також є закономірним розгляд взаємодії даної галузі знань з іншими дисциплінами, зокрема з лінгвістикою і психологією.
У роботі будуть також порушені загальні питання лінгвістики та психолінгвістики, оскільки дані саме цих наук необхідні для дослідження проблем лінгвістичного забезпечення штучного інтелекту. Таким чином, так як проблема лінгвістичного забезпечення штучного інтелекту лежить в області перетину таких дисциплін як інформатика (і розробка штучного інтелекту зокрема), лінгвістика і психолінгвістика, будуть розглянуті їх точки дотику.
Також у вступі я вважаю за доцільне дати визначення деяких основних термінів, які будуть використані в даній роботі:

Штучний інтелект (Artificial Intelligence; Kьnstliche Intelligenz; intelligence artificielle) - розділ компьютерологіі / інформатики (computer science), розробляє "розумні" комп'ютерні системи, тобто системи, які виявляють характеристики розумності в людській поведінці (розуміння мови, навчання, міркування, вирішення завдань тощо, а також етичні аспекти) [Born, Born-Lechleitner 1987: viii], а також результат досліджень у даній галузі знань (то є здатність комп'ютера здійснювати операції, аналогічні процесам навчання та прийняття рішень людиною [Webster's Dictionary]).

Лінгвістика (linguistics, Linguistik, linguistique) - наука про мову, його суспільну природу і функції, його внутрішній структурі, закономірності функціонування, його історичному розвитку та класифікації окремих мов.

Психолінгвістика (psycholinguistics; Psycholinguistik; psycholinguistique) - наука про мовної діяльності людей в психологічних і лінгвістичних аспектах, включаючи експериментальне дослідження психологічної діяльності суб'єкта по засвоєнню та використанню системи мови як організованої і автономної системи.

Лінгвопсихології - дослідження предмета психології (людської ментальності, емоцій, свідомостей, перцепції) лінгвістичними методами, через призму буденної мови.

Обчислювальна лінгвістика - дисципліна, що займається комунікативними процесами в найбільш абстрактному вигляді, в функції якої входить встановлення загального вигляду і загальних принципів побудови процесорів природної мови, доказ теорем щодо равносильности або нерівносильні двох різних формальних граматик одного і того ж мови і т.п.

Штучний інтелект

Штучний інтелект полягає в моделюванні когніції людини, у відтворенні людської діяльності і людської когніції в цілому і спирається на дослідження біологічних підстав переробки інформації людиною (при цьому головною є когнітивна адекватність), на науковий аналіз та автоматизацію інтелектуальних функцій людини. В основі штучного інтелекту лежить переконання у принциповій можливості моделювання механізмів людської обробки інформації на ЕОМ. У зв'язку з цим поняття інтелекту розглядається як відносини між мозком і духовною діяльністю, як висококваліфікованої інформаційної переробки знання, при якій вербальний аспект відіграє особливу роль: інтелект полягає не тільки в умінні користуватися досвідом, а й передавати цей досвід на мові (про вимоги до систем штучного інтелекту, що використовує природний мова). Тому штучний інтелект іноді ототожнюють з дослідженням інтелектуальних функцій. Антропоморфізм штучного інтелекту полягає в прагненні до досягнення подібності між моделлю та людськими процедурами. Так, за Шанк, оскільки люди є концептуальними, інтенціональності та семантичне системами, взаємодіючими в певних обставинах, пропоновані моделі також повинні бути понятійними, інтенціональності та семантичне (semanticallybased). Однак саме ці очікування дослідників ще не виправдовувалися повністю.
Назва «штучний інтелект» аж ніяк не передбачає порівняння природного інтелекту з штучним. Системи штучного інтелекту називаються так з іншої причини. Вони покликані досягати результатів, які отримав би людина, якщо б виконував інтелектуальну роботу.
Завдання штучного інтелекту - розвиток, підтримка і використання формального апарату, що інтерпретується комп'ютером, для представлення знання. Інформаційно-пошукова парадигма когнітивних наук полягає в орієнтації на ЕОМ як на інструмент дослідження: моделювання (опис і пояснення, зокрема, мовних явищ) на базі теорій інформації та реалізація у формі працюючих систем. Як розвиток теорій когнітивної переробки і експерименти з комп'ютерними реалізаціями цих теорій, штучний інтелект основну увагу приділяє процедурної стороні. Мета штучного інтелекту - підвищити ефективність використання ЕОМ, зрозуміти принципи, на яких спочиває людський інтелект, імітувати на комп'ютері розумна поведінка людини - його сприйняття, розуміння, прийняття рішення, навчання і т.п. - Як в теоретичному плані, так і експериментально. Практичними реалізаціями є експертні системи, побудовані на основі баз знань, і системи спілкування людини і ЕОМ. В область штучного інтелекту входять розділи інформатики (розпізнавання природної мови, автоматичний переклад, експертні системи, розпізнавання зорових образів, генерація доказів в математиці, управління роботами, комп'ютерні ігри) і технічні системи розв'язання інтелектуальних завдань.
Історія розробки штучного інтелекту
За час виникнення цей напрям в інформатиці - наймолодше. Час його появи як наукової дисципліни - початок 70-х рр.. XX століття. Але зараз, мабуть, саме штучний інтелект визначає стратегічні напрями розвитку даної науки.
Термін "штучний інтелект" з'явився в 1956 р ., Проте його основи були закладені значно раніше: логіка Д. Буля і машинне моделювання обчислення у Ч. Беббідж підготували грунт для "теорії обчислення" А. Тьюринга та теорії комунікації Шеннона, а потім для кібернетики Н. Вінера та теорії автоматів фон Нейманом.
З появою перших ЕОМ стало ясно, що інженери і математики створили не просто швидко працюючий пристрій для обчислень, а щось більш значне. Виявилося, що за допомогою ЕОМ можна вирішувати різні головоломки, логічні завдання, грати в шахи, створювати ігрові програми, складати музичні мелодії, вірші і навіть казки. З'явилися програми для перекладу з однієї мови на іншу, для розпізнавання образів, докази теорем. Все це призвело до висновку про те, що з допомогою ЕОМ і відповідних програм можна автоматизувати такі види людської діяльності, які називаються інтелектуальними і вважаються доступними лише людині.
Але, незважаючи на велику різноманітність необчислювальних програм, створених до початку 60х рр.., Програмування в сфері інтелектуальної діяльності перебувало в набагато гіршому становищі, ніж рішення розрахункових задач, тому що вона спиралася на відповідну теорію - обчислювальну математику, на основі якої було розроблено досить багато методів вирішення завдань. Нічого подібного для необчислювальних завдань не було. Будь-яка програма була тут унікальною, тому що ще не були відкриті методи для вирішення однотипних необчислювальних завдань. Комп'ютер «не відрізняв» обчислювальні програми від необчислювальних, оскільки в пам'яті комп'ютера не було знань про те, що він насправді робить.
Про інтелекті комп'ютера можна було б говорити, якби він сам, на підставі власних знань зумів скласти шахову програму або, наприклад, синтезував музичне або літературний твір.

Зв'язок штучного інтелекту з іншими дисциплінами
Штучний інтелект тісно пов'язаний з великим дисциплінами, наприклад, з теоретичної інформатикою, звідки він запозичив багато моделей і методи. Настільки ж міцні зв'язки цього напряму з кібернетикою. І звісно, роботи в галузі створення інтелектуальних систем (чим, власне, і займаються фахівці, що працюють в області штучного інтелекту) немислимі без розвинених систем програмування.
Основна мета робіт в галузі штучного інтелекту - прагнення проникнути в таємниці творчої діяльності людей, їх здатності до оволодіння навичками, знаннями і уміннями. Для цього необхідно розкрити ті глибинні механізми, за допомогою яких людина здатна навчитися практично будь-якого виду діяльності. Якщо суть цих механізмів буде розгадана, то є надія реалізувати їх подібність в штучних системах, тобто зробити їх по-справжньому інтелектуальними.
Така мета досліджень в галузі штучного інтелекту тісно пов'язує їх з досягненнями психології - науки, одним із завдань якої є вивчення інтелекту людини. У психології зараз активно розвивається особливий напрямок - когнітивна психологія, дослідження в якому спрямовані на розкриття тих закономірностей і механізмів, які цікавлять фахівців у галузі штучного інтелекту.
Крім психологічних досліджень, в сферу інтересів фахівців в області штучного інтелекту входять ті лінгвістичні дослідження, які тісно пов'язані з психологією. Цю прикордонну область активно досліджує психолінгвістика. Її результати стосуються моделювання спілкування не тільки з допомогою природної мови, а й з використанням інших засобів (жестів, міміки, інтонації і т. п.).
Існує багато способів описати і представити різноманітні знання про світ. І природну мову лише один з них. Спеціальна наука, яка вивчає загальні властивості різних систем, здатних описувати явища навколишнього світу і його закони, називається семіотикою. Зрозуміло, що до семіотики фахівці з штучного інтелекту виявляють не менший інтерес, ніж до психології чи лінгвістиці.
Сучасні ЕОМ вже мало задовольняють фахівців з штучного інтелекту. Вони не мають нічого спільного з тим, як влаштований людський мозок. Тому в даний час велика увага приділяється дослідженням, пов'язаним зі створенням нейроподібних штучних мереж.
Штучний інтелект - наука не суто теоретична. Вона займається і прикладними питаннями, пов'язаними з побудовою реально діючих інтелектуальних систем, наприклад роботів.
Напрями критики штучного інтелекту:
1. Штучний інтелект спочиває на гіпотезі про аналогії знання мови і знання взагалі. Знання взагалі спирається на знання дискретних одиниць і відношень. Однак знання мови не настільки прямолінійно. Про це свідчать труднощі у виразі. Мовне і позамовних знання насправді дуже різні. Зокрема, у знання взагалі немає "семантичної структури". За [Herskovits 1986], ніяка з концепцій, що існують на даний момент, не пояснює, як людина використовує лексичні знання. Не випадково існуючі системи штучного інтелекту, що використовують природну мову, не можуть продукувати висловлення так, як це робить людина: ці системи здатні лише у деякому сенсі "спілкуватися" з людиною.
2. Ментальність не зводиться до формальної, "Синтактична", обробці, є ще й семантичні аспекти - в цьому полягає відмінність природного розуму від комп'ютера. Розуміння мови, зокрема, засноване на інтерпретації символів - чого немає у комп'ютера. "Сильний" штучний інтелект слід відрізняти від "слабкого", або обережного підходу, для якого комп'ютер - головним чином інструмент дослідження (що дозволяє формулювати і перевіряти гіпотези). "Слабкий" штучний інтелект безсумнівно цінний. Але для "сильного" штучного інтелекту комп'ютер - повне повторення мислення, і це-то і викликає сумніви: комп'ютер не має інтенціональність, тому не може він володіти і розумінням. "Сильний" штучний інтелект неможливий, оскільки людина може володіти деякою програмою дій, не будучи у відповідних ментальних станах.
3. За [Karpatschof 1982], зазвичай у фокусі штучного інтелекту - представлення (репрезентірованія) зовнішнього світу і внутрішнього стану самої системи, а також модифікування системи по ходу роботи. Але відсутні риси, властиві людському інтелекту, як то: соціальність, філогенетичною, історичність та становлення з віком, по ходу дорослішання людини.

Інформатика в суспільстві.

Сьогодні ми живемо в інформаційному суспільстві, в якому величезну роль відіграють системи розповсюдження, зберігання і обробки інформації. Широке впровадження комп'ютерів у всі сфери людської діяльності поряд з використанням інтелектуальних роботів значно впливає на традиційну середовище проживання людей, змінюючи її під свої потреби. Зростає кількість людей, професійно зайнятих збором, накопиченням, обробкою, поширенням і збереженням інформації, яка є товаром, що має більшу цінність, у зв'язку з чим індустрія інформації в суспільстві стає досить значущим явищем.

Перспективи повного переходу до інформаційного суспільства викликають масу проблем соціального, правового, технічного характеру. Наприклад, застосування роботів на виробництві призведе до повної зміни технології, яка в наші дні орієнтована на участь у ньому людину. Різко зміниться підготовка членів нового суспільства до самостійного життя. Вже розпочато пошукові роботи в області створення нових форм навчання, які замінять існуючі традиційні форми. Повністю зміниться номенклатура професій, спеціальностей і способів організації праці.
Психолінгвістика
Головний момент, що характеризує психолінгвістичний підхід до мовної діяльності, - це фактор людини. Психолінгвістика активно запроваджує цей чинник в опис, у вихідні посилання своїх моделей як фактор обов'язковий, що визначає суть, характер не тільки мови, а й - що особливо важливо - самої мови. При цьому мається на увазі не абстрактний «людина взагалі», а реальні люди з реальною динамікою їх пам'яті, вікових особливостей, особистого досвіду, системою цілей і мотивів, соціальних ролей і т.п.
Наступним чинником, прямо випливають з першого, є фактор ситуації. Людина завжди говорить або слухає в якійсь ситуації, причому не просто в якійсь конкретній ситуації, але в ситуації певного типу. Число таких типів досить рухливі, динамічні, варіабельні. Тому, якщо при класичному протиставленні мови і мови всі ситуативне належало виключно до мовному, окказиональном, а мовна система, узус, розглядалися не просто як щось стійке, але і як незалежне від ситуативного моменту, то з психолінгвістичного підходу прямо випливає, що складний і динамічний фактор ситуації так само принципово неустраним не тільки з мови, але і з мови, як і фактор людини.
Нарешті, третій момент - на практиці найвідчутніший для розуміння специфіки психолингвистического дослідження - це принцип експерименту. Для традиційного мовознавства, що вивчає пристрій системи мови характерно, як правило, скептичне ставлення до можливості її експериментального вивчення. У самому справі, якщо результати експерименту відповідають вже наявними даними про «нормі», то вони мало, що можуть додати до знань, отриманим у результаті звичного спостереження над наявними в розпорядженні дослідника текстами. У випадку, якщо в експерименті отримані незвичайні, несподівані результати, у лінгвістів відразу ж виникають сумніви в тому, що на основі цих експериментальних даних можна якось коректувати наявні моделі мови. Тим часом у психолінгвістиці експеримент стає суттєвим принципом дослідження. На основі експериментальних даних можуть будуватися набагато потужніші і адекватні моделі мовної діяльності, ніж ті, які будуються без опори на експеримент.
Ці три розглянутих моменту показують, що психолінгвістика дійсно відрізняється від того, що сьогодні вважається власне лінгвістикою, але що вона насправді є лише одним з можливим варіантів лінгвістики. Прагнення до обліку та фактора людини, і фактора ситуації, прагнення спертися на дані експерименту відповідають загальним тенденціям сучасного етапу розвитку суспільних і гуманітарних наук. Це говорить про особливу актуальність освоєння ідей і методів психолінгвістики, необхідності включення психолінгвістики в систему лінгвістичного знання.
Психолінгвістика є когнітивної дисципліною, одним з основних положень якої полягає в наступному: обробка мови пов'язана з серією "обчислень" (computations), вироблених над ментальними репрезентаціями інформації, що надходить від органів чуття (Дж.Фодор). Психолінгвістика - спроба встановити тимчасові і структурні характеристики різних типів "обчислень" і репрезентацій, що беруть участь у мовній обробці.
У завдання психолінгвістики входить дослідження та моделювання:
- Процесів планування мови,
- Механізмів, що з'єднують воєдино знання та використання мови - зокрема, процесів (алгоритмів) сприйняття та продукування мовлення, когнітивних процесів, що взаємодіють з мовним знанням при продукуванні й розумінні мови;
- Форми мовного знання, що лежить в основі використання мови індивідами;
- Механізмів засвоєння мови по ходу розвитку дитини (психологія розвитку розвитку - developmental psycholinguistics).
Психолінгвістика, як і психологія мови, розглядає власне дискурсивну діяльність, залишаючи осторонь механізм мови з його абстрактними і статичними структурами. Головними об'єктами психолінгвістики, по [Farmini 1981], є: функціонування мови, продукування і репродукування дискурсу і тексту, риторика, стилістика, практика перекладу і викладання мови
Історія розвитку психолінгвістики
Співпраця лінгвістики з психологією зародилося давно, ще в роботах з експериментальної психології В. Вундта. Тільки в результаті розвитку психології як (відносно) точної науки, в кінці 1940-х рр.., Встановилися настільки тісні відносини між психологією та лінгвістикою при обробці накопиченого матеріалу, що можна стало говорити про народження нової дисципліни, названої психолінгвістики. У 1950-і рр.. отримав широке поширення сам термін "Психолінгвістика", який означав одну з дисциплін, що займаються людською комунікацією, а саме, безпосередньо декодування і кодуванням, що співвідносяться стану повідомлення з станами спілкування. У 1960-70-і рр.. ми знаходимо лише стилістичні варіанти цієї характеристики. Психолінгвістика займалася психологічними процесами, пов'язаними з засвоєнням, продукуванням і розумінням мови, досліджувала природу мовного виконання, на противагу формальному вивчення мови як деякої абстрактної системи або дослідженню процесів продукування та розуміння висловлювань. Оскільки в Європі психологія мови ("психологія мови") зародилася досить давно, психолінгвістика вважалася частиною загального такого дослідження.
Крім того, оформлення психолінгвістики як окремої науки пояснюється общеметодіческого чинниками. Психолінгвістика була реакцією на структуралізм, прагненням спростувати думку, що структури в основі своїй незмінними. Саме в роботах соціолінгвістів і психолингвистов демонструється порушення рівноваги мовних структур, як в індивідуальному, так і в колективному аспектах.
Але контекст і сама діяльність в області психолінгвістики також змінилися за період 1950-80-х рр.., Особливо коли з'явилися нейролінгвістика, патолінгвістіка, педолінгвістіка і т.д. Спостерігається і зростання психолінгвістики вглиб: є теоретична психолінгвістика, прикладна психолінгвістика і психолінгвістика розвитку (developmental psycholinguistics).
Одним з центральних понять психолінгвістики останніх 20 років є ментальний лексикон - як метафора, що означає велику частину мовного знання, включаючи знання елементарних носіїв мовного значення, їх форми і ментальної організації. Особливу увагу приділяється питання про використання цього знання, про доступ до нього по ходу використання (когнітивної переробки) мови. Роботи когнітивного напрямку психолінгвістики продемонстрували недоліки тих моделей лексикону, в яких чуттєві сигнали прямо співвідносяться з ментальними репрезентаціями (особливо моделі сприйняття "знизу вгору"). Було показано, що відповідні процеси організовані інтерактивно, так що істотні тільки ті аспекти внутрішньої репрезентації сприймаються сигналів, які безпосередньо співвіднесені з ментальної організацією збережених одиниць. А звідси - один крок до того, щоб відмовитися від метафори ментального лексикону як сховища інформації, до якого людина звертається за методом використання звичайного словника.
Моделі творчої діяльності
Розробники штучного інтелекту прагнуть проникнути в таємниці творчої діяльності людей, їх здатності до оволодіння навичками, знаннями і уміннями. Для цього необхідно розкрити ті глибинні механізми, за допомогою яких людина здатна навчитися практично будь-якого виду діяльності.
У психології мислення є кілька моделей творчої діяльності. Одна з них називається лабіринтової. Суть лабіринтової гіпотези, на якій заснована лабіринтова модель, полягає в наступному: перехід від вихідних даних задачі до її вирішення лежить через лабіринт можливих альтернативних шляхів. Не всі шляхи ведуть до бажаної мети, багато з них заводять у глухий кут, з якого треба вміти повертатися до того місця, де втрачено правильний напрямок. На думку прихильників лабіринтової моделі мислення, рішення будь-якої творчої задачі зводиться до цілеспрямованого пошуку в лабіринті альтернативних шляхів з оцінкою успіху після кожного кроку.
Однак існують завдання, коли лабіринтові модель можна побудувати лише теоретично (наприклад, для гри в шахи), або вона взагалі не існує. Тому сучасні шахові програми вже давно використовують не тільки метапроцедурамі цілеспрямованого пошуку, але й інші метапроцедури, пов'язані з іншими моделями мислення.
Довгі роки в психології вивчалася асоціативна модель мислення. Основний метапроцедурамі цієї моделі є асоціативний пошук і асоціативне міркування, засновані на становищі, що рішення невідомою завдання, так чи інакше, грунтується на вже вирішених завданнях, чимось схожих на ту, яку треба вирішити. Нова задача розглядається як вже відома, хоча і дещо різниться від відомої. Тому спосіб її вирішення має бути близький до того, який колись допоміг вирішити це завдання.
Для цього треба звернутися до пам'яті і спробувати знайти щось схоже, що раніше вже зустрічалося. Це і є асоціативний пошук. Поняття асоціації тут набагато ширше, ніж просто «схожість». Асоціативні зв'язки можуть виникнути і за контрастом, як протиставлення одного іншому, і за суміжністю, тобто в силу того, що деякі явища виникали в рамках однієї і тієї ж ситуації або відбувалися одночасно (або з невеликим зрушенням за часом).
Асоціативне міркування дозволяє переносити прийоми, використані раніше, на поточну ситуацію. На жаль, незважаючи на багаторічне вивчення асоціативної моделі, ще не вдалося створити струнку теорію асоціативного пошуку та асоціативного міркування. Проте дослідження в цьому напрямку зіграли важливу роль: вони допомогли створити ефективні програми в розпізнаванні образів, в класифікаційних завданнях і в навчанні ЕОМ.

Лінгвопсихології

Лінгвопсихології є ще однією наукою, задіяної в процесі лінгвістичного забезпечення штучної інтелекту. Цей термін утворено за зразком багатьох уже усталених термінів. Так, психолінгвістика - дослідження предмета лінгвістики методами психології (зокрема, за допомогою психологічних експериментів), соціолінгвістика - дослідження предмета лінгвістики методами соціології (зокрема, за допомогою соціологічних опитувань тощо). За межами мовознавства - математична фізика - дослідження предмета фізики математичними методами.
Як було зазначено у вступі, лінгвопсихології - дослідження предмета психології (людської ментальності, емоцій, свідомостей, перцепції) лінгвістичними методами, через призму буденної мови. Вона відрізняється від психолінгвістики, але тим не менше багато в чому з нею схожа.
Однак лінгвопсихології не прагне до власне психологічним науковим результатами. Її завдання полягає в тому, щоб методами контрастивної лексичної семантики з'ясувати, яка семантика термінів людської духовності. Розглянувши ж, як реально вживаються ці терміни в класичної та сучасної художньої (тобто, не професійної психологічної) літературі, ми документуємо і досліджуємо не тільки розхожі думки даного етносу про духовність, але і затребуваність виразного потенціалу мови в характеристиці цієї духовності. Зіставивши результат з вживанням термінів у психології, ми допоможемо психологам встановити, наскільки далеко вони у своєму дослідженні відійшли від звичних уявлень.
Теорія інтерпретації
Проблема лінгвістичного забезпечення штучного інтелекту в чому криється в тому, що до цих пір точно неясні механізми отримання, переробки, зберігання і передачі інформації людиною. Теорія інтерпретації та обчислювальна лінгвістика - це саме ті галузі лінгвістики та психолінгвістики, на перетині яких знаходиться вирішення даної проблеми. Коли стане відома і зрозуміла система природної інтерпретації мови, тоді можна буде створити штучну систему, ідентичну їй.
Загальні поняття теорії інтерпретації.
Поняття «інтерпретація» лежало з самого початку в основі загальнолінгвістичних теорій, а також в основі логічних досліджень (згадаймо класичну роботу Аристотеля «Про тлумачення»). В останні роки в загальному і прикладному мовознавстві виробився такий погляд на мову, який можна було б назвати «інтерпретаціонізмом» у широкому сенсі слова. Цей погляд представлений як у різноманітних областях суто лінгвістичного аналізу (в теоріях формальних граматик, в описі дискурсивної діяльності, в «теорії мовленнєвих актів», в соціолінгвістиці, в історії мови), так і в дослідженнях по «штучного інтелекту». Інтерпретаціонізм - вельми різнорідне протягом, до визначення його основних положень можна прийти тільки в результаті зіставлення різних сучасних концепцій інтерпретації і вичленування загального для них теоретичного ядра. Це той погляд, згідно з яким в основі володіння мовою і використання його лежить один і той же інтерпретує механізм, який обслуговує різні сфери мовної діяльності і при цьому використовує різні види знань. Серед цих сфер - говоріння, розуміння, редагування, коментування, перефразування, міркування, аргументація, навчання, переклад та ін Сама ж інтерпретація, через яку і визначаються вказівкою сфери, являє собою отримання на основі одного вихідного об'єкта (званого інтерпретується об'єктом) іншого, відмінного об'єкта, запропонованого інтерпретатором в якості рівносильно вихідного на конкретному тлі ситуації, набору презумпцій, знань.
У інтерпретаціонізме володіння мовою та знання розглядаються як різні поняття. Так, хоча спеціальні види знань (хімічні, фізичні, математичні тощо) залучені в розуміння мови, вони, тим не менше, до відання лінгвістичної теорії не відносяться. Наприклад, ми розуміємо пропозицію Камінь просвистів у Петра над головою в тому сенсі, що можемо дати йому наступну інтерпретацію: Камінь пролетів над головою Петра; камінь був важким в тій мірі, яка необхідна для того, щоб предмет видавав відповідний свистячий звук, і Петро почув цей звук, оцінивши його як свист. Однак це тлумачення зовсім не зобов'язує нас серед словникових тлумачень дієслова свистіти поміщати (як одна з потенційних значень) таке: «свистіти - про предмети середньої тяжкості: видавати характерний звук при польоті».
Якщо залишитися на тій позиції, що знання про властивості важких предметів не зобов'язані входити до компетенції мови, то відпаде необхідність в нескінченно дробових тлумаченнях для мовних одиниць (прирікають упорядника словника на нескінченну роботу: адже з розширенням кругозору у добросовісного лексикографа буде постійно виникати необхідність в ревізії словника). Для лінгвіста-інтерпретаціоніста проблема знімається з цього боку (так як лінгвіст відволікається від енциклопедичної інформації), але ускладнюється з іншого: при побудові опису мови, він попутно (але окремо від своїх прямих обов'язків лінгвістичних) повинен складати компендій «схем знання» (а не компендій власне знань), сумісних з мовним описом таким чином, щоб на основі такого компендія - «інформаційного запасу» - можна було моделювати інтерпретації висловлювань.
Побудувати процесор природної мови - значить, втілити принципи інтерпретації мовних виразів, закладені в людській діяльності.
Побудова процесора природної мови - одна з найбільш актуальних проблем сучасної обчислювальної лінгвістики і створення штучного інтелекту. Ця проблема породжена інформаційним вибухом, пережитим людством в даний час: часто легше буває з'ясувати будь-якої факт (довести теорему, розв'язати рівняння тощо) або сконструювати будь-яке пристосування безпосередньо самому, ніж витягти потрібний рецепт з існуючої літератури. Не допомагає в такому пошуку інформації навіть те, що досить багато видань одночасно з публікацією заносяться на машинні носії: навіть тоді витягти безпосередньо потрібні відомості фундаментально складно саме тому, що текст на природній мові з працею поки що піддається інформаційній обробці. Зокрема, на сьогоднішній день не існує поки що навіть такої системи, яка для довільного тексту на даному (скажімо, російською) мовою давала б повний його морфологічний аналіз (для довільного, а не обмеженого словника) або повна його словник. Але ж завдання морфологічного розпізнавання, або «лемматізаціі», є передумовою для вирішення багатьох інших інформаційних задач.

Останні 20 років у центрі уваги обчислювальної лінгвістики знаходиться питання про моделювання тієї діяльності людини, результатом якої є мова. Проте якщо на початку цього періоду більший інтерес, як правило, викликали дослідження, які виходять з точки зору мовця, то, починаючи з 1970-х років і аж до теперішнього часу все частіше і частіше робляться спроби побудувати модель розуміння. Така зміна інтересів пов'язано з тим, що підхід до розуміння як до простої перекодуванні поверхневих (спостережуваних) структур в «смислові репрезентації» став представлятися все менш і менш імовірним. Стався поступовий перехід від «лінгвістики говорить» до «лінгвістиці розуміє», що, у свою чергу, пояснює тенденцію до інтерпретаціоністскому поясненню.
При всьому різноманітті сучасних концепцій спілкування стали характеризувати як те, що пов'язує двох йди більше число особистостей, які говорять і одночасно інтерпретує як чужу, так і власну мову. Інтерпретація - це процес, в кінцевому підсумку трактувався як розуміння, нерозуміння, непорозуміння і т.д.; шкала такої оцінки неперервна і не обмежується полярними точками. Причому процес цей полягає не в «перекладі» вислови-об'єкта у смислову структуру, а в побудові та перевірці гіпотез про таку структуру, про те, наскільки одні структури більш вірогідні в порівнянні з іншими, і навіть про те, чи варто далі намагатися інтерпретувати надходять повідомлення. У «перекодіровочного» концепції зазвичай виходять із незмінності ключа до шифру, в интерпретирующей ж підході цілком допускається випадок, коли по ходу розуміння мови сприймає сторона поступово змінює ту базу знань, на яку вона спирається.
Можливі перспективи теорії інтерпретації представляються наступним чином:
Комунікація в рамках теорії інтерпретації володіє багатьма аспектами, серед яких - зіткнення намірів і їх інтерпретація кожної з спілкуються сторін. Намір може бути пов'язано як з мотивами поведінки мовця (при розумінні намірів), так і з тональністю розуміння.
Намір в мовленнєвій поведінці володіє наступними параметрами:
а) ступінь навмисності у виконанні заздалегідь запланованої дії
б) вибір дій
в) психологічний стан, що інтерпретується як «бажання» чи «воля»
г) передбачення результатів даного мовного дії;
д) ступінь контрольованості дій, їх звичність, головним чином, пов'язана з навичками мовлення, а не зі знаннями.
Стратегічний комплекс (задум) мовця - це усвідомлений комплекс намірів, наявний ще до їх реалізації і використовуваний по ходу мовних дій. Це означає навмисності у виборі цілком певного набору дій, на тлі конкретного ж і постійно мінливого набору психологічних станів, що супроводжується «прораховування» наслідків майбутніх дій, при презумпції тій чи іншій мірі контрольованості постійно мінливої ситуації спілкування. Ясно, що стратегічні комплекси не завжди лежать за мовними діями. Крім того, можна вже до здійснення стратегічного задуму оцінити свої майбутні дії як погані чи добрі, запланувати необхідну дозу щирості (чи, навпаки, награнність) і навіть відмовитися від виконання своїх задумів.
Здійснення ж стратегій в реальному спілкуванні володіє двома важливими аспектами:
а) стадіальність здійснення (початок, втілення, завершення і т.д.);
б) співвіднесеність «атакуючих» і «оборонних» дій.
Стратегічний комплекс взаємодіє, як мінімум, із трьома іншими - внестратегіческімі - комплексами при кожному конкретному акті спілкування: з комплексом конвенцій даного соціуму, з комплексом особистості говорить і з комплексом особистості партнерів по спілкуванню з даними мовцем в оцінці останнього.
У різних епізодах здійснення стратегічного задуму в мовлення параметри наміру проявлені бувають в різному ступені. Намір, що розуміється в рамках теорії інтерпретації, дозволяє вийти за межі одного окремо взятого висловлювання і навіть групи висловлювань: те, що можна назвати «мовної життям» людини, може бути проінтерпретувати як зміна стратегічних і внестратегіческіх комплексів, з їх внутрішньою організацією. Моделювання модулів розуміння і мовних намірів - це одна з найближчих завдань теорії інтерпретації в рамках обчислювальної лінгвістики.

Знання як основа інтерпретації

Інтерпретація охоплює як розуміння, так і твір («продукування») висловлювання. Нейтрально це поняття також і по відношенню до усвідомлення буквального сенсу та розширеного, додаткового сенсу. Останній вид сенсу залучає знання, засноване на логічному виводі. Істотно залучення позамовних знань і при інтерпретації неоднозначних висловлювань.
Поняття інтерпретації здавна неформально використовується як термін для позначення того, що можна взяти з будь-якого даного об'єкту і не збігається з цим об'єктом буквально, тобто не тотожне йому або за формою (випадок буквального перефразування, зі збереженням сенсу), або за змістом (випадок інтерпретації, пов'язаної з залученням «побічних», тобто індивідуальних, не суто мовних знань інтерпретатора). При конкретної інтерпретації об'єкт розглядається на певному тлі: наприклад, в прихильності до конкретної ситуації появи об'єкта, в контексті більш великого висловлювання, що передують висловлювань того ж автора і т.п. Характеристики цього фону відображаються в рамках і одержуваної інтерпретації. Абстрактна інтерпретація, тобто та, яка здійснюється поза такого фону, як би в порожнечі, - випадок досить рідкісний; приблизне уявлення про цей випадок можуть дати, мабуть, тільки пропозиції-приклади в граматичних посібниках (типу Мама мила Машу. Діти пішли в сад. Настала весна, - у збірнику вправ з російської мови для початкової школи).
В основі поняття моделі як об'єкта математичної логіки (теорії моделей) інтерпретація пов'язана з тим кутом зору, під яким об'єкт розглядається. Там термін модель є синонімом терміна інтерпретація. Однак таке розуміння не єдино. Настільки ж широко, якщо не більше поширено, розуміння інтерпретації як процесу: в останні роки в лінгвістиці все більшу популярність одержує погляд на інтерпретацію як на те, що визначає природу мовної діяльності взагалі (про концепцію «інтерпретаціонізма»).
Принципи інтерпретації
Велика частина інформації неоднозначна. Але, тим не менш, в переважній більшості випадків людина успішно (вірно) інтерпретує висловлювання. Постає питання: які ж принципи, якими користується людина, інтерпретуючи висловлювання? У пошуках відповіді було запропоновано досить велика кількість кандидатів на звання «провідного» принципу. Ось тільки деякі з них:
Найбільш поважне місце займає «принцип Фреге» (принцип композиційного). В узагальненому вигляді він формулюється так: значення цілого речення є функція від значень його частин. Для поверхневої структури речення цей принцип, узятий буквально, не зовсім справедливий: досить простежити його дію у випадку синтаксичної неоднозначності. У концепції «компонентного аналізу» пропозиції цей принцип застосований лише до «вихідної синтаксичної структури» пропозиції; саме на цьому принципі і грунтується робота «правил семантичної проекції» в такій концепції семантики [Katz, Fodor 1963]. Навіть при такому трактуванні, проте, вказаний принцип наштовхується на труднощі, пов'язану з інтерпретацією цитат.
Принцип мінімальної інтерпретації [Th.R.Hofmann 1979,] відноситься до іншої сторони питання: кожне речення інтерпретується таким чином, щоб додати по можливості менший обсяг нової інформації, тобто щоб максимальним було її перетин з попереднім контекстом (мова не йде про ті випадки, коли вводиться новий сюжет, фокус контрасту і т.п.). Цей принцип справедливий для прямого тлумачення пропозиції, а не для випливають з пропозиції наслідків.
Інший кількісний принцип - «модифікована бритва Оккама» [P. Grice 1978]: при інтерпретації смисли висловлення не повинні множитися більше необхідності. Зокрема, безліч контекстнообусловленних значень («супозиції») слів у реченні повинно бути рівно тією мірою широким, яка визначається необхідністю інтерпретації; вихід за межі мінімуму допускається тільки тоді, коли пропозицією важко інакше приписати осмислену інтерпретацію.
Принцип ідентифікації [K. Stenning 1980] може розглядатися як пов'язаний з попередніми двома; він формулюється так: до інтерпретації цілого, у міру надходження нових мовних виразів, необхідно додавати такий мінімум, який логічно не суперечить самому висловлюванню. Аналогічний цим принципом, не звернений на контекст, «принцип локальної інтерпретації»: інтерпретатор не повинен конструювати (а точніше, оцінювати) контекст більший, ніж той, який йому необхідний для отримання будь-якої інтерпретації. Так, якщо Джону кажуть: Закрий двері, - то він зрозуміє, що мова йде про найближчих дверей, а не про ту, яка знаходиться в сусідньому будинку на третьому поверсі. Такий принцип можна в райках ОЕЯ пов'язати з вимогою про мінімальну роботі аналізатора.
Принцип аналогії [Ц. Dahl 1976], взятий з точки зору інтерпретатора, може бути сформульований так: май на увазі, що промовець прагне згадувати тільки ті речі, які змінилися, а про тих, які залишаюся без зміни, звичайно замовчує.
Нарешті, «принцип звичаєвості» можна сформулювати так: якщо немає ніяких для цього підстав, не підозрював, що у інтерпретованих слів є який-небудь ще додатковий, прихований сенс.

Обчислювальна лінгвістика
Що ж таке «теорія лінгвістичних обчислень»? Це дисципліна, що займається комунікативними процесами в найбільш абстрактному вигляді. У її функції входить встановлення загального вигляду і загальних принципів побудови процесорів природної мови, доказ теорем щодо равносильности або нерівносильні двох різних формальних граматик одного і того ж мови і т.п. Мабуть, саме до теорії лінгвістичних обчислень відноситься коло завдань, традиційно що відносяться до ведення математичної лінгвістики, а також до моделювання спілкування з ЕОМ природною мовою. Інша ж частина теорії лінгвістичних обчислень пов'язана з найбільш глибинними процесами обробки інформації людиною та їх моделюванням на ЕОМ.
Предметом «обчислювальної лінгвістики» є розробка і застосування систем обробки природної мови як частини більших систем, наприклад, промислових інформаційно-пошукових систем. Завдання таких систем - пошук інформації в базі даних і автоматичне поповнення бази даних. Інше, суміжне напрям - побудова систем, що вирішують завдання, сформульовані на природній мові.
До інформаційних задач обчислювальної лінгвістики належать:
1. Автоматичне встановлення за конкретного тексту тих правил і одиниць цієї мови, які брали участь у побудові цього тексту (при цьому відповідна система використовує свою базу даних про граматику і одиницях мови). У розширеній формулюванні мова тут йде про те, щоб встановити по конкретному зразку мови (тексту) всі ті закони логічного висновку (у широкому сенсі) і все ті аксіоми («елементарні пропозиції»), які надають мови осмисленість і роблять її правильним текстом на даному мовою.
2. Встановлення інформаційних зв'язків, які є між двома зразками текстів (наприклад, між запитом до інформаційної системи та інформацією, що зберігається в системі, або інформацією, заданої у вигляді тексту). Так, у запиті може міститися завдання з'ясувати, описується в тексті шукане пристосування для виконання конкретних робіт.
В обох випадках потрібно встановити зв'язки між різними зразками мови. Вирішення цього завдання пов'язане з поданням і використанням знань при оперуванні промовою. Яке ж місце обчислювальної лінгвістики в «штучному інтелекті»?
Р. Шенк вказує, що обчислювальна лінгвістика - це «проблема наділення машин здатністю спілкуватися з людиною на природній мові. Наш метод полягає в тому, щоб спробувати зрозуміти, як люди спілкуються один з одним, і досліджувати ці процеси ». Н. Черконе пише: «Обчислювальна лінгвістика повинна побудувати загальну теорію розуміння природної мови як основи для таких програм ЕОМ, які розуміють природну мову».
На думку Томпсона, теоретична обчислювальна лінгвістика являє собою спробу охарактеризувати природу мови з точки зору «лінгвістичних обчислень» - процедур над промовою, аналогічних тим, які виконуються по ходу власне обчислювальних робіт. В американській обчислювальної лінгвістиці на сьогоднішній день було запропоновано кілька концепцій теоретичної обчислювальної лінгвістики: «функціональна граматика» М. Кея [M. Kay 1979], «когнітивна граматика» [Lakoff, Thompson 1975], «лексична функціональна граматика» [J. Bresnan ed . 1982] та ін

Обробка природної мови (ОЕЯ)

Область побудови систем, що обробляють (або «переробляти») природна мова, точніше було б назвати переробкою мови (текстів) на природних мовах. Ця область, в тому вигляді, якою вона набула в останні роки, зайнята побудовою і перевіркою концепцій (і технічних їх втілень) спілкування з ЕОМ природною мовою. Зокрема, сюди відноситься задача побудови таких програм для ЕОМ, які дозволяють організувати діалог з ЕОМ. На відміну від завдання «розпізнавання усного мовлення», де вирішується проблема акустичного розпізнавання сигналів, ОЕЯ займається операціями більш абстрактного, більш символічного порядку: операціями над значеннями і логічним висновком, необхідними для розпізнавання мови.
Об'єктом ОЕЯ зазвичай вважається текст. У системі ж, що претендує на перспективність, ставиться завдання не просто розпізнати цей текст, а з'ясувати ті зазвичай приховані рушійні сили, які його сформували. Нагадаємо, що текст у його становленні називають дискурсом.
Система обробки тексту, по Фрідману, вирішує дві проблеми: 1) з'ясовує витоки інформації, з якої «композиційним» шляхом може бути виведена конкретна семантична інформація для кожного окремого значення тексту (тобто виявляє семантику пропозиції виходячи зі структури цілого тексту), і 2) встановлює роль і функції цієї інформації високого порядку в рамках цілого дискурсу.
Взагалі кажучи, система ОЕЯ має: а) планувати висловлювання, необхідні для досягнення конкретних комунікативних цілей, що знаходиться в залежності від знань, думок і намірів користувачів такої системи, і б) розпізнавати у висловлюваннях користувача ті плани, які можуть бути повідомлені в результаті декількох висловлювань або які, за задумом користувача, можуть бути логічно виведені з презумпції спілкуються сторін (людини і ЕОМ). Один з можливих шляхів досягнення цього - наступний цикл:
1. Розглянути поточний висловлювання (пропозицію).
2. Грунтуючись на способі цієї пропозиції (розповідне, питальне, наказовий), приписати ефект висловлювання наміру користувача.
3. Використовуючи алгоритми розпізнавання, а також базу загальних презумпцій, вивести, якщо це можливо, якимось чином спостережувані дії укладаються в план досягнення мети, яку, як очікується, переслідує користувач. Якщо цей план не може бути однозначно виявлений, виробити мета системи, спрямовану на розкриття меті користувача.
4. Виробити завдання системи для тих цілей, які користувач мав намір активізувати в системі.
5. Використовуючи приватні (тобто не загальні) презумпції, визначити перешкоди, які можуть перешкодити здійсненню планів користувача, а також пункти, в яких користувачеві буде потрібно допомогу.
6. Прийняти заперечення для деяких з перешкод в якості цілей системи.
7. Користуючись приватними презумпція, побудувати план досягнень цілей системи, особливо цілей для подолання перешкод для користувача. У залежності від цих цілей план може включати в себе такі комунікативні дії, як питання, які проясняють наміри користувача.
8. Виконати результуючу послідовність дій.
9. Перейти до пункту 1.
Зрозуміло, цей цикл не володіє статусом ідеалу: це скоріше приклад того, в яких термінах можуть формулюватися загальні плани побудови системи обробки природної мови. Більш вузько ставиться проблема в тому напрямку, яке пов'язане з ім'ям Р. Шенка: 1) відображення пропозицій в їх смислове подання; 2) зберігання в пам'яті і здійснення умовиводів щодо отриманого сенсу; 3) переклад смислового подання на природну мову. Основні режими роботи в цьому напрямку - перефразування і умовивід.
Необхідно враховувати те, що ОЕЯ за допомогою ЕОМ («штучна ОЕЯ») відмінна від ОЕЯ людиною (тобто «природною ОЕЯ») у наступних відносинах:
а) коли останній не може обмежитися аналізом і синтезом поза контекстом ситуації в усіх її деталях;
б) остання не тільки долає неоднозначності природної мови, а й експлуатує їх у своїх цілях.
Мовний процесор, що розробляється колективом Р. Шенка, функціонуючи в інтерактивному режимі, повинен знаходити найбільш ймовірну для даної пропозиції інтерпретацію, а не просто виявляти всі можливі способи тлумачення пропозицій: людина зазвичай не помічає тих неоднозначностей у тексті, які надто скрупульозна система обробки природної мови здатна , в принципі, виявити. Аналіз відбувається послівно, від початку до кінця пропозиції, в результаті одноразового, а не багаторазового «проходу» за пропозицією: зазвичай ж число проходів досягає п'яти. Крім того, система обробки природної мови має знання про світ в тій мірі, яка необхідна для вирішення проблем аналізу.
Система ОЕЯ, зрозуміло, - не самоціль. Її завдання впорядковані і визначають «рівні ОЕЯ». Так, немовним цілям підпорядковані процедури, направляючі будь-який вид ОЕЯ; цих процедур, у свою чергу, підпорядкований рівень мовленнєвих актів (при інтерпретації або породження окремих висловлювань). Найнижчий рівень складають процедури власне мовної обробки (мовний аналіз).
Спільними для запропонованих систем ОЕЯ є наступні компоненти: ПМ -> ФР -> ІНТ -> СОД -> БД. А саме, природно-мовної вхід (ЕЯ) переводиться в форму репрезентації (ФР) знань; інтерпретатор (ІНТ) встановлює зв'язок між репрезентацією для положень справ в (ФР) і, за допомогою мови системи обробки даних (СОД), банком даних (БД) . У рамках цих систем операції, пов'язані з обробкою тексту («лінгвістичні обчислення» мають різні властивості; аналіз проведених на сьогоднішній день розробок показує скоріше не те, в чому вони полягають, а те, чим ці операції не є: вони працюють не виключно адитивно, не виключно одна за одною (послідовно), не виключно на мікрорівні і не статистичними чином.

Історія ОЕЯ

Передісторія ОЕЯ визначена багатьма факторами, з яких можна виділити особливо два: 1) спроби моделювання нейронів у вигляді логічного пристрою, пов'язані з іменами МакКаллоу і Піттса; 2) зародження «інформаційної» парадигми - погляду на числа і на текст як на те, що представляє загальне поняття «інформації» (Шеннон), що володіє кількісними характеристиками, з усіма відповідними наслідками для математичної теорії інформації. Поняття «інформативність» належить зазначеній парадигмі.
Власне ж історію ОЕЯ інколи представляють як що складається з трьох етапів:
1. Початок 1950-х - початок 1960-х років. Ідея «інформації» призвела до концепції «машинного перекладу» як встановлення тієї інформації, яка прихована за пропозицією на природному мовою, і вираження її на іншому - цільовому мовою. Мова інформаційного змісту був названий «мовою-посередником». На цьому етапі була введена і ідея евристичного пошуку, а також мови програмування для вирішення завдань ОЕЯ (найбільш популярною мовою, починаючи з цього часу, був ЛИСП, введений і описаний вперше в роботі.
2. «Епоха обробки семантичної інформації» (приблизно 1962-1973 рр..). Її основні ідеї: а) необхідно використовувати обмежені змістовні області для моделювання ОЕЯ; б) слід побудувати якомога більше систем для обробки обмежених підмов, присвоївши цим системам статус «експертів» у таких областях, а потім об'єднати всі ці системи в одну, в рамках «великого експерта», який визначає, який з підлеглих має почати працювати на конкретному етапі обробки, при вирішенні конкретного завдання - концепція «великого перемикання»; в) використання «ключових слів», керуючих вибором конкретних дій по ходу обробки тексту; г) переведення природного мови на формальні мови (деякі з формальних мов при цьому володіють власними численнями, типу обчислення предикатів формальної логіки; є мови пошуку в базі даних. Цю епоху іноді називають ерою «інженерного підходу»: основний упор робився на рішення конкретних (як правило, прикладних) завдань, без спроби моделювати психологічну реальність.
Початок 1970-х років ознаменувався інтересом до обробки семантичної інформації; з'явилися навіть перші паростки інтересу ж «когнітивної науці» (названої в ті ж роки «когітологіей»).
У результаті досліджень цієї «епохи» з'ясувалося: а) навіть в дуже простих ситуаціях (використання мови набагато більш різнопланово, ніж можна було б очікувати, б) спеціалізація тієї чи іншої системи ОЕЯ і перспектива розширення цієї системи перебувають у серйозному конфлікті між собою; в ) репрезентації для мовних висловів, які використовуються в рамках таких систем (скажімо, формальні мови), дуже неточні і неадекватні виразним здібностям природної мови; г) доводиться поступитися багатьма типами виразів, що реально використовуються на природній мові (зокрема, виразами для фізичних подій і дій, описами сцен, карт, шляхів, приписами; реальними розмовами, суперечками, дебатами, обговореннями, емоційно забарвленими висловлюваннями і висловами про емоційних станах; метаописів теорій; поетичною мовою, гумором, іронією, брехнею і т.п. - тобто всім, що вимагає набагато більше багатого метамови, ніж той, який можуть на сьогоднішній день надати в наше розпорядження існуючі нотації логіки).
3. Сучасна епоха (1970-1995 рр.).. У цей час у центрі уваги перебувають такі проблеми: а) співвіднесеність мовних актів, фокусів уваги і загальних (для ЕОМ і людини) презумпцій, б) використання «новаторського» потенціалу мови (зокрема, інтерпретація метафор), в) побудуйте прикладних систем, розуміють природну мову (а не просто його обробних), г) обробка висловлювань про просторові події; д) введення чинників «здорового глузду» до складу логічного виведення систем ОЕЯ, зокрема, врахування ступеня правдоподібності при интерпретировании висловлювань.

Система, «розуміюча» природну мову

Змоделювати розуміння і обробку природної мови - це не одне і те ж. Так, ми можемо (не розуміючи повністю або частково) маніпулювати символами, повторити сказане на чужому (і незрозумілому нам) мовою і т.п. Все це, нехай огрубіння, відповідає ситуації ОЕЯ без розуміння. З іншого боку, сам факт того, що ми щось розуміємо, рівносильний тому, що ми над виразом виробляємо певні лінгвістичні операції. Таким чином, розуміння природної мови - спеціальний випадок ОЕЯ. Багато хто з побудованих систем ОЕЯ не розуміють природної мови в тому сенсі, що розумно вкладати в термін «розуміння».
Перш за все, не всі такі системи мають цілеспрямованістю: вироблення власних цілей, планування, втілення стратегій у вигляді тих чи інших тактичних прийомів, «простежування» результатів цих прийомів і пророцтво (передбачення) подальших результатів - все це поки що не більше ніж проект гарної системи ОЕЯ. Так, система SHRDLU володіє системою планування, але цілі в ній досягаються не за допомогою висловлювань, і крім того, ця система не в змозі розпізнавати цілі людини: у діалозі з ЕОМ саме людина володіє ініціативою. Трохи більше замасковано відсутність цілеспрямованості у системах Еліза і ДОКТОР. Тільки порівняно недавно цілеспрямованість та моделювання намірів увійшли в коло інтересів розробників ОЕЯ.
Інше тимчасове недогляд: зрозуміти нове висловлювання в діалозі або в тексті - значить, крім іншого, зв'язати його з тим, що було сказано раніше. У системах «штучного інтелекту» це завдання вирішується, в основному, опосередковано, у два кроки:
1) спочатку, на підставі протоколу аналізу попереднього діалогу або тексту, активуються «фрейми», або «скрипти» (тобто, неформально кажучи, ті схеми з бази знань, в які можна вкласти надійшла нову інформацію), а потім
2) нове, поточне повідомлення зіставляється з цими схемами (але не з попередніми пропозиціями безпосередньо).
У результаті, зокрема, не береться така можливість, реально використовувана насправді в спілкуванні між людьми, як «лов на слові», непослідовність у вживанні термінів і т.п.
Третя відмінність полягає в слабкій реалізованості впливу контексту безпосередньо на напрям роботи аналізатора. Так, у більшість систем ОЕЯ є дві окремі підсистеми: а) аналізатор («парзер») переробляє вхідний текст в деяку проміжну форму (на мову синтаксичних дерев - як в системах типу, на спрощений природна мова - як в роботі або на мову понятійних примітивів - як у Шенка), а потім б) підсистема логічного висновку будує репрезентацію для значення вхідного тексту (за допомогою заповнення відсутніх деталей у репрезентації, отриманої на виході з аналізатора); тоді включаються ті незгадані події, які пов'язують в єдине ціле факти, що згадуються в тексті . Часто представлені інші компоненти (система відповіді на питання і система побудови анотації до статті) скоріше демонструють досягнуто розуміння, чим є частиною процесу розуміння. Призначення проміжного представлення для значення тексту завжди одне і те ж: захистити систему логічного висновку від «капризів» природної мови. Однак ця спрямованість не витримана послідовно: логічний висновок завжди буває при цьому пов'язане з додатковим аналізом - на основі тепер вже проміжної репрезентації. Але на роботі аналізатора ніяк не позначається (у названих системах) те, до яких висновків прийде система логічного висновку. Спроба заповнити цей недогляд зроблена розробниками системи FRUMP, де знання про світ відокремлені від суто мовних відомостей, не де, тим не менш, контекстна інформація впливає на процес аналізу, У цій системі містяться, серед іншого, два модулі: Предсказиватель (пророкує обмеження на те , що може далі з'явитися в тексті) і Вияснітель (веріфіцірует ці гіпотези Предсказивателя). Однак ця система перебуває у стадії проектування.
Інший вид проблем: відношення між синтаксисом і семантикою в рамках аналізу пропозиції. Маємо тут, як мінімум, три можливості:
1) при переході від пропозиції до подання його значення спочатку повністю відновлюється синтаксична структура речення; на другому ж етапі ця структура переводиться в семантичне подання;
2) між синтаксисом і семантикою немає жодних бар'єрів, семантична структура виходить прямо, виходячи з текстового вигляду пропозиції;
3) побудова часткових синтаксичних репрезентацій перемежовується встановленням часткових ж семантичних репрезентацій (тобто синтаксис і семантика різняться, не в аналізу взаємодіють не прямолінійним чином). Третє рішення є компромісним між першими двома; особливо воно задовольняє супротивників послідовного аналізу, які вважають, що при ОЕЯ необхідно допускати можливість тій ситуації, коли різні типи інформації та процедур викликаються більше одного разу на різних етапах обробки вхідного вираження.
В узагальненому вигляді компромісний підхід може бути охарактеризований як «модульна концепція ОЕЯ». Одна з переваг цього підходу - організаційне спрощення: можна розділити всю завдання на кілька підзадач, які доручаються різним дослідникам або групам дослідників; одержувані ж в результаті «модулі» працюють у взаємодії один з одним, але не «втручаючись» у внутрішню техніку операцій один одного .
Безсумнівно, переробка природної мови з метою створення лінгвістичного забезпечення штучного інтелекту представляє собою процес, складність якого важко переоцінити. Спроби створити «природна мова для штучного інтелекту» робляться знову і знову, так що видається цілком можливим, що в найближчому майбутньому з'явиться система мови для штучного розуму, ідентична природною.

Висновок
Останні 20 років у центрі уваги розробників штучного інтелекту знаходиться питання про моделювання тієї діяльності людини, результатом якої є мова.
Опис процесів отримання, переробки, зберігання і передачі інформації може тим, що дані процеси відбуваються в мозку людини і недоступні для безпосереднього дослідження.
Висловлюється думка, що, вивчаючи процес обробки мови в мозку людини, дослідник подумки простежує той шлях, який проходить ця людина, сприймаючи та інтерпретуючи який-небудь текст.
Дослідження процесів обробки мови безпосередньо пов'язані з прикладними завданнями. На їх основі розробляються моделі лінгвістичного забезпечення штучного інтелекту.
У даній роботі я не стала зупинятися на всіх методиках аналізу й обробки природної мови, так як питання лінгвістичного забезпечення штучного інтелекту досить великий. З тієї ж причини в запропонованому підході були розглянуті виключно загальні положення та деякі приклади до них. Було порушене тільки синтаксичний підхід, крім якого існує також, наприклад, морфологічний і лексичний.

Використана література:
1. Демьянков В.З. Основи теорії інтерпретації та її застосування в обчислювальній лінгвістиці, М.: Изд-во Моск. ун-ту, 1985
2. Короткий словник когнітивних термінів, М.: Філологічний факультет МДУ ім. М.В. Ломоносова, 1996
3. Мислення, когнітивні науки, іскусственнний інтеллек, т М.: Центральна рада філософських (методологічних) семінарів при Президії АН СРСР, 1988.

Лінгвістичне забезпечення штучного інтелекту