Логічна граматика

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Логічні граматики перетворилися з плином років в інструментарій високого рівня, і тепер вони дозволяють користувачеві сконцентруватися на лінгвістичних феномени. Граматики, побудовані на певних пропозиціях, підтримують використання логіки для обробки даних природної мови, і вони підготували грунт для практичної роботи лінгвістів на мові програмування PROLOG.

ГРАМАТИКА, побудовані на певних ПРОПОЗИЦІЇ (DEFINITE-CLAUSE GRAMMAR або DCG)

Проведення робіт з дослідження побудови граматик для розуміння природної мови (далі ЕЯ) придбало велику популярність після введення Колмеройером в 1975 році граматичних формалізмів, заснованих на пропозиціях Хорна. Так звані метаморфозне граматики (metamorphosis grammars або MGs) визначили зростання зацікавленості в області вираження лінгвістичних понять у логіці (qv) і заклали основу для створення якісних блоків попередньої обробки даних (процесорів вводу-виводу) та інтерфейсів. Основне застосування результати цих досліджень знайшли у консультуванні та створення баз даних на основі ЕЯ, виробленні питань і відповідей, перекладі текстів та синтезі текстів, виходячи з належним чином оформлених специфікацій.

Поняття граматик, побудованих на певних пропозиціях (DCGs), як особливого випадку метаморфозне граматик, було введено в 1978 році Перейра і Уорреном як граматичного формалізму, для якого PROLOG має ефективний механізм синтаксичного аналізу. Одні практичні системи були створені для одночасного використання синтаксичного та семантичного знання для привнесення логіки в структуру, утримуючи в собі інформацію для семантичної інтерпретації. Інші системи були вибудувані на більш ніж одному рівні трансляції; використання синтаксичного та семантичного знання здійснювалося окремо один від одного, і кінцевим результатом було в PROLOGе пропозицію Хорна, виконання якого здійснювалося механізмом планування (qv).

Техніка екстрапозіціонних граматик (extraposition grammars або XGs) була запропонована Перейра для опису певних глобальних відносин або екстрапозіцій, таких як зв'язок між відносним займенником і його записом. У кінцевому підсумку розробки зразок граматик структури визначень (modifier structure grammars або MSGs) Даля і МакКорд, деревовидних граматик (tree grammars або TGs) Колмеройера і ускладнених граматик (puzzle grammars або PGs) Сабатьє збільшили силу вираження лінгвістичних понять.

Всі ці дослідницькі роботи з граматичним формалізму, замішаним на логіці, стали можливі й простіше у здійсненні після вибору PROLOGа, мови програмування заснованого на підмножині логіки першого порядку.

ЛОГІЧНІ ГРАМАТИКИ

Граматики описують структуру (синтаксис) мов безліччю продукцій (правил, переробних текст). Наприклад, правилом

sentence -> noun-phrase verb-phrase

встановлюється зв'язок між трьома нетермінальним символами: пропозиція може складатися з іменної групи і наступної за нею дієслівної групи.

Такі правила можуть бути відображені в PROLOGе наступним чином:

sentence (S1, S3): - noun-phrase (S1, S2), verb-phrase (S2, S3).

verb-phrase (S1, S2): - connects (S1, writes, S2).

connects (1, each, 2).

connects (2, author, 3).

connects (3, writes, 4).

(Примітка: предикати (тобто висловлювання з невизначеними термінами, або змінними, які перетворюються на справжні чи хибні висловлювання при виборі конкретних значень для цих самих термінів) заносяться в PROLOG через кому. Змінні відрізняються від констант першої великої літери.)

У нижченаведеної запису числа позначають початок і кінець кожного слова:

1each2 author3 writes4

Щоб перевірити правильність побудови речення, необхідно вказати мету

? - Sentence (1, 4).

(Де? - Бінарне позначення структури (або бінарний функтор), що міститься в будь-якій системі PROLOG) і продемонструвати, що вона підтверджується попередніми умовами. Використовуючи список в якості інформаційної структури для внесення пропозиції, числа більше не потрібні, тому що PROLOG має пристрій синтаксичного аналізу, здатного перевести:

? - Sentence ([each, author, writes]. []).

Граматики, побудовані на певних пропозиціях, є обсягом поняття контекстно-вільних граматик, які також можуть бути трансльовані на мову PROLOG. Граматики, побудовані на певних пропозиціях, дозволяють будь-якому логічному виразу стати нетермінальним, вони побудовані на логічних символах: константах, змінних, виразах, - а не тільки на одних константах. Також вони мають тільки один нетермінальний символ у лівій частині кожного правила. Контекстні залежності (контекстні відносини підпорядкування) описуються логічними змінними в рамках параметрів (або незалежних змінних) граматичних символів.

У правила граматики, побудованої на певних пропозиціях, наступна форма:

nonterminal symbol -> body (основна частина програми).

де "body" ("основна частина") є послідовністю одного або більше елементів даних, відокремлених один від одного комами. Кожен елемент даних є або нетермінальним символом, або послідовністю термінальних символів. Значення правила полягає в тому, що "основна частина" - це можлива форма для групи типу "нетермінальний символ". У PROLOGе нетермінальний символ записується як вираження (а не як список), а послідовність термінальних символів - у вигляді списку.

У правій частині правила поряд з нетермінальним символами і списком термінальних символів можуть перебувати послідовності викликів процедур, записуваних в фігурних дужках ({and}). Вони використовуються для вираження додаткових умов, які в обов'язковому порядку повинні виконуватися, щоб правило діяло. Нетермінальний символ перетворюється в (N + 2)-місцевий предикат (що має ідентичне назва), чиї перші N параметри повністю описані в нетермінальним символі і чиї останні два параметри є такими ж, як і при трансляції контекстно-вільного нетермінального символу. Виклики процедур в правій частині правила транслюються так, як вони є.

Кожне граматичне правило, типу

p (X) -> q (X).

отримує групу входять даних, аналізує якусь вихідну частину і генерує залишок для подальшого аналізу. Це приватне правило транслюється системою PROLOG як

p (X, S0, S): - q (X, S0, S).

Отже, система граматичної індексації в PROLOGе забезпечує більш стислу запис, коли параметри для груп входять і виходять даних неявно виражені.

Коли в правилі містяться термінальні символи, вони транслюються з присудком "connects". Приміром,

connects (S1, X, S2)

означає, що суть S1 пов'язана через X із суттю S2.

Правило

p (X) -> (older), q (X), (high).

перетвориться в

p (X, S0, S): - connects (S0, older, S1),
q (X, S1, S2),
connects (S2, high, S).

АНАЛІЗ ЕЯ

У 1977 році Колмеройер ввів загальну схему аналізу ЕЯ, що стало вирішальним кроком вперед і викликало величезний інтерес в галузі використання логічних граматик як альтернативи міцно утвердилися граматика розширених мереж переходів (augmented transition network grammars). З історичної точки зору, це можна визнати поворотним пунктом, тому що був вказаний метод перетворення пропозицій ЕЯ в логічні структури. Метод полягав у розгляді найпростіших висловлювань, що містять власні імена іменники, якої б то не було артикль у вигляді квантора (кванторного слова) з трьома операціями переходу і чотири пріоритетні правила, для вирішення проблеми ієрархії квантування (кількісного вимірювання якісних ознак).

Короткий огляд загальної схеми спонукає до подальшого розвитку прийомів складання логічних граматик. Наприклад, пропозиція

Chomsky is (a) writer

містить ім'я власне, і дієслово "to be" перетворюється на формулу

writer (chomsky)

Головним чином дієслова, прикметники, іменники вводять характеристики з n параметрами. Для дієслів, n може дорівнювати 1 [неперехідні дієслова] або N +1 [перехідні дієслова, де N - кількість комплементов (доповнень, наступних за дієсловом у складеному присудку і описують його підмет)]. Для прикметників і іменників n дорівнює або більше 1 (відносини, де n - це n-місце його параметрів). Параметри представляють у реченні доповнення при імені іменник, дієслово або прикметник.

Наприклад, пропозиція

Chomsky writes a book

містить дієслово "write", іменник "book" та артикль "a" і може бути замінено наступною формою:

for a

B

such that

B is (a) book (1)

it is true that

Chomsky writes B (2)

де (1) і (2) є простими висловлюваннями.

Ця ж логічна структура може бути записана в стенографічних індексах:

a (B, book (B), writes (Chomsky), B)).

Зверніть увагу, що висловлювання (1) і (2) перетворюються в формули "book (B)" і "writes (Chomsky, B)," відповідно.

Логічна структура виражає зміст речення, і кожна з її складових частин відповідає сенсу відокремлених слів згідно з принципом Фреже. Записи, передають значення, вказуються як логічні структури, так як єдиним з області значення, що люди навчилися точним чином представляти у вигляді запису в ЕОМ, є логічні відносини.

Всякий артикль a представляє квантор q (кванторное слово) з трьома операціями переходу, що створює нову формулу з змінної x і двох формул f1 і f2,

q (x, f1, f2).

Ця формула відповідає висловленню

for ax such that e1, it is true that e2

де e1 і e2 є простими висловлюваннями відповідними f1 і f2.

Наприклад, пропозиція

Chomsky writes a book for each publisher

містить дієслово "write", два іменників ("book" та "publisher") і два артикля ("a" і "each") і може бути замінено наступною формою:

for each P such that P is a publisher it is true that for a B such that B is a book, it is true that Chomsky writes B for P

Пропозиція перетвориться в логічну структуру

each (P,

publisher (P),

a (B,

book (B),

writes-for (Chomsky, B, P))).

Ця логічна структура відображає наступне пріоритетне правило: в конструкції з використанням імені іменника (book) і його доповнення (publisher), квантування, представлене артиклем при доповненні, впливає на квантування, представлене артиклем при імені іменник. Крім цього правила Колмеройер запропонував ще 3 пріоритетних правила для організації можливості квантування.

АНАЛІЗ КОЛМЕРОЙЕРА ДЛЯ КОНКРЕТНОГО ЕЯ

Загальна схема аналізу була спочатку запропонована Колмеройером для французької та англійської мов. Пізніше Даль адаптував її для іспанського, Коелхо - для португальської, а Пік запропонував іншу семантику для артиклів французької мови.

ЗАГАЛЬНА СХЕМА АНАЛІЗУ КОЛМЕРОЙЕРА В ЯКОСТІ граматики, побудова на певні пропозиції (DCG)

DCGs підтримують процеси синтаксичного аналізу і транслювання завдяки взятим ними на озброєння з підмножини ЕЯ, необхідних елементів синтаксису та семантики. Процес синтаксичного аналізу складається з докази, що ланцюжок слів є законним і правильно побудованим пропозицією (з точки зору обраного синтаксису). Процедура докази здійснюється через дослідницьку стратегію (з кінця на початок, зверху вниз, зліва направо) і через правило умовиводи (логічного висновку), де висновком є ​​qv, вже після відпрацювання системи PROLOG. Трансляція полягає в зображенні кожної пропозиції у вигляді логічної структури. Ця структура складається з правильно побудованих формул певної логічної системи, яка грунтується на обсязі поняття логіки предикатів (qv).

Механізм транслювання виражається як безліч певних пропозицій логіки через граматичні правила PROLOGа. Він (механізм) може містити, як разом, так і окремо синтаксичні та семантичні знання з підмножини розглянутого ПМ. Механізм синтаксичного аналізу залежить від системи PROLOG, і він може бути розкритий включенням відстеженням пристрою. Трансляція і синтаксичний аналіз - незалежні один від одного процеси, їх незалежність дозволяє легше проводити зміни в граматиці.

Спрощена граматика, що позначається через G, розглядається наступним чином. Вона проводить синтаксичний аналіз англійських пропозицій, одночасно породжуючи відповідні їм логічні структури. Граматика визначається 2 модулями:

синтаксис + семантика

морфологія

і має справу з пропозиціями типу: Hodges writes for Penguin.

СИНТАКСИС + СЕМАНТИКА

sentences (S) -> noun-phrase (NP, S2, O),

verb ([subject-X | L], O1),

complements (L, O1, O2).

complements ([], O, O) -> [].

complements ([KN | L], O1, O3) -> complements (L, O1, O2),

case (K),

noun-phrase (N, O2, O3).

noun-phrase (N, O2, O4) -> article (N, O1, O2, O3),

common-noun ([subject-N | L], O1),

complements (L, O3, O4).

noun-phrase (PN, O, O) -> [PN], {proper-noun (PN)}.

article [A, O1, O2 and (O1, O2)] -> [a].

case (for) -> [for].

case (direct) -> [].

МОРФОЛОГІЯ

verb ([subject-A, for-P], is-published-by (A, P)) -> [writes].

common-noun ([subject-P], publisher (P)) -> [publisher].

proper-noun (hodges).

proper-noun (penguin).

Наприклад, правило:

noun-phrase (PN, O, O) -> [PN], {proper-noun (PN)}.

представляє собою структуру:

noun-phrase (PN, O, O, S0, S): - connects (S0, PN, S),

proper-noun (PN).

Перше правило граматики G, по ідеї, визнається справедливим тільки для пропозицій, в яких за іменний групою слід дієслово з можливо деякими доповненнями. Перше граматичне правило для додатків допускає їх відсутність (термінальний символ [] виступає в ролі порожнього списку), друге правило для доповнень визначає послідовність доповнень як групу даних, складену з доповнення, відмінка та іменний групи.

У Вашого відмінних один від одного нетермінальних символів пов'язані однієї і тієї ж логічної змінної. Це дозволяє будувати структури в процесі уніфікації.

Іменна група "a publisher" аналізується і транслюється граматичним правилом як:

noun-phrase (N, Oa, Ob) -> article (N, Oc, Od, Oe),

common-noun (N, of),

{Constraints (Oa, Ob, Oc, Od, Oe, Of)}.

Зауважте, що це правило - спрощена версія четвертого правила представленої граматики G. Нетермінальний символ для іменної групи має 3 параметри. Інтерпретація останнього параметра Ob буде залежати від характеристики Oa індивідуума N, оскільки в загальному іменна група містить артикль, такий як "a".

Тепер дивись на праву частину правила. Слово "a" має інтерпретацію Oe,

and (Oc, Od)

в контексті двох характеристик Oc і Od індивідуума N. Характеристика Oc буде відповідати решти іменний групи, що містить слово "a", а характеристика Od випливає із залишку пропозиції. Значить, Oe буде містити всеосяжну інтерпретацію і зв'язуватися з Ob через одну і ту ж змінну. Так як Of є характеристикою загального іменника, вона зв'язується з Oc однієї і тієї ж змінної. Oa має опис характеристик N, а також залежить від характеристик решти пропозиції. Тому Oa зв'язується з Od через одну і ту ж змінну.

Кожне слово асоціюється з характеристикою. Наприклад, значення дієслова "writes" вводиться відношенням "is-published-by (A, P)". Дієслівні правило також містить інформацію про характеристики відносини, а саме те, що "A" грає роль підлягає пропозиції а "P" "нав'язує" використання прийменника "for". Значення неозначеного артикля "a" вводиться кон'юнкція "and (O1, O2)" відповідно до визначення, прийнятому в класичній логіці.

Більш просунута в порівнянні з G граматика мала б більш скрупульозно розроблені дефініції іменників, дієслів, прикметників, артиклів:

noun ([A-[] & author & type-X], pr (author (X))) -> no (author, A).

no (Type, GN) -> [Noun], {no1 (Noun, Type, GN)}.

no1 (author, author, mas-sin).

verb ([(GN)-V & type-X, dir-AW & title-Y], pr (author (X, Y))) -> ve (writes, N).

ve (Type, N) -> [Verb], {ve1 (Verb, Type, N)}.

ve1 (writes, writes, sin).

adjective ([A-{} & author & type-X, divp (by )-_-[] & pub & type-Y], pr (published (Y, X))) -> ad (pub, A).

ad (Type, GN) -> [Adj], {ad1 (Adj, Type, GN)}.

ad1 (published, pub, mas-sin).

article (G-sin)-DX, O1, O2, for ([X, D] and (O1, O2)), cardinality (X, greater, 0))) art-ind (G-sin).

art-ind (mas-sin) -> [a]; [some].

(Зауваження: безіменні змінні записуються в PROLOG як "_".)

Ці дефініції включають синтаксичні та семантичні перевірки, такі як граматичний рід, число, семантичні типи. Значення артикля також відрізняється. Замість квантора з двома операціями переходу воно було введено квантором з трьома операціями переходу. Перша операція переходу - квантування змінної X, друга - для основної характеристики "and" змінної X, третя - для точного визначення характеристики (потужності множини) та обмеження області змінної X.

ОБЛАСТЬ ПОНЯТЬ граматики, побудова на певні пропозиції

Екстрапозіціонние граматики (XGs) збільшують потужність DCGs при перерахуванні контекстних залежностей. Правила XG можуть мати у своїй лівій частині більше одного нетермінального символу і символ пропуску "", що виражає випадкову ланцюжок логічних символів (термінальних і нетермінальних). Наприклад, правило екстрапозіціонной граматики

Relative-marker. . . complement -> [that].

стверджує, що відносний займенник "that" може бути проаналізовано як відносний показник, за яким слідують якісь невідомі фрази і потім доповнення.

XGs спрощують вираз синтаксичних уявлень і отже дозволяють спростити трактування семантичних і логічних описів. Параметри для нетермінальних символів використовуються (як і в DCGs) для перевірок узгодження, виробництва дерева синтаксичного аналізу та обмеження можливості приєднання постмодіфікаторов.

Граматики структури визначень (MSGs) збільшують ймовірність точного опису несінтаксіческіх репрезентацій. Вони спрощують автоматичне моделювання таких репрезентацій при одночасно відбувається аналізі.

Деревоподібні (або деревні) граматики (TGs) дозволяють краще орієнтувати лінгвістичні конструкції.

Ускладнені граматики (PGs) є засобом, розробленим спеціально для потреб лінгвістів. Правила їх стратегії описують порядок і режим трансляції, і описуються ці правила незалежно один від одного.

Додати в блог або на сайт

Цей текст може містити помилки.

Культура і мистецтво | Реферат
34.4кб. | скачати


Схожі роботи:
Логічна структура понять
Судження і логічна характеристика
Індексні системи та їх логічна основа
Логічна природа доказування в слідчій і судовій практиці
Аргументація і доказ як її логічна основа Структура докази
Питання безпеки в мережі апаратна програмна і логічна безпека
Трансформаційна граматика
Англійська граматика
Історична граматика
© Усі права захищені
написати до нас