Взаємодія математики та мовознавства

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Зміст
Введення
Глава 1. Історія застосування математичних методів у лінгвістиці
1.1. Становлення структурної лінгвістики на рубежі XIX - ХХ століть
1.2. Застосування математичних методів у лінгвістиці у другій половині ХХ століття
Глава 2. Окремі приклади використання математики в лінгвістиці
2.1. Машинний переклад
2.2.Статістіческіе методи у вивченні мови
2.3. Вивчення мови методами формальної логіки
2.4. Перспективи застосування математичних методів у лінгвістиці
Висновок
Література
Додаток 1. Ronald Schleifer. Ferdinand de Saussure
Додаток 2. Фердинанд де Соссюр (переклад)

Введення
У ХХ столітті намітилася що продовжується і понині тенденція до взаємодії та взаємопроникнення різних областей знань. Поступово стираються грані між окремими науками; з'являється все більше галузей розумової діяльності, що є «на стику» гуманітарного, технічного та природничо-наукового знання.
Інша очевидна особливість сучасності - прагнення до вивчення структур і складових їх елементів. Тому все більше місце як в науковій теорії, так і на практиці приділяється математики. Стикаючись, з одного боку, з логікою і філософією, з іншого боку, зі статистикою (а, отже, і з суспільними науками), математика все глибше проникає в ті сфери, які протягом довгого часу було прийнято вважати суто «гуманітарними», розширюючи їх евристичний потенціал (відповідь на запитання «скільки» часто помоагет відповісти і на запитання «що» і «як). Винятком не стало і мовознавство.
Мета моєї курсової роботи - коротко висвітлити зв'язок математики з такою галуззю мовознавства, як лінгвістика. Починаючи з 50-х років минулого століття, математика застосовується в лінгвістиці при створенні теоретичного апарату для опису будови мов (як природних, так і штучних). Проте слід сказати, що вона не відразу знайшла собі подібне практичне застосування. Спочатку математичні методи в лінгвістиці стали використовуватися для того, щоб уточнити основні поняття мовознавства, однак з розвитком комп'ютерної техніки подібна теоретична посилка стала знаходити застосування на практиці. Дозвіл таких завдань, як машинний переклад, машинний пошук інформації, автоматична обробка тексту вимагало принципово нового підходу до мови. Перед лінгвістами назріло питання: як навчитися представляти мовні закономірності в тому вигляді, в якому їх можна подавати безпосередньо на техніку. Популярним в наш час терміном «математична лінгвістика» називають будь-які лінгвістичні дослідження, в яких застосовуються точні методи (а поняття точних методів у науці завжди тісно пов'язане з математикою). Деякі вчені минулих років, вважають, що саме вираження не можна зводити в ранг терміна, так як воно позначає не якусь особливу «лінгвістику», а лише новий напрям, орієнтований на удосконалення, підвищення точності і надійності методів дослідження мови. У лінгвістиці використовуються як кількісні (алгебраїчні), так і некількісних методи, що зближує її з математичною логікою, а, отже, і з філософією, і навіть з психологією. Ще Шлегель зазначав взаємодія мови і свідомості, а видатний лінгвіст початку ХХ століття Фердинанд де Соссюр (про його вплив на становлення математичних методів у лінгвістиці розповім пізніше) пов'язував структуру мови з його приналежністю до народу. Сучасний дослідник Л. Перловська [43] йде далі, ототожнюючи кількісні характеристики мови (наприклад, кількість пологів, відмінків) з особливостями національного менталітету (про це в розділі 2.2, «Статистичні методи в лінгвістиці»).
Взаємодія математики та мовознавства - тема багатогранна, і в своїй роботі я зупинюся не на всіх, а, в першу чергу, на її прикладних аспектах.

Глава I. Історія застосування математичних методів у лінгвістиці
1.1 Становлення структурної лінгвістики на рубежі XIX - ХХ століть
Математичне опис мови грунтується на уявленні про мову як про механізм, висхідному до відомого швейцарського лінгвісту початку ХХ століття Фердинанд де Соссюр.
Початкова ланка його концепції - теорія мови як системи, відбувся з трьох частин (власне мова - langue, мова - parole, і мовну діяльність - langage), в якій кожне слово (член системи) розглядається не саме по собі, а у зв'язку з іншими членами. Як згодом зазначив інший видатний лінгвіст, датчанин Луї Ельмслев, Соссюр «перший вимагали структурного підходу до мови, тобто наукового опису мови шляхом реєстрації співвідношень між одиницями» [22, c. 54].
Розуміючи мову як ієрархічну структуру, Соссюр першим поставив проблему цінності, значущості мовних одиниць. Окремі явища і події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не самі по собі, а в системі, в якій вони співвіднесені з подібними ж складовими.
Структурною одиницею мови Соссюр вважав слово, «знак», в якому поєднувалися звучання і сенс. Жоден з цих елементів не існує одне без одного: тому носію мови зрозумілі різні відтінки значення багатозначного слова як окремого елемента в структурному цілому, у мові.
Таким чином, в теорії Ф. де Соссюра можна побачити взаємодія лінгвістики, з одного боку, з соціологією і соціальною психологією (слід зазначити, що в цей же час розвиваються феноменологія Гуссерля, психоаналіз Фрейда, теорія відносності Ейнштейна, відбуваються експерименти над формою і змістом у літературі, музиці та образотворчому мистецтві), з іншого боку - з математикою (поняття системності відповідає алгебраїчній концепції мови). Подібна концепція змінила поняття мовної інтерпретації як такої: Явища стали трактуватися не щодо причин їх виникнення, а щодо сьогодення і майбутнього. Тлумачення перестало бути незалежним від намірів людини (незважаючи на те, що наміри можуть бути безособовими, «несвідомими» під фрейдистському розумінні цього слова).
Функціонування ж мовного механізму проявляється через мовну діяльність носіїв мови. Результатом мови є так звані «правильні тексти» - послідовності мовних одиниць, що підкоряються певним закономірностям, багато з яких допускають математичний опис. Вивченням способів математичного опису правильних текстів (у першу чергу, пропозицій) займається теорія способів опису синтаксичної структури. У подібній структурі мовні аналогії визначені не за допомогою споконвічно притаманних їм якостей, а з допомогою системних («структурних») відносин.
На Заході соссюровского ідеї розвивають молодші сучасники великого швейцарського лінгвіста: у Данії - вже згаданий мною Л. Ельмслев, який дав початок алгебраїчної теорії мови в своїй праці «Основи лінгвістичної теорії», в США - Е. Сепір, Л. Блумфілд, Ц. Харріс, у Чехії - російський учений-емігрант М. Трубецькой.
Статистичними ж закономірностями у вивченні мови став займатися не хто інший, як основоположник генетики Георг Мендель. Тільки в 1968 році філологи виявили, що, виявляється, в останні роки життя він був захоплений вивченням лінгвістичних явищ з допомогою методів математики. Цей метод Мендель привніс в лінгвістику з біології; в дев'яності роки дев'ятнадцятого століття лише найсміливіші лінгвісти і біологи заявляли про доцільність такого аналізу. В архіві монастиря св. Томаша в м. Брно, абатом якого був Мендель, були знайдені листки зі стовпцями прізвищ, що закінчуються на «mann», «bauer», «mayer», і з якимись дробами і обчисленнями. Прагнучи виявити формальні закони походження фамільних імен, Мендель виробляє складні підрахунки, у яких враховує кількість голосних і приголосних у німецькій мові, загальне число розглянутих ним слів, кількість прізвищ і т.д.
У нашій країні структурна лінгвістика почала розвиватися приблизно в той же час, що і на Заході - на рубежі XIX-XX століть. Одночасно з Ф. де Соссюром поняття мови як системи розробляли у своїх працях професора Казанського університету Ф.Ф. Фортунатов і І.А. Бодуен де Куртене. Останній протягом довгого часу листувався з де Соссюром, відповідно, женевська і казанська школи мовознавства співпрацювали один з одним. Якщо Соссюра можна назвати ідеологом «точних» методів у лінгвістиці, то Бодуен де Куртене заклав практичні основи їх застосування. Він першим відокремив лінгвістику (як точну науку, що використовує статистичні методи і функціональну залежність) від філології (спільності гуманітарних дисциплін, які вивчають духовну культуру через мову і мовлення). Сам вчений вважав, що «мовознавство може принести користь у найближчому майбутньому, лише звільнившись від обов'язкового союзу з філологією та історією літератури» [13, c.102]. «Випробувальним полігоном» для впровадження математичних методів в лінгвістику стала фонологія - звуки як «атоми» мовної системи, що володіють обмеженою кількістю легко вимірних властивостей, були найзручнішим матеріалом для формальних, суворих методів опису. Фонологія заперечує наявність сенсу у звуку, так що в дослідженнях усувався «людський» чинник. У цьому сенсі фонеми подібні фізичним або біологічним об'єктам.
Фонеми, як самі дрібні мовні елементи, прийнятні для сприйняття, являють собою окрему сферу, окрему «феноменологічну реальність». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але в усіх випадках людина, що володіє англійською, буде сприймати його як «т». Головне, що фонема буде виконувати свою головну - смислоразлічітельную - функцію. Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншому, наприклад «л» і «р» в англійському різні, в той час як в інших мовах це різновиди однієї фонеми (подібно англійському «т », вимовлене з придихом або без). Великий словниковий запас будь-якого природної мови являє собою набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для проголошення та написання близько мільйона слів використовується всього 40 фонем.
Звуки мови являють собою системно організований набір рис. У 1920е-1930-, слідом за Соссюром, Якобсон та М. С. Трубецькой виділили «відмітні риси» фонем. Ці риси засновані на будові органів мови - мови, зубів, голосових зв'язок. Скажімо, в англійському різниця між «т» і «д» полягає в наявності або відсутності «голоси» (напрузі голосових зв'язок) та в рівні голоси, що різнить одну фонему від іншої. Таким чином, фонологію можна вважати прикладом спільного мовного правила, описаного Соссюром: «У мові є тільки відмінності» [24, c. 145]. Більш важливо навіть не це: відмінність зазвичай має на увазі точні умови, між якими вона перебуває; але в мові існують лише різницю без точних умов. Розглядаємо чи ми «позначення» або «позначуване» - у мові не існує ні понять, ні звуків, які існували б до того, як розвинулася мовна система.
Таким чином, в соссюровского мовознавстві досліджуваний феномен розуміється як звід зіставлень і протиставлень мови. Мова - це і вираз значення слів, і засіб спілкування, причому ці дві функції ніколи не збігаються. Ми можемо помітити чергування форми і змісту: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють, щоб створити певний значиме зміст. Так як елементи мови випадкові, ні контраст, ні поєднання не можуть бути основою. Значить, у мові відмітні ознаки формують фонетичний контраст на іншому рівні розуміння, фонеми з'єднуються в морфеми, морфеми - у слова, слова - в пропозиції і т.д. У будь-якому випадку, ціла фонема, слово, речення і т.д. являє собою щось більше, ніж просто сума складових.
Соссюр запропонував ідею нової науки двадцятого століття, окремо від лінгвістики вивчає роль знаків у суспільстві. Соссюр назвав цю науку семіології (від грецького «semeîon» - знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920е-1930-і в Парижі в 1950-ті - 1960-ті, розширила вивчення мови та лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно совему курсу загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою, вивчити в системі проблему «ймовірності» у мові. Таке дослідження допомагає зосередитися на «речової стороні» ймовірності; «ключове слово», анаграму якого шукає Соссюр, як стверджує Жан Старобінський, «інструмент для поета, а не джерело життя вірші». Вірш служить для того, щоб поміняти місцями звуки ключового слова. За словами Старобінського, в цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, в його роботах помітно бажання уникнути питань, пов'язаних зі свідомістю: «так як поезія виражається не тільки в словах, але і в тому, що породжують ці слова, вона виходить з-під контролю свідомості і залежить тільки від законів мови» (cм . Додаток 1).
Спроба Соссюра вивчити імена власні в пізньої римської поезії підкреслює одну із складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюровского лінгвістики, що виключає можливість аналізу змісту. Тодоров робить висновок, що в наші дні праці Соссюра виглядають на рідкість послідовними у небажанні вивчати символи явища, що мають чітко визначене значення [Додаток 1]. Досліджуючи анаграми, Соссюр звертає увагу тільки на повторення, але не на попередні варіанти. . . . Вивчаючи «Пісня про Нібелунгів», він визначає символи тільки для того, щоб привласнити їх помилковим читань: якщо вони ненавмисно, символів не існує. Зрештою, у своїх працях з загальної лінгвістики він робить припущення про існування семіології, яка описує не тільки лінгвістичні знаки, але це припущення обмежується тим, що семіoлогія може описувати лише випадкові, довільні знаки.
Раз це дійсно так, то тільки тому, що не міг уявити «намір» без предмета, і він не міг до кінця подолати прірву між формою і змістом - в його працях це перетворювалося на питання. Замість цього він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, заснованими на історії і суб'єктивних здогадах, і методах випадкової інтерпретації, заснованих на цих концепціях, і, з іншого боку, структуралістських концепцій, що стирає протистояння між формою і змістом (суб'єктом і об'єктом), значенням і походженням в структуралізмі, психоаналізі і навіть квантової механіки - праці Фердинанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.
Російські вчені були представлені і на Першому міжнародному конгресі лінгвістів в Гаазі в 1928 році. С. Карцевський, Р. Якобсон та М. Трубецькой виступили з доповіддю, в якому розглядалася ієрархічна структура мови - в дусі найсучасніших для початку минулого століття уявлень. Якобсон у своїх працях розвивав ідеї Соссюра про те, що базові елементи мови повинні вивчатися, в першу чергу, у зв'язку зі своїми функціями, а не з причинами їх виникнення.
На жаль, після приходу в 1924 році до влади Сталіна вітчизняне мовознавство, як і багато інших наук, відкидає назад. Багато талановитих вчених змушені були емігрувати, були вислані з країни або загинули в таборах. Тільки з середини 1950-х років став можливий деякий плюралізм теорій - про це в розділі 1.2.
1.2 Застосування математичних методів у лінгвістиці у другій половині ХХ століття
До середини ХХ століття сформувалося чотири світові лінгвістичних школи, кожна з яких виявилася родоначальником певного «точного» методу. Ленінградська фонологічна школа (її родоначальником був учень Бодуена де Куртене Л. В. Щерба) використовувала в якості основного критерію узагальнення звуку у вигляді фонеми психолінгвістичний експеримент , заснований на аналізі мови носіїв мови.
Вчені Празького лінгвістичного гуртка, зокрема - його засновник Н.С. Трубецькой, який емігрував з Росії, розробили теорію опозицій - семантична структура мови була описана ними як набір оппозітівно побудові семантичних одиниць - сем. Ця теорія застосовувалася у вивченні не тільки мови, а й художньої культури.
Ідеологами американського дескріптівізм були мовознавці Л. Блумфілд і Е. Сепір. Мова представлявся дескріптівістов у вигляді сукупності мовних висловлень, які й були головним об'єктом їх дослідження. У центрі їх уваги опинилися правила наукового опису (звідси назва) текстів: вивчення організації, аранжування і класифікація їх елементів. Формалізація аналітичних процедур в галузі фонології та морфології (розробка принципів дослідження мови на різних рівнях, дистрибутивного аналізу, методу безпосередньо складових і т.д.) призвела до постановки загальних питань лінгвістичного моделювання. Неувага до плану змісту мови, а також парадигматичної стороні мови не дозволило дескріптівістов досить повно інтерпретувати мову як систему.
У 1960-х роках розвивається теорія формальних граматик, що виникла, головним чином, завдяки роботам американського філософа і лінгвіста Н. Хомського. Він по праву вважається одним з найбільш відомих сучасних учених і громадських діячів, йому присвячено безліч статей, монографій і навіть повнометражний документальний фільм. На ім'я принципово нового способу опису синтаксичної структури, винайденого Хомським - генеративної (породжує) граматики - відповідне течія в лінгвістиці отримало назву генеративізму.
Хомський, нащадок вихідців з Росії, з 1945 року вивчав в Пенсильванському університеті лінгвістику, математику і філософію, перебуваючи під сильним впливом свого вчителя Зеліг Херріс - як і Херріс, Хомський вважав і вважає свої політичні погляди близькими до анархізму (до цих пір він відомий як критик існуючого політичного ладу США і як один з духовних лідерів антиглобалізму).
Перша велика наукова робота Хомського, магістерська дисертація «Морфологія сучасної івриту» (1951), так і залишилася неопублікованою. Докторську ступінь Хомський отримав в Пенсильванському університеті в 1955, однак більша частина досліджень, покладених в основу дисертації (повністю опублікованій лише у 1975 під назвою «Логічна структура лінгвістичної теорії») і його першої монографії «Синтаксичні структури» (Syntactic Structures, 1957, рос. пер. 1962), була виконана в Гарвардському університеті в 1951-1955. У тому ж 1955 вчений перейшов до Массачусетського технологічного інституту, професором якого він став у 1962.
У своєму розвитку теорія Хомського пройшла кілька етапів.
У першій монографії «Синтактична структури» вчений представив мову як механізмепорожденія нескінченної кількості пропозицій за допомогою кінцевого набору граматичних засобів. Для опису мовних властивостей він запропонував поняття глибинної (прихованою від безпосереднього сприйняття і породжується системою рекурсивних, тобто можуть застосовуватися багаторазово, правил) і поверхневої (безпосередньо сприймають) граматичних структур, а також трансформацій, що описують перехід від глибинних структур до поверхневих. Однією глибинній структурі можуть відповідати кілька поверхневих (наприклад, пасивна конструкція Указ підписується президентом виводиться з тієї ж глибинної структури, що й активна конструкція Президент підписує указ) і навпаки (так, неоднозначність Мати любить дочку описується як результат збігу поверхневих структур, висхідних до двох різних глибинним, в одній з яких мати - та, хто любить дочку, а в іншій - та, кого любить дочка).
Стандартною теорією Хомського вважається модель «Аспектів», викладена в книзі Хомського «Аспекти теорії синтаксису». У цій моделі у формальну теорію вперше вводилися правила семантичної інтерпретації, яка приписує значення глибинних структур. У «правові аспекти» мовна компетенція протиставлена ​​вживання мови (performance), прийнята так звана гіпотеза Катца - постав про збереження сенсу при трансформації, у зв'язку з чим виключено поняття факультативної трансформації, а також введено апарат синтаксичних ознак, що описують лексичну сполучуваність.
У 1970-і Хомський працює над теорією управління і зв'язування (GB-теорія - від слів government і binding) - більш загальної, ніж попередня. У ній учений відмовився від специфічних правил, що описують синтаксичні структури конкретних мов. Усі трансформації були замінені однієї універсальної трансформацією переміщення. У рамках GB-теорії існують і приватні модулі, кожен з яких відповідає за свою частину граматики.
Вже нещодавно, у 1995 році, Хомський висунув мінімалістську програму, де людська мова описується подібно машинного. Це лише програма - не модель і не теорія. У ній Хомський виділяє дві головні підсистеми мовного апарату людини: лексикон і обчислювальну систему, а також два інтерфейси - фонетичний і логічний.
Формальні граматики Хомського стали класичними для опису не тільки природних, але і штучних мов - зокрема, мов програмування. Розвиток структурної лінгвістики в другій половині ХХ століття можна по праву вважати «хомськіанську революцією».
Московська фонологічна школа, представниками якої були А.А. Реформатський, В.М. Сидоров, П.С. Кузнєцов, А.М. Сухотін, Р.І. Аванесов, використовувала подібну ж теорію для вивчення фонетики. Поступово «точні» методи починають застосовуватися стосовно не тільки фонетики, але і синтаксису. Структурністю мови починають займатися і лінгвісти, і математики - як у нас, так і за кордоном. У 1950-60-ті в СРСР починається новий етап у взаємодії математики та лінгвістики, пов'язаний з розробкою систем машинного перекладу.
Поштовхом до початку цих робіт у нашій країні послужили перші розробки в галузі машинного перекладу в США (хоча перше механізоване перекладне пристрій П. П. Смирнова-Троянського було винайдено в CCCР ще в 1933 році, воно, будучи примітивним, не набуло поширення). У 1947 році А. Бутт і Д. Бріттен придумали код для послівного переказу за допомогою ЕОМ, роком пізніше Р. Риченс запропонував правило розбиття слів на основу і закінчення при машинному перекладі. У ті роки досить сильно відрізнялися від сучасних. Це були дуже великі і дорогі машини, які займали цілі кімнати і вимагали для свого обслуговування великий штат інженерів, операторів і програмістів. В основному ці комп'ютери використовувалися для здійснення математичних розрахунків для потреб військових установ - нове у математиці, фізиці й техніці служило, в першу чергу, військовій справі. На ранніх етапах розробка МП активно підтримувалася військовими, при цьому (в умовах «холодної війни») в США розвивалося російсько-англійське напрямок, а в СРСР - англо-російське.
У січні 1954 року в Массачусетському технічному університеті відбувся «Джорджтаунський експеримент» - перша публічна демонстрація перекладу з російської мови на англійську на машині ІБМ-701. Реферат повідомлення про вдале проходження експерименту, зроблений Д.Ю. Пановим, з'явився в РЖ «Математика», 1954, № 10: «Переклад з однієї мови на іншу за допомогою машини: звіт про перший успішне випробування».
До робіт по машинному перекладу Д. Ю. Панов (на той час директор Інституту наукової інформації - ІНІ, пізніше ВІНІТІ) залучив І. К. Бєльський, яка пізніше очолить групу машинного перекладу в Інституті точної математики та обчислювальної техніки АН СРСР. До кінця 1955 року належить перший досвід перекладу з англійської мови на російську за допомогою машини БЕСМ. Програми для БЕСМ становили Н.П. Трифонов і Л.М. Корольов, кандидатська дисертація якого була присвячена методам побудови словників для машинного перекладу.
Паралельно роботи по машинному перекладу велися у Відділенні прикладної математики Математичного інституту АН СРСР (нині Інститут прикладної математики імені М. В. Келдиша РАН). За ініціативою математика А.А. Ляпунова. До робіт з перекладу текстів на машині «Стріла» з французької мови на російську він залучив аспірантку МІАН О.С. Кулагіну і своїх учениць Т.Д. Вентцель і М.М. Рікко. Уявлення Ляпунова та Кулагіної про можливість використання техніки для перекладу з однієї мови на іншу були опубліковані в журналі «Природа», 1955, № 8. З кінця 1955 року до них приєдналася Т.М. Молошная, потім приступила до самостійної роботи над алгоритмом англо-російського перекладу.
Р. Фрумкіна [37, c.12], що займалася в той час алогрітмом перекладу з іспанської, згадує, що на цьому етапі робіт складно було робити якісь послідовні кроки. Набагато частіше доводилося слідувати евристичному досвіду - своєму або колег.
Однак перше покоління систем машинного перекладу було дуже недосконалим. Всі вони базувалися на алгоритмах послідовного перекладу «слово за словом», «фраза за фразою» - смислові зв'язки між словами і реченнями ніяк не враховувалися. Для прикладу можна навести пропозиції: «John was looking for his toy box. Finally he found it. The box was in the pen. John was very happy. (Джон шукав свою іграшкову коробку. Нарешті він її знайшов. Коробка була в манежі. Джон був дуже щасливий.) ». «Pen» в даному контексті - не «ручка» (інструмент для письма), а «дитячий манеж» (play-pen). Знання синонімів, Антоніо і переносних значень складно вводити в комп'ютер. Перспективним напрямком ставала розробка машинних систем, орієнтованих на використання людиною-перекладачем.
З часом на зміну системам прямого перекладу прийшли Т-системи (від англійського слова «transfer» - перетворення), в яких переклад здійснювався на рівні синтаксичних структур. В алгоритмах Т-систем використовувався механізм, що дозволяє побудувати синтаксичну структуру за правилами граматики мови вхідного пропозиції (подібно до того, як вчать іноземної мови в середній школі), а потім синтезувати вихідну пропозицію, перетворюючи синтаксичну структуру і підставляючи зі словника потрібні слова.
Ляпунов говорив про переведення шляхом вилучення сенсу тексту, що перекладається і його представлення на іншій мові. Підхід до побудови систем машинного перекладу, заснований на отриманні смислового представлення вхідного пропозиції шляхом його семантичного аналізу та синтезу вхідного пропозиції по отриманому смисловому поданням, до цих пір вважається найбільш досконалим. Такі системи називають І-системами (від слова «інтерлінгва»). Проте завдання щодо їх створення, поставлена ​​ще в кінці 50-х - початку 60-х, не вирішена повністю до цих пір, незважаючи на зусилля Міжнародної федерації IFIP - світового співтовариства вчених в області обробки інформації.
Вчені задумалися над тим, як потрібно формалізувати і будувати алгоритми для роботи з текстами, які словники треба вводити в машину, які лінгвістичні закономірності слід використовувати при машинному перекладі. Такими уявленнями традиційна лінгвістика не мала у своєму розпорядженні - не тільки в частині семантики, але і в частині синтаксису. Ні для однієї мови на той час не існувало переліків синтаксичних конструкцій, які не були вивчені умови їх сполучуваності та взаімозмаеняемості, не були розроблені правила побудови великих одиниць синтаксичної структури з більш дрібних складових елементів.
Потреба у створенні теоретичних основ машинного перекладу і привела до формування і розвитку математичної лінгвістики. Провідну роль у цій справі у СРСР зіграли математики А.А. Ляпунов, О.С. Кулагіна, В.А. Успенський, лінгвісти В.Ю. Розенцвейг, П.С. Кузнєцов, Р.М. Фрумкіна, А.А. Реформатський, І.А. Мельчук, В.В. Іванов. Дисертація Кулагіної була присвячена дослідженню формальної теорії граматик (одночасно з Н. Хомським в США), Кузнецов висунув завдання аксіоматизації лінгвістики, висхідну до робіт Ф.Ф. Фортунатова.
6 травня 1960 була прийнята Постанова Президії АН СРСР «Про розвиток структурних і математичних методів дослідження мови», в Інституті мовознавства та Інституті російської мови були створені відповідні підрозділи. З 1960 року в провідних гуманітарних вузах країни - філологічному факультеті МГУ, Ленінрадском, Новосибірськом університетах, МГПИИЯ - почалася підготовка кадрів у галузі автоматичної обробки тексту.
Проте роботи по машинному перекладу цього періоду, званого «класичним», являють собою скоріше теоретичний, ніж практичний інтерес. Економічно ефективні системи машинного перекладу стали створюватися лише у вісімдесяті роки минулого століття. Про це я розповім пізніше, у розділі 2.1, «Машинний переклад».
До 1960-го - 70-х років належать глибокі теоретичні розробки, що використовують методи теорії множин і математичної логіки, такі, як теорія поля і теорія нечітких множин.
Автором теорії поля в лінгвістиці був радянський поет, перекладач і лінгвіст В.Г. Адмоні. Свою теорію він спочатку розробляв на основі німецької мови. У Адмоні поняття «поле» позначає довільне непорожнє безліч мовних елементів (наприклад, «лексичне поле», «семантичне поле»).
Структура поля неоднорідна: воно складається з ядра, елементи якого володіють повним набором ознак, що визначають кількість, і периферії, елементи якої можуть мати як ознаками даної множини (не всіма), так і сусідніх. Наведу приклад, який ілюструє це висловлювання: скажімо, в англійській мові поле складних слів («day-dream» - «мріяти» трудноотделимая від поля словосполучень («tear gas» - «сльозогінний газ»).
З теорією поля тісно пов'язана вже згадана вище теорія нечітких множин. У СРСР її обгрунтуванням займалися лінгвісти В.Г. Адмоні, І.П. Іванова, Г.Г. Поченцов, проте її родоначальником був американський математик Л. Заде, в 1965 році випустив статтю «Fuzzy Logic». Даючи математичне обгрунтування теорії нечітких множин, Заде розглядав їх на лінгвістичному матеріалі.
У цій теорії мова йде вже не стільки про належність елементів до даного безлічі (АÎа), скільки про ступінь цієї належності (mАÎа), так як периферійні елементи можуть в тій чи іншій мірі належати декількох полях. Заде (Лофті-заде) був вихідцем з Азербайджану, до 12 років мав практику спілкування на чотирьох мовах - азербайджанською, російською, англійською та перською - і користувався трьома різними алфавітами: кирилицею, латинською, арабською. Коли вченого запитують, що спільного між теорією нечітких множин та лінгвістикою, він не заперечує зв'язку з цим, але уточнює: «Я не впевнений, що вивчення цих мов справила великий вплив на моє мислення. Якщо це й мало місце, то хіба що підсвідомо ». У юності Заде навчався в Тегерані в пресвітеріанської школі, а після Другої світової війни емігрував до США. «Питання не в тому, чи є я американцем, російською, азербайджанцем або кимось ще, - сказав він в одній із розмов, - я сформований всіма цими культурами і народами і відчуваю себе досить комфортно серед кожного з них» [34, c .13]. У цих словах є щось родинне того, що характеризує теорію нечітких множин - відхід від однозначних визначень і різких категорій.
У нашій країні в 70-переводяться і вивчаються праці західних лінгвістів ХХ століття. І.А. Мельчук переклав на російську мову твори М. Хомського. Н.А. Слюсарева у своїй книзі «Теорія Ф. де Соссюра в світлі сучасної лінгвістики» пов'язує постулати соссюровского навчання з актуальними проблемами лінгвістики 70-х. Намічається тенденція до подальшої математизації лінгвістики. У провідних вітчизняних вузахідет підготовка кадрів за спеціальністю «Математична (теоретична, прикладна) лінгвістика». В цей же час на Заході відбувається різкий стрибок у розвитку обчислювальної техніки, для чого потрібні дедалі нові лінгвістичні основи.
У 1980-і роки професор Інституту сходознавства АН Ю.К. Лекомцев, займаючись аналізом мови лінгвістики через аналіз схем, таблиць та інших видів запису, використовуваних в лінгвістичних описах, розглядає математичні системи, придатні для цих цілей (в основному - системи матричної алгебри).
Таким чином, протягом усього ХХ століття йшло зближення точних і гуманітарних наук. Взаємодія математики з лінгвістикою все частіше знаходило практичне застосування. Про це - в наступному розділі.

Глава 2. Окремі приклади використання математики в лінгвістиці
2.1 Машинний переклад
Ідея перекладу з однієї мови на іншу за допомогою універсального механізму виникла декількома століттями раніше, ніж почалися перші розробки в цій області - ще в 1649 році Рене Декарт запропонував ідею мови, в якому еквівалентні ідеї різних мов виражалися б одним символом. Перші спроби здійснити цю ідею в 1930-40е, початок теоретичних розробок в середині століття, удосконалення систем переказу за допомогою техніки в 1970-80е, бурхливий розвиток перекладацької техніки в останнє десятиліття - такі етапи розвитку машинного перекладу як галузі. Саме з робіт по машинному перекладу зросла комп'ютерна лінгвістика як наука.
З розвитком обчислювальної техніки в кінці 70х - початку 80х дослідники задалися більш реалістичними і економічно вигідними цілями - машина ставала не конкурентом (як передбачалося раніше), а помічником людини-перекладача. Машинний переклад перестає служити виключно військовим завданням (всі радянські і американські винаходи і дослідження, орієнтовані, в першу чергу, на російську та англійську мови, в тій чи іншій мірі сприяли «холодній війні»). У 1978 році слова природної мови були передані в об'єднаній мережі Arpa, шістьма роками пізніше в США з'явилися перші програми перекладу для мікрокомп'ютерів.
У 70-і Комісія Європейських Громад купує англо-французьку версію комп'ютерного перекладача Systran, замовляючи також франко-Англійскою і італо-англійську версії, і систему перекладу з російської на англійську, використалася американськими Збройними Силами. Так були закладені основи проекту EUROTRA.
Про відродження машинного перекладу в 70-80-і рр.. свідчать наступні факти: Комісія Європейських громад (CEC) купує англо-французьку версію Systran, а також систему перекладу з російської на англійську (остання розвивалася після доповіді ALPAC і продовжувала використовуватися ВПС США і НАСА); крім того, CEC замовляє розробку франко-англійській і італо-англійської версій. Одночасно відбувається швидке розширення діяльності щодо створення систем машинного перекладу в Японії; в США Панамериканська організація охорони здоров'я (PAHO) замовляє розробку іспано-англійського напрямку (система SPANAM); ВПС США фінансують розробку системи машинного перекладу в Лінгвістичному дослідному центрі при Техаському університеті в Остіні; група TAUM в Канаді досягає помітних успіхів у розробці своєї системи METEO (для перекладу метеорологічних зведень). Цілий ряд проектів, розпочатих у 70-80-і рр.. згодом розвинулися в повноцінні комерційні системи.
За період 1978-93 у США на дослідження в галузі машинного перекладу витрачено 20 мільйонів доларів, у Європі - 70 мільйонів, в Японії - 200 мільйонів.
Однією з нових розробок стала технологія TM (translation memory), що працює за принципом накопичення: в процесі перекладу зберігається вихідний сегмент (пропозиція) і його переклад, в результаті чого утворюється лінгвістична база даних; якщо ідентичний або подібний вихідного сегмент виявляється у знову перекладному тексті, він відображається разом з перекладом і зазначенням збігу в відсотках. Потім перекладач приймає рішення (редагувати, відхилити або прийняти переклад), результат якого зберігається системою, тому не треба двічі переводити одне і те ж речення. В даний час розробником відомої комерційної системи, заснованої на технології TM, є система TRADOS (заснована в 1984 р.).
В даний кілька десятків компаній займаються розробкою комерційних систем машинного перекладу, в їх числі: Systran, IBM, L & H (Lernout & Hauspie), Transparent Language, Cross Language, Trident Software, Atril, Trados, Caterpillar Co., LingoWare; Ata Software; Lingvistica bv та ін З'явилася можливість скористатися послугами автоматичних перекладачів безпосередньо в Мережі: alphaWorks; PROMT's Online Translator; LogoMedia.net; AltaVista's Babel Fish Translation Service; InfiniT.com; Translating the Internet.
Комерційно ефективні перекладацькі системи з'явилися в другій половині 80х і в нашій країні. Розширилося саме поняття машинного перекладу (до нього стали відносити «створення цілого ряду автоматичних і автоматизованих систем і пристроїв, що виконують автоматично або напівавтоматично весь цикл перекладу або окремі завдання у діалозі з людиною» [29, c.13]), збільшилися державні асигнування на розвиток цієї галузі.
Основними мовами вітчизняних перекладацьких систем стали російська, англійська, німецька, французька та японська. У Всесоюзному центрі переказів (ВЦП) була розроблена система перекладу з англійської та німецької мов на російську на машині ЕОМ ЄС-1035-АНРАП. Вона складалася з трьох словників - вхідних англійської та німецької та вихідного російської - під єдиним програмним забезпеченням. Існувало кілька змінних спеціалізованих словників - з обчислювальної техніки, програмування, радіоелектроніки, машинобудування, сільського господарства, металургії. Система могла працювати в двох режимах - автоматичному і інтерактивному, коли на екрані відображався пофразно вихідний текст і переклад, який людина могла відредагувати. Швидкість перекладу тексту на АНРАП (від початку набору до закінчення друку) становила приблизно 100 сторінок на годину.
У 1989 році було створено сімейство комерційних перекладачів типу СПРІНТ, що працювали з російською, англійською, німецькою та японською мовами. Їх головною перевагою стала їх сумісність з IBM PC - таким чином вітчизняні системи машинного перекладу досягали міжнародного рівня якості. У цей же час розробляється система машинного перекладу з французької мови на російську ФРАП, що включає в себе 4 етапи аналізу тексту: графематіческій, морфологічний, синтаксичний і семантичний. У ЛДПІ ім. Герцена йшла робота над чотирьохмовного (англійська, французька. Іспанська, російська) системою СІЛОД-МП (в промисловому режимі експлуатувалися англо-російський і франко-російський словники.
Для спеціалізованого перекладу текстів з електротехніки існувала система ЕТАП-2. Аналіз вхідного тексту в ній здійснювався на двох рівнях - морфологічному і синтаксичному. Словник ЕТАП-2 містив близько 4 тисяч статей; етап перетворення тексту - близько 1000 правил (96 загальних, 342 приватних, решта - словникові). Все це забезпечувало задовільну якість перекладу (скажімо, заголовок патенту «Optical phase grid arrangement and coupling device having such an arrangement» перекладався як «Пристрій оптичної фазової сітки і з'єднуюче пристрій з таким пристроєм» [29, c.20] - незважаючи на тавтологію, сенс збережений).
У Мінському педагогічному інституті іноземних мов на базі англо-російського словника словоформ і зворотів була винайдена система машинного перекладу заголовків), в Інституті сходознавства АН - система перекладу з японської на російську. Створена в Московському НДІ систем автоматизації перша автоматична словниково-термінологічна служба (СЛОТЕРМ) з обчислювальної техніки та програмування містила приблизно 20000 термінів у тлумачному словнику і спеціальних словниках для лінгвістичних досліджень.
Системи машинного перекладу поступово стали використовуватися не тільки за прямим призначенням, але й як важливий компонент автоматичних навчальних систем (для навчання перекладу, контролю орфографічних та граматичних знань).
90-ті роки принесли з собою бурхливий розвиток ринку ПК (від настільних до кишенькових) та інформаційних технологій, широке використання мережі Інтернет (яка стає все більш інтернаціональною і многоязикой). Все це зробило затребуваним подальший розвиток автоматизованих перекладацьких систем. З початку 1990-х рр.. на ринок систем ПК виходять і вітчизняні розробники.
У липні 1990 року на виставці PC Forum в Москві була представлена ​​перша в Росії комерційна система машинного перекладу під назвою PROMT (PROgrammer's Machine Translation). У 1991 р. було створено ЗАТ "Проект МТ", і вже в 1992 р. компанія "ПРОМТ" виграла конкурс NASA на постачання систем МП (ПРОМТ була єдиною неамериканською фірмою на цьому конкурсі). У 1992 р. "ПРОМТ" випускає ціле сімейство систем під новою назвою STYLUS для перекладу з англійської, німецької, французької, італійської та іспанської мов на російську і з російської на англійську, а в 1993 р. на базі STYLUS створюється перша в світі система машинного перекладу для Windows. У 1994 р. вийшла версія STYLUS 2.0 для Windows 3.Х/95/NT, а в 1995-1996 рр.. представлено третє покоління систем машинного перекладу, повністю 32-розрядних STYLUS 3.0 для Windows 95/NT, одночасно з цим успішно завершено розробку абсолютно нових, перших у світі російсько-німецької і російсько-французької систем машинного перекладу.
У 1997 р. підписано угоду з французькою фірмою Softissimo про створення систем перекладу з французької мови на німецьку та англійську і назад, а в грудні цього року була випущена перша в світі система німецько-французького перекладу. У цьому ж році компанія "ПРОМТ" компанія випустила систему, реалізовану за технологією Гігант, що підтримує кілька мовних напрямків в одній оболонці, а також спеціальний перекладач для роботи в Інтернеті WebTranSite.
У 1998 р. випускається ціле сузір'я програм під новою назвою PROMT 98. Через рік компанія ПРОМТ випустила два нових продукти: унікальний пакет програм для роботи в Інтернеті - PROMT Internet, і перекладач для корпоративних поштових систем - PROMT Mail Translator. У листопаді 1999 року PROMT була визнана кращою системою машинного перекладу серед тестованих французьким журналом PC Expert, обійшовши конкурентів по сумі показників на 30 відсотків. Для корпоративних клієнтів розроблені також спеціальні серверні рішення - корпоративний сервер перекладів PROMT Translation Server (PTS) та Інтернет-рішення PROMT Internet Translation Server (PITS). У 2000 р. "ПРОМТ" оновила всю лінію своїх програмних продуктів, випустивши МП системи нового покоління: PROMT Translation Office 2000, PROMT Internet 2000 і Magic Gooddy 2000.
Переклад в режимі он-лайн за підтримки системи "ПРОМТ" використовується на ряді вітчизняних та зарубіжних сайтів: PROMT's Online Translator, InfiniT.com, Translate.Ru, Lycos та інші, а також в установах різного профілю для перекладу ділової документації, статей і листів (існують системи переказу, що вбудовуються безпосередньо в Outlook Exdivss та інші поштові клієнти).
У наш час з'являються нові технології машинного перекладу, засновані на використанні систем штучного інтелекту, статистичних методах. Про таких - у наступному розділі.
2.2 Статистичні методи у вивченні мови
Чимала увага у сучасній лінгвістиці приділяється вивченню мовних явищ методами кількісної математики. Кількісні дані часто допомагають більш глибоко осмислити досліджувані явища, їх місце і роль в системі суміжних явищ. Відповідь на запитання «скільки» допомагає відповісти і на запитання «що», «як», «чому» - такий евристичний потенціал кількісної характеристики.
Чималу роль статистичні методи грають у розробці систем машинного перекладу (див. розділ 2.1). При статистичному підході проблема перекладу розглядається в термінах каналу з перешкодами. Уявімо собі, що нам потрібно перевести пропозицію з англійської на російську. Принцип каналу з перешкодами пропонує нам таке пояснення відносин між англійською і російською фразою: англійське речення являє собою не що інше, як російське пропозицію, спотворене певним шумом. Для того щоб відновити вихідне російське пропозицію, нам потрібно знати, що саме люди зазвичай говорять по-російськи і як російські фрази спотворюються до стану англійської. Переклад здійснюється шляхом пошуку такого російського пропозиції, що максимізує твори безумовної імовірності російського пропозиції та ймовірності англійської пропозиції (оригіналу) за умови даного російського пропозиції. Згідно з теоремою Байєса, це російське пропозиція є найбільш вірогідним перекладом англійської:

де e - пропозиція перекладу, а f - пропозиція оригіналу
Таким чином, нам потрібно модель джерела і модель каналу, або модель мови і модель перекладу. Модель мови повинна присвоювати оцінку ймовірності будь-якій пропозиції кінцевого мови (у нашому випадку, російського), а модель перекладу-пропозицією оригіналу. (Див. табл.1)
Табл.1.
amount
bonus
compensation
payment
rate
виплата
15%
8%
6%
71%
0%
оплата
0%
0%
0%
97%
3%

У загальному випадку система машинного перекладу працює в двох режимах:
1. Навчання системи: береться тренувальний корпус паралельних текстів, і за допомогою лінійного програмування шукаються такі значення таблиць перекладних відповідників, які максимізують ймовірність (наприклад) російської частини корпусу за наявної англійської відповідно до обраної моделі перекладу. На російській частині того ж корпусу будується модель російської мови.
2. Експлуатація: на основі отриманих даних для незнайомого англійської пропозиції шукається російське, максимізуючи твір ймовірностей, привласнюються моделлю мови і моделлю перекладу. Програма, яка використовується для такого пошуку, називається дешифратором.
Найпростішою статистичною моделлю перекладу є модель дослівного перекладу. У цій моделі передбачається, що для перекладу речення з однієї мови на іншу досить перевести всі слова (створити «мішок слів»), а розстановку їх у правильному порядку забезпечить модель Для приведення P (a, f | e) до P (a | e , f), тобто ймовірності даного вирівнювання при даній парі пропозицій, кожна ймовірність P (a, f | e) нормалізується за сумою ймовірностей всіх вирівнювань даної пари пропозицій:
Реалізація алгоритму Вітербо, використовувана для навчання Моделі № 1, полягає в наступному:
1.Вся таблиця ймовірностей перекладних відповідників заповнюється однаковими значеннями.
2. Для всіх можливих варіантів попарних зв'язків слів обчислюється ймовірність P (a, f | e):
3. Значення P (a, f | e) нормалізуються для отримання значень P (a | e, f).
4. Підраховується частота кожної перекладної пари, зважена за вірогідності кожного варіанту вирівнювання.
5. Отримані зважені частоти нормалізуються і формують нову таблицю ймовірностей перекладних відповідників
6. Алгоритм повторюється з кроку 2.
Розглянемо як приклад тренування подібної моделі на корпусі з двох пар пропозицій (рис.2):
- Білий Дім / White House
- Дім / House


Рис.1
Після великої кількості ітерацій ми отримаємо таблицю (табл.2.), З якої видно, що переклад здійснюється з високою точністю.
Табл.2
White
House
білий
0,9999
0, 0001
будинок
0, 0001
0,9999

Також статистичні методи широко використовуються у вивченні лексики, морфології, синтаксису, стилістики. Вчені Пермського державного університету провели дослідження, в основі якого лежало твердження про те, що стереотипні словосочестанія є важливим «будівельним матеріалом» тексту [13, c.24]. Ці словосполучення складаються з «ядерних» повторюваних слів і залежних слів-конкретізавторов і мають яскраво виражену стилістичне забарвлення.
У науковому стилі «ядерними» словами можна назвати: дослідження, вивчення, завдання, проблема, питання, явище, факт, спостереження, аналіз та ін У публіцистиці «ядерними» будуть вже інші слова, що володіють підвищеною цінністю саме для тексту газети: час, особа, влада, справа, дія, закон, життя, історія, місце і т.д. (Усього 29)
Особливий інтерес для лінгвістів представляє також професійна діффереренціація загальнонародної мови, своєрідність використання лексики та граматики в залежності від роду занять. Відомо, що шофери в професійного мовлення вживаю форму ш про фер, медики говорять до про Клюшев замість Коклі ю ш - подібних прикладів можна привести. Завдання статистики - простежити за варіативністю вимови і зміною мовної норми.
Професійні відмінності ведуть за собою відмінності не тільки граматичні, але й лексичні. У Якутськом державному університеті ім. М.К. Аммосова було проаналізовано по 50 анкет з найбільш часто зустрічаються реакціями на деякі слова серед медиків і будівельників (табл. 3) [13, c.78].
Табл.3
Стимул
Медики
Будівельники
людина
пацієнт (10), особистість (5)
чоловік (5)
добро
допомога (8), допомагати (7)
зло (16)
життя
смерть (10)
прекрасна (5)
смерть
труп (8)
життя (6)
вогонь
жар (8), опік (6)
пожежа (7)
палець
рука (14), панарицій (5)
великий (7), вказівний (6)
очі
зір (6), зіниця, окуліст (по 5)
карі (10), великі (6)
голова
розум (14), мізки (5)
велика (9), розумна (8), розум (6)
втрачати
свідомість, життя (по 4)
гроші (5), знаходити (4)
Можна помітити, що медики частіше, ніж будівельники, дають асоціації, пов'язані з їх професійною діяльністю, так як наведені в анкеті слова-стимули мають до їх професії більше відношення, чим до професії будівельника.
Статистичні закономірності в мові використовуються для створення частотних словників - словників, в яких наводяться числові характеристики употребительности слів (словоформ, словосполучень) будь-якої мови - мови письменника, будь-якого твори і т. п. Звичайно як характеристики употребительности використовується частота зустрічальності слова в тексті певного обсягу
Модель сприйняття мови неможлива без словника як свого суттєвого компонента. При сприйнятті мови основної оперативної одиницею виступає слово. З цього випливає, зокрема, що кожне слово сприйманого тексту має бути ототожнена з відповідною одиницею внутрішнього словника слухача (або читача). Природно вважати, що вже з самого початку пошук обмежений деякими підобласті словника. Згідно більшості сучасних теорій сприйняття мови, власне фонетичний аналіз звучного тексту в типовому випадку дає лише деяку часткову інформацію про можливе фонологическом вигляді слова, і такого роду інформації відповідає не одне, а певне БЕЗЛІЧ слів словника, отже, виникає дві задачі:
(А) виділити відповідне безліч по тим чи іншим параметрам;
(Б) в межах окресленого безлічі (якщо воно виділено адекватно) зробити «відсів» всіх слів, крім того єдиного, яке і відповідає найкращим чином даному слову тексту, що розпізнається. Одна із стратегій «відсіву» - виняток низькочастотних слів. Звідси випливає, що словник для сприйняття мови - це частотний словник. Саме створення комп'ютерної версії частотного словника російської мови і є первинним завданням акредитуючої проекту.
На матеріалі російської мови існує 5 частотних словників (не рахуючи галузевих). Відзначимо лише деякі загальні недоліки наявних словників.
Всі відомі частотні словники російської мови побудовані на обробці масивів письмових (друкованих) текстів. Частково з цієї причини, коли тотожність слова багато в чому спирається на збіг формальне, графічне, недостатньо враховується семантика. У результаті виявляються зміщеними, спотвореними і частотні характеристики; наприклад, якщо слова з поєднання «один одного» упорядник частотного словника включає в загальну статистику вживання слова «друг», то навряд чи це виправдано: з огляду на семантику, ми повинні визнати, що це вже інші слова, а точніше, що самостійної словникової одиницею виступає лише саме по собі поєднання в цілому.
Також у всіх існуючих словниках слова поміщені лише у своїх основних формах: іменники у формі однини, називного відмінка, дієслова у формі інфінітива і т.д. Деякі з словників дають інформацію про частотність словоформ, але зазвичай роблять це недостатньо послідовно, не вичерпним чином. Частотності різних словоформ одного й того ж слова свідомо не збігаються. Розробник ж моделі сприйняття мови повинен враховувати, що в реальному перцептивном процесі розпізнавання підлягає саме конкретна словоформа, «занурена» у текст: на базі аналізу початкової ділянки експонента словоформи формується безліч слів з ідентичним початком, причому початкова ділянка словоформи не обов'язково тотожний початкового ділянці словникової форми . Саме словоформі належить конкретна ритмічна структура - також надзвичайно важливий параметр для перцептивного відбору слів. Нарешті, в підсумковому поданні розпізнаного висловлювання знову-таки слова представлені відповідними словоформами.
Існує безліч робіт, у яких демонструється важливість частотності у процесі сприйнятті мови. Але нам не відомі роботи, де використовувалася б частотність словоформ - навпаки, всі автори практично ігнорують частотність окремих словоформ, звертаючись виключно до лексемам. Якщо отримані ними результати не вважати артефактами, доводиться припустити, що носію мови якимось чином доступна інформація про співвідношення частотних словоформ та словникової форми, тобто, фактично, лексеми. Причому такого роду перехід від словоформи до лексеме, звичайно, неможливо пояснити природним знанням відповідної парадигми, оскільки інформація про частотність повинна використовуватися до остаточної ідентифікації слова, інакше вона просто втрачає сенс.
За первинним статистичними характеристиками можна визначити з заданою відносною похибкою ту частину словника, до якої входять слова з високою частотою появи незалежно від типу тексту. Можливо також, ввівши ступеневу впорядкування в словник, отримати серію словников, що охоплюють перші 100, 1000, 5000 і т. д. частих слів. Статистичні характеристики словника викликають інтерес у зв'язку зі смисловим аналізом лексики. Вивчення предметно-ідеологіческнх груп і семантичних полів показує, що лексичні об'єднання підтримуються семантичними зв'язками, які концентруються навколо лексем з найбільш загальним значенням. Опис значень у межах лексико-семантичного поля може проводитися за допомогою ідентифікації слів з найбільш абстрактними за змістом лексемами. Мабуть, «порожні» (з точки зору номінативних потенцій) одиниці словника складають статистично однорідний пласт.
Не меншу цінність мають і словники за окремими жанрами. Вивчення заходи їх схожості і характеру статистичних розподілів дасть цікаві відомості про якісне розшарування лексики в залежності від сфери речеупотребленія.
Складання великих частотних словників вимагає звернення до обчислювальної техніки. Введення часткової механізації і автоматизації в процес роботи над словником представляє інтерес як експеримент машинної обробки словников до різних текстів. Такий словник вимагає більш суворої системи обробки та накопичення словникового матеріалу. У мініатюрі це інформаційно-пошукова система, яка здатна видавати відомості про різні сторони тексту і словника. Деякі основні запити до цієї системи плануються з самого початку: загальна кількість інвентаризованих слів, статистичні характеристики окремого слова і цілих словников, впорядкування частих і рідкісних зон словника і т. п. Машинна картотека дозволяє автоматично будувати зворотні словники за окремими жанрами і джерелам. Безліч інших корисних статистичних відомостей про мову буде вилучено з накопиченого масиву інформації. Комп'ютерний частотний словник створює експериментальну базу для переходу до більш великої автоматизації словникових робіт.
Статистичні дані частотних словників можуть бути широко використані і при вирішенні інших лінгвістичних завдань - наприклад, при аналізі та визначенні активних засобів словотвору сучасної російської мови, вирішенні питань удосконалення графіки та орфографії, які пов'язані з урахуванням статистичних відомостей про словниковому складі (при цьому важливо враховувати імовірнісні характеристики комбінацій графем, реалізовані в словах типи буквосполучень), практичної транскрипції і транслітерації. Статистичні параметри словника будуть корисні і при вирішенні питань автоматизації друкарської справи, розпізнавання і автоматичного читання буквеного тексту.
Сучасні тлумачні словники і граматики російської мови в основному побудовані на базі літературно-художніх текстів. Існують частотні словники мови А.С. Пушкіна, А.С. Грибоєдова, Ф.М. Достоєвського, В.В. Висоцького та багатьох інших авторів. На кафедрі історії та теорії літератури Смоленського держ. педагогічного університету ряд років ведеться робота зі складання частотних словників віршованих та прозових текстів. Для цього дослідження відібрані частотні словники всієї лірики Пушкіна і ще двох поетів золотого століття - «Лиха з розуму» Грибоєдова і всієї поезії Лермонтова; Пастернака і ще п'яти поетів срібного століття - Бальмонта 1894-1903 рр.., «Віршів про Прекрасну Даму» Блоку, "Каміння» Мандельштама, «Вогненного стовпа» Гумільова, «Anno Domini MCMXXI» Ахматової і «Сестри моєму житті» Пастернака і ще чотирьох поетів століття залізного - «Віршів Юрія Живаго», "Коли розгуляється", всього корпусу лірики М. Петрових, « Дорога далека »,« Вітрового скла »,« Прощання зі снігом »і« Підкови »Межірова,« антисвітів »Вознесенського і« снежниці »Риленкова.
Слід зазначити, що ці словники за своєю природою різні: одні представляють лексику одного драматичного твору, інші - книги лірики, або декількох книг, або всього корпусу віршів поета. Результати аналізу, представлені в цій роботі, слід сприймати з обережністю, їх не можна абсолютизувати. Проте за допомогою спеціальних заходів різницю онтологічної природи текстів можна до певної міри зменшити.
В останні роки все більш чітко усвідомлюється протиставлення розмовної і книжкової мови. Особливо гостро обговорюється це питання серед методистів, які вимагають повороту навчання у бік розмовної мови. Однак специфіка розмовної мови до цих пір залишається непоясненної.
Обробка словників виконувалась шляхом створення користувального додатка в середовищі офісної програми EXCEL97. Додаток включає чотири робочі аркуші книги EXCEL - «Титульний аркуш», лист «Словники» з вихідними даними, «Близькості» і «Відстані» з результатами, а також набір макросів.
Вихідна інформація вводиться на лист «Словники». У комірки EXCEL, записуються словники досліджуваних текстів, останній рядок S формується з отриманих результатів і дорівнює кількості слів, що зустрічаються в інших словниках. Таблиці «Близькості» і «Відстані» містять розраховані міри близькості M, кореляції R і відстані D.
Макроси додатки являють собою подієві програмні процедури мовою Visual Basic for Application (VBA). Основу процедур складають бібліотечні об'єкти VBA і методи їх обробки. Так, для операцій з робочими листами програми використовується ключовий об'єкт Worksheet (робочий аркуш) і відповідний йому метод активізації листа Activate (активізувати). Завдання діапазону аналізованих вихідних даних на аркуші «Словники» виконується методом Select (вибрати) об'єкта Range (діапазон), а передача слів як значень змінним виконується як властивість Value (значення) цього ж об'єкта Range.
Незважаючи на те, що ранговий кореляційний аналіз змушує з обережністю говорити про залежність тематики між різними текстами, велика частина самих частотних слів кожного тексту має відповідності в одному або декількох інших текстах. У колонці S показано кількість таких слів серед 15 найбільш частотних у кожного автора. Напівжирним шрифтом виділені слова, що зустрічаються в нашій таблиці тільки в одного поета. Ні виділених слів зовсім у Блоку, Ахматової і Петрових, у них S = 15. У цих трьох поетів все 15 найбільш частотних слів одні й ті ж, розрізняються вони тільки місцем у списку. Але навіть у Пушкіна, лексика якого найбільш оригінальна, S = 8, а виділених слів 7.
Результати показують, що існує певний шар лексики, що концентрує основні теми поезії. Як правило, ці слова короткі: із загального числа (225) слововживань односкладових 88, двоскладових 127, трискладових 10. Найчастіше ці слова представляють основні міфологеми і можуть розпадатися на пари: ніч - день, земля - небо (сонце), Бог - людина (люди), життя - смерть, тіло - душа, Рим - світ (у Мандельштама); можуть об'єднуватися в міфологеми більш високого рівня: небо, зірка, сонце, земля; в людині як правило виділяються тіло, серце, кров, рука, нога, щока, очі. З людських станів перевага віддається сну і любові. До світу людини належать будинок та міста - Москва, Рим, Париж. Творчість представлено лексемами слово і пісня.
У Грибоєдова і Лермонтова серед найбільш частотних слів майже немає слів, що позначають природу. У них утричі більше слів, що позначають людини, частини його тіла, елементи її духовного світу. У Пушкіна і поетів ХХ ст. позначень людини і природи приблизно порівну. У цьому важливому аспекті тематики, можемо сказати, ХХ ст. пішов за Пушкіним.
Мінімальна тема справу серед самих частотних слів зустрічається тільки у Грибоєдова і Пушкіна. У Лермонтова і поетів ХХ ст. вона поступається місцем мінімальної темі слово. Слово не виключає справи (біблійна трактування теми: в Новому Завіті все вчення Ісуса Христа розглядається як слово Боже або слово Ісуса, а апостоли іноді називають себе слугами Слова). Сакральний зміст лексеми слово переконливо виявляється, наприклад, у вірші Пастернака «І образ світу, в Слові явлений». Сакральний зміст лексеми слово в со-і протиставленні з людськими справами переконливо проявляється в однойменному вірші Гумільова.
Лексеми, які зустрічаються тільки в одному тексті, характеризують своєрідність даної книги або сукупності книг. Наприклад, слово «розум» - саме частотне в комедії Грибоєдова «Лихо з розуму» - але воно не зустрічається серед частотних слів інших текстів. Тема розуму безумовно є найбільш значущою в комедії. Ця лексема супроводжує образ Чацького, причому ім'я Чацького є найбільш частотним в комедії. Таким чином, у творі органічно поєднуються саме частотне ім'я загальне з самим частотним ім'ям власним.
Найвищий коефіцієнт кореляції пов'язує тематику трагічних книг Гумільова «Вогняний стовп» та Ахматової «Anno Domini MCMXXI». Серед 15 найбільш частотних іменників тут 10 спільних, у тому числі кров, серце, душа, любов, слово, небо. Нагадаємо, що в книгу Ахматової увійшла мініатюра «Не бувати тобі в живих ...», написана між арештом Гумільова і його розстрілом.
Теми свічки і натовпу в дослідженому матеріалі зустрічаються тільки в «Віршах Юрія Живаго». Тема свічки у віршах з роману має безліч контекстуальних значень: вона пов'язана з образом Ісуса Христа, з темами віри, безсмертя, творчості, любовного побачення. Свіча - найважливіше джерело світла в центральних сценах роману. Тема натовпу розвивається у зв'язку з основною ідеєю роману, в якому приватне життя людини з її непорушними цінностями протиставлена ​​аморальності нової держави, побудованого на засадах догоди натовпі.
Робота передбачає і третій етап, теж відбите в програмі, - це обчислення різниці порядкових номерів слів, спільних для двох словників та середнього показника відстані між однаковими словами двох словників. Цей етап дозволяє від загальних тенденцій взаємодії словників, виявлених за допомогою статистики, перейти на рівень, що наближається до тексту. Наприклад, статистично значимо корелюють книги Гумільова і Ахматової. Ми дивимося, які слова виявилися спільними для їх словників, і вибираємо перш за все ті, різниця між порядковими номерами яких мінімальна або дорівнює нулю. Саме ці слова мають один і той же ранговий номер і, отже, саме ці мінімальні теми в свідомості двох поетів однаково важливі. Далі варто переходити на рівень текстів і контекстів.
Кількісні методи також допомагають вивчити особливості народів - носіїв мови. Скажімо, у російській мові 6 відмінків, в англійському відмінків немає, а в окремих мовах народів Дагестану кількість відмінків доходить до 40. Л. Перловська у своїй статті «Свідомість, мова та культура» співвідносить ці характеристики зі схильністю народів до індивідуалізму або колективізму [36, c.28], з сприйняттям речей і явищ окремо або у зв'язку з іншими. Адже саме в англомовному світі (відмінків немає - річ сприймається «сама по собі») з'явилися такі поняття, як свобода особистості, лібералізм і демократія (зауважу, що я вживаю ці поняття лише у зв'язку з мовою, без будь-якої оціночної характеристики). Незважаючи на те, що подібні здогадки наразі залишаються лише на рівні сміливих наукових гіпотез, вони допомагають подивитися по-новому на вже знайомі явища.
Як ми бачимо, кількісні характеристики можуть застосовуватися в зовсім різних галузях мовознавства, що все більше стирає межі між «точними» і «гуманітарними» методами. Лінгвістика все частіше вдається до допомоги не тільки математики, але і обчислювальної техніки для вирішення своїх завдань.
2.3 Вивчення мови методами формальної логіки
З некількісними методами математики, зокрема, з логікою, сучасна теоретична лінгвістика взаємодіє не менш плідно, ніж з кількісними. Швидкий розвиток комп'ютерних технологій і зростання їх ролі в сучасному світі зажадало перегляду підходу до взаємодії мови і логіки в цілому.
Методи логіки широко використовуються в розробці формалізованих мов, зокрема, мов програмування, елементами яких є деякі символи (на кшталт математичним), які обираються (або конструюються з обраних раніше символів) й інтерпретовані певним чином, пов'язаним ні з яким «традиційним» вживанням, розумінням і функціями таких самих символів в інших контекстах. Програміст постійно має справу з логікою у своїй роботі. Сенс програмування полягає саме в тому, щоб навчити комп'ютер розмірковувати (в широкому сенсі слова). При цьому методи "міркування" виявляються самими різними. Кожен програміст витрачає певний час на пошук помилок у своїх і чужих програмах. Тобто, на пошук помилок в міркуваннях, в логіці. І це теж накладає свій відбиток. Набагато легше виявляєш логічні помилки і в звичайній мові. Відносна простота мов, які вивчаються логіками, дозволяє їм з'ясовувати структури цих мов більш чітко, ніж це досяжно для лінгвістів, що аналізують виключно складні природні мови. З огляду на те, що мови, що вивчаються логіками, використовують відносини, скопійовані з природних мов, логіки здатні внести істотний внесок у загальну теорію мови. Ситуація тут подібна до тієї, яка має місце у фізиці: фізик також формулює теореми для ідеально спрощених випадків, які не відбуваються в природі взагалі - він формулює закони для ідеальних газів, ідеальних рідин, говорить про рух за відсутності тертя і т.д. Для цих ідеалізованих випадків можна встановити прості закони, які значно сприяли б розуміння того, що відбувається в дійсності, і що, ймовірно, залишилося б невідомим фізики, якби вона пробувала розглядати дійсність безпосередньо, у всій складності.
У вивченні природних мов логічні методи використовуються для того, щоб вивчають мову могли не тупо «зазубрити» якомога більше слів, а краще зрозуміти його структуру. Ще Л. Щерба використовував на своїх лекціях приклад пропозиції, побудованого за законами російської мови: «Глок куздра штеко будланула бокра і курдячіт бокренка», - а потім запитував у студентів, що це означає. Незважаючи на те, що сенс слів у реченні залишався незрозумілий (їх просто не існує в російській мові), можна було чітко відповісти: «куздра» - підмет, іменник жіночого роду, в однині, називному відмінку, «бокр» - істота, і т.д. Переклад фрази виходить приблизно такий: «Щось жіночого роду в один прийом вчинила щось над якимось істотою чоловічого роду, а потім почало щось таке витворяти тривалий, поступове з його дитинчам» [46]. Подібним же прикладом тексту (художнього) з неіснуючих слів, побудованого повністю за законами мови, є «Бармаглот» Льюїса Керрола (в «Алісі в країні чудес» Керролл вустами свого персонажа Шалтая-Базікаючи пояснює і значення придуманих ним слів: «варкалось» - вісім годин вечора, коли вже пора варити вечерю, «Холявко» - хисткий і спритний, «шорек» - помісь тхора, борсука і штопора, «штрикають» - стрибати, пірнати, крутитися, «нава» - трава під сонячним годинником (простягається трохи направо , трохи ліворуч і трохи назад), «хрюкотать» - хрюкати і реготати, «Зелюк» - зелений індик, «мюмзики» - птах; пір'я у неї розпатлані і стирчать на всі боки, як віник, «мова» - далеко від дому) [46].
Одне з основних понять сучасної логіки і теоретичної лінгвістики, що використовується при дослідженні мов різних логіко-математичних числень, природних мов, для опису відносин між мовами різних «рівнів» і для характеристики відносин між розглянутими мовами і описуваними з їх допомогою предметними областями - поняття метамови. Метамова - це мова, яка використовується для вираження суджень про іншою мовою, мовою-об'єкті. За допомогою метамови вивчають структуру знакосочетаній (виразів) мови-об'єкта, доводять теореми про його виразних властивості, про ставлення його до інших мов і т. п. Досліджуваний мова називається також предметним мовою по відношенню до даного метамови. Як предметний мову, так і метамова можуть бути звичайними (природними) мовами. Метамова може відрізнятися від мови-об'єкта (наприклад, в підручнику англійської мови для російських російська мова є метамовою, а англійський - мовою-об'єктом), але може і збігатися з ним або відрізнятися лише частково, наприклад спеціальною термінологією (російська лінгвістична термінологія - елемент метамови для опису російської мови; т. н. семантичні множники - частина метамови опису семантики природних мов).
Поняття «метамова» стало дуже плідним у зв'язку з вивченням формалізованих мов, що будуються в рамках математичної логіки. На відміну від формалізованих предметних мов, в цьому випадку метамова, коштами якого формулюється метатеорія (вивчає властивості предметної теорії, формульованій на предметному мовою), є, як правило, звичайним природною мовою, деяким спеціальним чином обмеженим фрагментом природної мови, що не містить будь-якого роду двозначностей , метафор, «метафізичних» понять і т. п. елементів звичайної мови, що перешкоджають використанню його як знаряддя точного наукового дослідження. При цьому метамова сам може бути формалізований і (незалежно від цього) виявитися предметом дослідження, проведеного засобами метаметаязика, причому такий ряд можна «мислити» зростаючим нескінченно.
Логіка вчить нас плідній розмежування мови-об'єкта і метамови. Мова-об'єкт - це сам предмет логічного дослідження, а метамова - той неминуче штучна мова, якою таке дослідження ведеться. Логічне мислення якраз і полягає в тому, щоб сформулювати мовою символів (метамови) відносини і структуру реального мови (мови-об'єкта).
Метамова повинен бути в усякому разі «не бідніше» свого предметного мови (тобто для кожного виразу останнього в метамови повинно бути його ім'я-«переклад») - інакше, при невиконанні цих вимог (що явно має місце в природних мовах, якщо спеціальними угодами не передбачено інше) виникають семантичні парадокси (антиномії).
У міру створення все нових і нових мов програмування у зв'язку з проблемою програмування трансляторів з'явилася гостра необхідність у створенні метамовою. В даний час найбільш вживаним для опису синтаксису мов програмування є метамова форм Бекуса-Наура (скорочено БНФ). Він являє собою компактну форму у вигляді деяких формул, схожих на математичні. Для кожного поняття мови існує єдина метаформула (нормальна формула). Вона складається з лівої і правої частин. У лівій частині вказується визначається поняття, а в правій - задається безліч допустимих конструкцій мови, які об'єднуються в це поняття. У формулі використовують спеціальні метасимволи у вигляді кутових дужок, в яких укладено визначається поняття (у лівій частині формули) або раніше певне поняття (у її правій частині), а поділ лівої і правої частин вказується метасимволом "::=", сенс якого еквівалентний словами "за визначенням є". Металінгвістичних формули в деякому вигляді закладені в транслятори; з їх допомогою ведеться перевірка конструкцій, використовуваних програмістом, на формальну відповідність який-небудь з конструкцій, синтаксично допустимих у цій мові. Існують і окремі метамова різних наук - таким чином, знання існують у вигляді різних метамовою.
Логічні методи також послужили основою для створення систем штучного інтелекту, заснованих на концепції коннекціонізма. Коннекціонізм - це особливе протягом у філософській науці, предметом якого є питання пізнання. У рамках цієї течії робляться спроби пояснити інтелектуальні здібності людини, використовуючи штучні нейронні мережі. Складені з великого числа структурних одиниць, аналогічних нейронам, із заданим для кожного елемента вагою, визначальним силу зв'язку з іншими елементами, нейронні мережі являють собою спрощені моделі людського мозку. Експерименти з нейронними мережами подібного роду продемонстрували їх здатність до навчання виконання таких завдань, як розпізнавання образів, читання і визначення простих граматичних структур.
Філософи почали проявляти інтерес до коннекціонізму, так як конекціоністські підхід обіцяв забезпечити альтернативу класичної теорії розуму і широко поширеною в рамках цієї теорії ідеї, згідно з якою механізми роботи розуму мають схожість з обробкою символічного мови цифровим комп'ютером. Ця концепція досить спірна, проте в останні роки вона знаходить все більше прихильників.
Логічне вивчення мови продовжує соссюровского концепцію про мову як систему. Те, що воно постійно триває, ще раз підтверджує сміливість наукових здогадів початку минулого століття. Останній розділ своєї роботи я присвячу перспективам розвитку математичних методів у лінгвістиці в наші дні.
2.4 Перспективи застосування математичних методів у лінгвістиці
В епоху комп'ютерних технологій методи математичної лінгвістики отримали нову перспективу розвитку. Пошук вирішення проблем лінгвістичного аналізу все активніше реалізується тепер на рівні інформаційних систем. Разом з тим автоматизація процесу обробки мовного матеріалу, надаючи досліднику значні можливості та переваги, неминуче висуває перед ним нові вимоги і завдання.
З'єднання «точного» і «гуманітарного» знання стало родючим грунтом для нових відкриттів в галузі лінгвістики, інформатики та філософії.
Машинний переклад з однієї мови на іншу залишається швидко розвивається галуззю інформаційних технологій. Незважаючи на те, що переклад за допомогою комп'ютера ніколи не зрівняється за якістю з перекладом, зробленим людиною (особливо це стосується художніх текстів), машина стала невід'ємним помічником людини в перекладі великих обсягів тексту. Вважається, що в найближчому майбутньому будуть створені більш досконалі перекладацькі системи, засновані, в першу чергу, на семантичному аналізі тексту.
Не менш перспективним напрямком залишається взаємодія лінгвістики і логіки, що служить філософським фундаментом для осмислення інформаційних технологій і так званої «віртуальної реальності». У найближчому майбутньому продовжиться робота над створенням систем штучного інтелекту - хоча, знову ж таки, він ніколи не буде дорівнює людському за його можливостям. Подібна конкуренція безглузда: в наш час машина повинна стати (і стає) не суперником, а помічником людини, не чимось з області фантастики, а частиною реального світу.
Триває вивчення мови методами статистики, що дозволяє більш точно визначити його якісні властивості. Важливо, щоб найбільш сміливі гіпотези про мову знаходили своє математичне, а, отже, і логічне, доказ.
Найбільш значущим є те, що різні галузі застосування математики в лінгвістиці, до цього достатньо розрізнені, в останні роки співвідносяться між собою, з'єднуючись в струнку систему, за аналогією із системою мови, відкритої століття тому Фердинандом де Соссюром і Іваном Бодуен де Куртене. У цьому - спадкоємність наукового знання.
Лінгвістика в сучасному світі стала фундаментом для розвитку інформаційних технологій. Поки інформатика залишається бурхливо розвивається галуззю людської діяльності, союз математики та лінгвістики продовжить грати свою роль у розвитку науки.

Висновок
За ХХ століття комп'ютерні технології пройшли великий шлях - від військового застосування до мирному, від вузького кола цілей до проникнення в усі галузі людського життя. Математика як наука знаходила все нове практичне значення з розвитком обчислювальної техніки. Цей процес продовжується і сьогодні.
Немислимий раніше «тандем» «фізиків» і «ліриків» став реальністю. Для повноцінної взаємодії математики та інформатики з гуманітарними науками потрібні кваліфіковані фахівці як з тієї, так і з іншого боку. У той час як фахівцям-комп'ютерникам все більш потрібні систематичні гуманітарні знання (лінгвістичні, культурологічні, філософські), щоб осмислювати зміни в навколишньому їх реальності, у взаємодії людини і техніки, розробляти все нові і нові мовні та розумові концепції, писати програми, то будь-який «гуманітарій» у наш час для свого професійного росту повинен опанувати хоча б азами роботи з комп'ютером.
Математика, будучи тісно взаємозв `язаної з інформатикою, продовжує розвиватися і взаємодіяти з природничих і гуманітарних знанням. У новому столітті не слабшає, а, навпаки, посилюється тенденція до математизації науки. На кількісних даних осмислюються закономірності розвитку мови, його історичні та філософські характеристики.
Математичний формалізм найбільше підходить для опису закономірностей в лінгвістиці (як, втім, і в інших науках - і гуманітарних, і природних). Ситуація деколи складається в науці так, що без застосування відповідного математичного мови зрозуміти характер фізичного, хімічного і т.п. процесу неможливо. Створюючи планетарну модель атома, відомий англійський фізик XX ст. Е. Резерфорд випробував математичні труднощі. Спочатку його теорію не взяли: вона не звучала доказово, і виною тому стало незнання Резерфордом теорії ймовірності, на основі механізму якої тільки й можливо було зрозуміти модельне уявлення атомних взаємодій. Усвідомивши це, видатний вже на той час вчений, володар Нобелівської премії, записався у семінар математика професора Лемба і протягом двох років разом зі студентами прослухав курс і відпрацював практикум з теорії ймовірності. На її основі Резерфорд зміг описати поведінку електрона, надавши своїй структурної моделі переконливу точність і одержавши визнання. Те саме - і з мовознавством.
Напрошується питання, що ж міститься в об'єктивних явищах таке математичне, завдяки чому вони й піддаються опису мовою математики, мовою кількісних характеристик? Це однорідні одиниці речовини, що розподіляються в просторі та часі. Ті науки, які далі інших пройшли шлях до виділення однорідності, і виявляються краще пристосованими для використання в них математики.
Стрімко розвинулася в 90ті роки мережа Інтернет об'єднала під собою представників різних країн, народів і культур. Незважаючи на те, що основною мовою міжнародного спілкування продовжує служити англійська, Інтернет в наш час став багатомовним. Це зумовило розвиток комерційно успішних систем машинного перекладу, широко використовуються в різних областях людської діяльності.
Комп'ютерні мережі стали об'єктом філософського осмислення - створювалися все нові лінгвістичні, логічні, світоглядні концепції, які допомагають зрозуміти «віртуальну реальність». У багатьох художніх творах створювалися сценарії - частіше песимістичні - про панування машин над людиною, а віртуальної реаьності - над навколишнім світом. Далеко не завжди подібні прогнози виявлялися безглуздими. Інформаційні технології - не тільки перспективна галузь вкладення людських знань, це ще і спосіб контролю над інформацією, а, отже, і над людською думкою.
У цього явища є як негативна, так і позитивна сторона. Негативна - тому що контроль над інформацією суперечить невід'ємного людському праву на вільний доступ до неї. Позитивна - тому що відсутність цього контролю може призвести до катастрофічних наслідків для людства. Досить згадати один з найбільш мудрих фільмів останнього десятиліття - «Коли настане кінець світу» Віма Вендерса, герої якого повністю занурилися в «віртуальну реальність» власних снів, що записується на комп'ютер. Проте ні один вчений і жоден художник не може дати однозначної відповіді на питання: що ж чекає науку і техніку в майбутньому.
Орієнтування на «майбутнє», часом здається фантастичним, була відмінною рисою науки середини ХХ століття, коли винахідники прагнули створити досконалі зразки техніки, які можуть працювати без втручання людини. Час показав утопічність подібних досліджень. Однак було б зайвим засуджувати вчених за це - без їхнього ентузіазму в 1950-ті - 60-ті інформаційні технології не зробили б такого потужного стрибка в 90ті, і ми б не мали того, що маємо зараз.
Останні десятиліття ХХ століття змінили пріоритети науки - дослідний, винахідницький пафос поступився місцем комерційному інтересу. Знову ж таки - це не добре і не погано. Це - реальність, в якій наука виявляється все більш інтегрованою в повсякденне життя.
Наступив XXI століття продовжив цю тенденцію, і в наш час за винаходами стоять не тільки слава і визнання, але, в першу чергу, гроші. Ще й тому важливо дбати про те, щоб новітні досягнення науки і техніки не потрапили до рук терористичних угруповань чи диктаторських режимів. Завдання складне до неможливості; максимально здійснити її - завдання всього світового співтовариства.
Інформація - зброя, причому зброя не менш небезпечне, ніж ядерна або хімічне - тільки діє воно не фізично, а, скоріше, психологічно. Людству треба задуматися про те, що для нього в цьому випадку важливіше - свобода чи контроль.
Новітні філософські концепції, пов'язані з розвитком інформаційних технологій та спробою їх осмислити, показали обмеженість як природничо-наукового матеріалізму, що панував протягом ХІХ - початку ХХ століть, так і крайнього ідеалізму, який заперечує значимість матеріального світу. Сучасної думки, особливо думки Заходу, важливо подолати цей дуалізм у мисленні, коли навколишній світ чітко ділиться на матеріальне і ідеальне. Шлях до цього - діалог культур, зіставлення різних точок зору на навколишні явища.
Як не парадоксально, інформаційні технології можуть зіграти не останню роль у цьому процесі. Комп'ютерні мережі, і особливо Інтернет - це не тільки ресурс для розваги і бурхливої ​​комерційної діяльності, це ще й засіб осмисленого, спірного спілкування між представниками різних цивілізацій у сучасному світі, а також для діалогу минулого з сьогоденням. Можна сказати, що Інтернет розсовує просторові й часові рамки.
А в діалозі культур за допомогою інформаційних технологій як і раніше важлива роль мови як найдавнішого універсального засобу спілкування. Саме тому лінгвістика у взаємодії з математикою, філософією і інформатикою пережила своє друге народження і продовжує розвиватися понині. Тенденція цього продовжиться і в майбутньому - «until the end of the world», як 15 років тому пророкував все той же В. Вендерс. Щоправда, невідомо, коли відбудеться цей кінець - але чи важливо це зараз, адже майбутнє рано чи пізно все одно стане справжнім.

Додаток 1
Ferdinand de Saussure
The Swiss linguist Ferdinand de Saussure (1857-1913) is widely considered to be the founder of modern linguistics in its attempts to describe the structure of language rather than the history of particular languages ​​and language forms. In fact, the method of Structuralism in linguistics and literary studies and a significant branch of Semiotics find their major starting point in his work at the turn of the twentieth century. It has even been argued that the complex of strategies and conceptions that has come to be called "poststructuralism" - the work of Jacques Derrida, Michel Foucault, Jacques Lacan, Julia Kristeva, Roland Barthes, and others - is suggested by Saussure's work in linguistics and anagrammatic readings of late Latin poetry. If this is so, it can be seen most clearly in the way that Saussure's work in linguistics and interdivtation participates in transformations in modes of understanding across a wide range of intellectual disciplines from physics to literary modernism to psychoanalysis and philosophy in the early twentieth century. As Algirdas Julien Greimas and Joseph Courtés argue in Semiotics and Language: An Analytic Dictionary, under the heading "Interdivtation," a new mode of interdivtation arose in the early twentieth century which they identify with Saussurean linguistics, Husserlian Phenomenology, and Freudian psychoanalysis. In this mode, "interdivtation is no longer a matter of attributing a given content to a form which would otherwise lack one; rather, it is a paraphrase which formulates in another fashion the equivalent content of a signifying element within a given semiotic system" ( 159). In this understanding of "interdivtation," form and content are not distinct; rather, every "form" is, alternatively, a semantic "content" as well, a "signifying form," so that interdivtation offers an analogical paraphrase of something that already signifies within some other system of signification.
Such a reinterdivtation of form and understanding - which Claude Lévi-Strauss describes in one of his most programmatic articulations of the concept of structuralism, in "Structure and Form: Reflections on a Work by Vladimir Propp" - is implicit in Saussure's posthumous Course in General Linguistics (1916, trans., 1959, 1983). In his lifetime, Saussure published relatively little, and his major work, the Course, was the transcription by his students of several courses in general linguistics he offered in 1907-11. In the Course Saussure called for the "scientific" study of language as opposed to the work in historical linguistics that had been done in the nineteenth century. That work is one of the great achievements of Western intellect: taking particular words as the building blocks of language, historical (or "diachronic") linguistics traced the origin and development of Western languages ​​from a putative common language source, first an "Indo- European "language and then an earlier" proto-Indo-European "language.
It is divcisely this study of the unique occurrences of words, with the concomitant assumption that the basic "unit" of language is, in fact, the positive existence of these "word-elements," that Saussure questioned. His work was an attempt to reduce the mass of facts about language, studied so minutely by historical linguistics, to a manageable number of propositions. The "comparative school" of nineteenth-century Philology, Saussure says in the Course, "did not succeed in setting up the true science of linguistics" because "it failed to seek out the nature of its object of study" ([1959] 3 ). That "nature," he argues, is to be found not simply in the "elemental" words that a language comprises - the seeming "positive" facts (or "substances") of language - but in the formal relationships that give rise to those "substances."
Saussure's systematic reexamination of language is based upon three assumptions. The first is that the scientific study of language needs to develop and study the system rather than the history of linguistic phenomena. For this reason, he distinguishes between the particular occurrences of language - its particular "speech-events," which he designates as parole - and the proper object of linguistics, the system (or "code") governing those events, which he designates as langue. Such a systematic study, moreover, calls for a "synchronic" conception of the relationship among the elements of language at a particular instant rather than the "diachronic" study of the development of language through history.
This assumption gave rise to what Roman Jakobson in 1929 came to designate as "structuralism," in which "any set of phenomena examined by contemporary science is treated not as a mechanical agglomeration but as a structural whole [in which] the mechanical conception of processes yields to the question of their function "(" Romantic "711). In this passage Jakobson is articulating Saussure's intention to define linguistics as a scientific system as opposed to a simple, "mechanical" accounting of historical accidents. Along with this, moreover, Jakobson is also describing the second foundational assumption in Saussurean - we can now call it "structural" - linguistics: that the basic elements of language can only be studied in relation to their functions rather than in relation to their causes . Instead of studying particular and unique events and entities (ie, the history of particular Indo-European "words"), those events and entities have to be situated within a systemic framework in which they are related to other so-called events and entities. This is a radical reorientation in conceiving of experience and phenomena, one whose importance the philosopher Ernst Cassirer has compared to "the new science of Galileo which in the seventeenth century changed our whole concept of the physical world" (cited in Culler, Pursuit 24) . This change, as Greimas and Courtés note, reconceives "interdivtation" and thus reconceives explanation and understanding themselves. Instead of explanation's being in terms of a phenomenon's causes, so that, as an "effect," it is in some ways subordinate to its causes, explanation here consists in subordinating a phenomenon to its future-oriented "function" or "purpose." Explanation is no longer independent of human intentions or purposes (even though those intentions can be impersonal, communal, or, in Freudian terms, "unconscious").
In his linguistics Saussure accomplishes this transformation specifically in the redefinition of the linguistic "word," which he describes as the linguistic "sign" and defines in functionalist terms. The sign, he argues, is the union of "a concept and a sound image," which he called "signified [signifié] and signifier [signifiant]" (66-67; Roy Harris's 1983 translation offers the terms "signification" and " signal "[67]). The nature of their "combination" is "functional" in that neither the signified nor the signifier is the "cause" of the other; rather, "each [derives] its values ​​from the other" (8). In this way, Saussure defines the basic element of language, the sign, relationally and makes the basic assumption of historical linguistics, namely, the identity of the elemental units of language and signification (ie, "words"), subject to rigorous analysis. The reason we can recognize different occurrences of the word "tree" as the "same" word is not because the word is defined by inherent qualities - it is not a "mechanical agglomeration" of such qualities - but because it is defined as an element in a system, the "structural whole," of language.
Such a relational (or "diacritical") definition of an entity governs the conception of all the elements of language in structural linguistics. This is clearest in the most imdivssive achievement of Saussurean linguistics, the development of the concepts of the "phonemes" and "distinctive features" of language. Phonemes are the smallest articulated and signifying units of a language. They are not the sounds that occur in language but the "sound images" Saussure mentions, which are apdivhended by speakers - phenomenally apdivhended - as conveying meaning. (Thus, Elmar Holenstein describes Jakobson's linguistics, which follows Saussure in important ways, as "phenomenological structuralism.") It is for this reason that the leading spokesperson for Prague School Structuralism, Jan Mukarovsky, noted in 1937 that "structure... Is a phenomenological and not an empirical reality; it is not the work itself, but a set of functional relationships which are located in the consciousness of a collective (generation, milieu, etc.) "(cited in Galan 35). Similarly, Lévi-Strauss, the leading spokesperson for French structuralism, noted in 1960 that "structure has no distinct content; it is content itself, and the logical organization in which it is arrested [or apdivhended] is conceived as a property of the real "(167; see also Jakobson, Fundamentals 27-28).
Phonemes, then, the smallest perceptible elements of language, are not positive objects but a "phenomenological reality." In English, for instance, the phoneme / t / can be pronounced in many different ways, but in all cases an English speaker will recognize it as functioning as a / t /. An aspirated t (ie, at pronounced with an h-like breath after it), a high-pitched or low-pitched t sound, an extended t sound, and so on, will all function in the same manner in distinguishing the meaning of "to" and "do" in English. Moreover, the differences between languages ​​are such that phonological variations in one language can constitute distinct phonemes in another; thus, English distinguishes between / l / and / r /, whereas other languages ​​are so structured that these articulations are considered variations of the same phoneme (like the aspirated and unaspirated t in English). In every natural language, the vast number of possible words is a combination of a small number of phonemes. English, for instance, possesses less than 40 phonemes that combine to form over a million different words.
The phonemes of language are themselves systematically organized structures of features. In the 1920s and 1930s, following Saussure's lead, Jakobson and NS Trubetzkoy isolated the "distinctive features" of phonemes. These features are based upon the physiological structure of the speech organs - tongue, teeth, vocal chords, and so on - that Saussure mentions in the Course and that Harris describes as "physiological phonetics" ([1983] 39; Baskin's earlier translation uses the term "phonology" [(1959) 38]) - and they combine in "bundles" of binary oppositions to form phonemes. For instance, in English the difference between / t / and / d / is the divsence or absence of "voice" (the engagement of the vocal chords), and on the level of voicing these phonemes reciprocally define one another. In this way, phonology is a specific example of a general rule of language described by Saussure: In language there are only differences. Even more important: a difference generally implies positive terms between which the difference is set up; but in language there are only differences without positive terms. Whether we take the signified or the signifier, language has neither ideas nor sounds that existed before the linguistic system. ([1959] 120)
In this framework, linguistic identities are determined not by inherent qualities but by systemic ("structural") relationships.
I have said that phonology "followed the lead" of Saussure, because even though his analysis of the physiology of language production "would nowadays," as Harris says, "be called 'physical,' as opposed to either 'psychological' or 'functional '"(Reading 49), nevertheless in the Course he articulated the direction and outlines of a functional analysis of language. Similarly, his only extended published work, Mémoire sur le système primitif des voyelles dans les langues indo-européennes (Memoir on the primitive system of vowels in Indo-European languages), which appeared in 1878, was fully situated within the project of nineteenth- century historical linguistics. Nevertheless, within this work, as Jonathan Culler has argued, Saussure demonstrated "the fecundity of thinking of language as a system of purely relational items, even when working at the task of historical reconstruction" (Saussure 66). By analyzing the systematic structural relationships among phonemes to account for patterns of vowel alternation in existing Indo-European languages, Saussure suggested that in addition to several different phonemes / a /, there must have been another phoneme that could be described formally. "What makes Saussure's work so very imdivssive," Culler concludes, "is the fact that nearly fifty years later, when cuneiform Hittite was discovered and deciphered, it was found to contain a phoneme, written h, which behaved as Saussure had divdicted. He had discovered, by a purely formal analysis, what are now known as the laryngeals of Indo-European "(66).
This conception of the relational or diacritical determination of the elements of signification, which is both implicit and explicit in the Course, suggests a third assumption governing structural linguistics, what Saussure calls "the arbitrary nature of the sign." By this he means that the relationship between the signifier and signified in language is never necessary (or "motivated"): one could just as easily find the sound signifier arbre as the signifier tree to unite with the concept 'tree'. But more than this, it means that the signified is arbitrary as well: one could as easily define the concept 'tree' by its woody quality (which would exclude palm trees) as by its size (which excludes the "low woody plants" we call shrubs). This should make clear that the numbering of assumptions I have been divsenting does not redivsent an order of priority: each assumption - the systemic nature of signification (best apdivhended by studying language "synchronically"), the relational or "diacritical" nature of the elements of signification, the arbitrary nature of signs - derives its value from the others.
That is, Saussurean linguistics understands the phenomena it studies in overarching relationships of combination and contrast in language. In this conception, language is both the process of articulating meaning (signification) and its product (communication), and these two functions of language are neither identical nor fully congruent (see Schleifer, "Deconstruction"). Here, we can see the alternation between form and content that Greimas and Courtés describe in modernist interdivtation: language divsents contrasts that formally define its units, and these units combine on succeeding levels to create the signifying content. Since the elements of language are arbitrary, moreover, neither contrast nor combination can be said to be basic. Thus, in language distinctive features combine to form contrasting phonemes on another level of apdivhension, phonemes combine to form contrasting morphemes, morphemes combine to form words, words combine to form sentences, and so on. In each instance, the whole phoneme, or word, or sentence, and so on, is greater than the sum of its parts (just as water, H2O, in Saussure's example [(1959) 103] is more than the mechanical agglomeration of hydrogen and oxygen).
The three assumptions of the Course in General Linguistics led Saussure to call for a new science of the twentieth century that would go beyond linguistic science to study "the life of signs within society." Saussure named this science "semiology (from Greek semeîon 'sign')" (16). The "science" of semiotics, as it came to be practiced in Eastern Europe in the 1920s and 1930s and Paris in the 1950s and 1960s, widened the study of language and linguistic structures to literary artifacts constituted (or articulated) by those structures. Throughout the late part of his career, moreover, even while he was offering the courses in general linguistics, Saussure pursued his own "semiotic" analysis of late Latin poetry in an attempt to discover deliberately concealed anagrams of proper names. The method of study was in many ways the opposite of the functional rationalism of his linguistic analyses: it attempted, as Saussure mentions in one of the 99 notebooks in which he pursued this study, to examine systematically the problem of "chance," which " becomes the inevitable foundation of everything "(cited in Starobinski 101). Such a study, as Saussure himself says, focuses on "the material fact" of chance and meaning (cited 101), so that the "theme-word" whose anagram Saussure is seeking, as Jean Starobinski argues, "is, for the poet , an instrument, and not a vital germ of the poem. The poem is obliged to re-employ the phonic materials of the theme-word "(45). In this analysis, Starobinski says, "Saussure did not lose himself in a search for hidden meanings." Instead, his work seems to demonstrate a desire to evade all the problems arising from consciousness: "Since poetry is not only realized in words but is something born from words, it escapes the arbitrary control of consciousness to depend solely on a kind of linguistic legality "(121).
That is, Saussure's attempt to discover proper names in late Latin poetry - what Tzvetan Todorov calls the reduction of a "word... To its signifier" (266) - emphasizes one of the elements that governed his linguistic analysis, the arbitrary nature of the sign. (It also emphasizes the formal nature of Saussurean linguistics - "Language," he asserts, "is a form and not a substance" [Course (1959) 122] - which effectively eliminates semantics as a major object of analysis.) As Todorov concludes , Saussure's work appears remarkably homogeneous today in its refusal to accept symbolic phenomena [phenomena that have intentional meaning]. . . . In his research on anagrams, he pays attention only to the phenomena of repetition, not to those of evocation. . . . In his studies of the Nibelungen, he recognizes symbols only in order to attribute them to mistaken readings: since they are not intentional, symbols do not exist. Finally in his courses on general linguistics, he contemplates the existence of semiology, and thus of signs other than linguistic ones; but this affirmation is at once limited by the fact that semiology is devoted to a single type of sign: those which are arbitrary. (269-70)
If this is true, it is because Saussure could not conceive of "intention" without a subject; he could not quite escape the opposition between form and content his work did so much to call into question. Instead, he resorted to "linguistic legality." Situated between, on the one hand, nineteenth-century conceptions of history, subjectivity, and the mode of causal interdivtation governed by these conceptions and, on the other hand, twentieth-century "structuralist" conceptions of what Lévi-Strauss called "Kantianism without a transcendental subject "(cited in Connerton 23) - conceptions that erase the opposition between form and content (or subject and object) and the hierarchy of foreground and background in full-blown structuralism, psychoanalysis, and even quantum mechanics - the work of Ferdinand de Saussure in linguistics and semiotics circumscribes a signal moment in the study of meaning and culture.
Ronald Schleifer

Додаток 2
Фердинанд де Соссюр (переклад)
Швейцарський мовознавець Фердинанд де Соссюр (1857-1913) вважається засновником сучасної лінгвістики - завдяки своїм спробам описати структуру мови, а не історію окремих мов і словоформ. За великим рахунком, основи структурних методів в лінгвістиці та літературознавстві і, значною мірою, семіотики були закладені в його роботах на самому початку двадцятого століття. Доведено, що методи і концепції так званого "постструктуралізму", розвинені в роботах Жака Дерріда, Мішеля Фуко, Жака Лакана, Юлії Крістевої, Ролана Барта та інших, сходять до лінгвістичних праць Соссюра та Анаграмматические прочитання пізньої римської поезії. Слід зауважити, що роботи Соссюра з лінгвістики та мовної інтерпретації допомагає зв'язати широке коло інтелектуальних дисциплін - від фізики до літературних нововведень, психоаналізу і філософії початку двадцятого століття. А. Дж. Греймас і Ж. Курте пишуть у «Семіотика і мовою»: «Аналітичний словник із заголовком« Інтерпретація »як новий вид інтерпретації з'явився на початку ХХ століття разом з лінгвістикою Соссюра, феноменологією Гуссерля і психоаналізом Фрейда. У такому випадку, "інтерпретація - це не приписування даного змісту до форми, яка інакше відчула б недолік в тому; скоріше це - переказ, який формулює іншим способом той же зміст значущого елемента в межах даної семіотичної системи" (159). У такому розумінні «інтерпретації», форма і зміст нерозривні, навпаки, кожна форма наповнена семантичним значенням («значуща форма»), тому інтерпретація пропонує новий, аналогічний переказ чогось, значущого в іншій знаковій системі.
Подібне розуміння форми і змісту, що представляється Клодом Леві-Строссом в одній із програмних робіт структуралізму, ("Структура і Форма: Роздуми над працями Володимира Проппа") - можна побачити в посмертно вийшла книзі Соссюра «Курс загальної лінгвістики» (1916, пер., 1959, 1983). За життя Соссюр мало публікувався, «Курс» - його основна робота - був зібраний за конспектами студентів, які відвідували його лекції з загальної лінгвістики у 1907-11 рр.. У «Курсі» Соссюр закликав до «наукового» дослідженню мови, протиставляючи його порівняльно-історичного мовознавства дев'ятнадцятого століття. Цю роботу можна вважати одним з найбільших досягнень західної думки: беручи за основу окремі слова як структурні елементи мови, історичне (або «діахронічне») мовознавство доводило походження і розвиток західноєвропейських мов від загального, індоєвропейської мови-і більш раннього праіндоєвропейської.
Це - точно це дослідження унікальних виникнень слів, із супутнім припущенням, що основна "одиниця" мови, фактично, позитивне існування цих "елементів слова", що Соссюр піддав сумніву. Його робота була спробою скоротити безліч фактів про мову, побіжно вивчених порівняльної лінгвістикою, до невеликого числа теорем. Порівняльна філологічна школа XIX століття, пише Соссюр, «не досягла успіху у створенні справжньої школи лінгвістики», оскільки «вона не зрозуміла суті об'єкта вивчення» ([1959] 3). Ця «сутність», стверджує він, полягає не тільки в окремих словах - «позитивних субстанціях» мови - але і в формальних зв'язках, які допомагають цим субстанцій існувати.
Соссюровского «перевірка» мови заснована на трьох припущеннях. Перше: наукове розуміння мови грунтується не на історичному, а на структурному феномен. Тому він розрізняв окремі явища мови - «події мови», які він визначає як «parole» - і належний, на його думку, об'єкт вивчення лінгвістики, систему (код, структуру), яка керує цими подіями («langue»). Подібне систематичне вивчення, окрім того, вимагає «синхронної» концепції відносин між елементами мови в даний момент, а не «діахронічного» дослідження розвитку мови через його історію.
Ця гіпотеза стала предтечею того, що Роман Якобсон у 1929 назве «структуралізмом» - теорії, де "будь-який набір явищ, досліджений сучасною наукою, розглядається не як механічне скупчення, а як структурне ціле, в якому конструктивна складова співвідноситься з функцією" ("Romantic "711). У цьому уривку Якобсон сформулював соссюровского ідею визначення мови як структури на противагу «несвідомому» перерахуванню історичних подій. Крім того, Якобсон розвиває та інше соссюровского припущення, що стало предтечею стркутурной лінгвістики: базові елементи мови повинні вивчатися в зв'язку не стільки зі своїми причинами, скільки зі своїми функціями. Окремі явища і події (скажімо, історія походження окремих індоєвропейських слів) повинні вивчатися не самі по собі, а в системі, в котрой вони співвіднесені з подібними ж складовими. Це був радикальний поворот у зіставленні явищ з навколишньою дійсністю, значущість якого філософ Ернст Кассірер порівняв з «наукою Галілея, що перевернула в сімнадцятому столітті уявлення про матеріальний світ". Такий поворот, як зауважують Греймас і Курта, змінює уявлення про «інтерпретації», а, седовательно, і самі пояснення. Явища стали трактуватися не щодо причин їх виникнення, а щодо того ефекту, який вони можуть оакзать в сьогоденні і майбутньому. Тлумачення перестало бути незалежним від намірів людини (незважаючи на те, що наміри можуть бути безособовими, «несвідомими» під фрейдистському розумінні цього слова).
У своїй лінгвістиці Соссюр особливо показує цей поворот у зміні поняття слова в лінгвістиці, яке він визначає як знак і описує з точки зору його функцій. Знак для нього-з'єднання звучання і сенсу, «означуваного [signifié] і позначення [signifiant]» (66-67; в англійському перекладі 1983 авторства Роя Харріса - «signification» і "signal" [67]). Природа цього з'єднання - «функціональна» (ні той, ні інший елемент не можуть існувати одне без одного), більше того, "одне запозичує якості в іншого" (8). Таким чином Соссюр визначає основний структурний елемент мови - знак - і робить основою історичного мовознавства ідентичність знаків словами, що вимагає особливо суворого аналізу. Тому ми можемо зрозуміти різні значення, скажімо, одного і того ж слова «дерево» - не тому що слово являє собою лише набір певних якостей, а тому що воно визначено як елемент у знаковій системі, в «структурному цілому», у мові.
Подібне відносне («діакритичні») поняття єдності лежить в основі подання про всі елементи мови у структурній лінгвістиці. Це особливо ясно видно в найбільш оригінальної находкесоссюровского мовознавства, у розвитку концепції «фонем» і «відмінних рис» мови. Фонеми - самі дрібні з вимовних і значущих мовних одиниць. Вони є не тільки звуками, що зустрічаються в мові, але «звуковими образами», зауважує Соссюр, які сприймаються носіями мови як володіють значенням. (Слід зауважити, що Елмар Холенштейн називає лінгвістику Якобсона, щодо основних положень продовжує ідеї та концепції Соссюра, «феноменологічним структуралізмом»). Саме тому провідний доповідач празької школи структуралізму, Ян Мукаровскій, зауважив в 1937 році, що «структура. . . не емпіричне, а феноменологічне поняття; це не сам результат, а набір значущих відносин колективної свідомості (покоління, що оточують і т.д.) ». Схожу думку висловив в 1960 році Леві-Стросс, лідер французького структуралізму: «У структури немає певного змісту; вона сама по собі змістовна, і логічна конструкція, в яку вона укладена, являє собою відбиток реальності».
У свою чергу, фонеми, як самі дрібні мовні елементи, прийнятні для сприйняття, являють собою окрему цілісну «феноменологічну реальність». Наприклад, в англійській мові звук «т» може вимовлятися по-різному, але в усіх випадках людина, що володіє англійською, буде сприймати його як «т». Вимовлений з придихом, з високим або низьким підйомом мови, довгий звук «т» і т.п буде однаково розрізняти значення слів «to» і «do». Більше того - відмінності між мовами такі, що різновиди одного звуку в одній мові можуть відповідати різним фонемам в іншому, наприклад «л» і «р» в англійському різні, в той час як в інших мовах це різновиди однієї фонеми (подібно англійському «т », вимовлене з придихом і без). Великий словниковий запас будь-якого природної мови являє собою набір поєднань набагато меншої кількості фонем. В англійській, наприклад, для проголошення та написання близько мільйона слів використовується всього 40 фонем.
Звуки мови являють собою системно організований набір рис. У 1920е-1930-, слідом за Соссюром, Якобсон та М. С. Трубецькой виділили «відмітні риси» фонем. Ці риси засновані на будові органів мови - мови, зубів, голосових зв'язок - Соссюр помічає це в «Курсі загальної лінгвістики», а Харріс називає «фізіологічної фонетикою» (у більш ранньому перекладі Баскина використовується термін «фонологія») - вони з'єднуються в «вузли »Дург проти одного, щоб видавати звуки. Скажімо, in в англійському різниця між «т» і «д» полягає в наявності або відсутності «голоси» (напрузі голосових зв'язок), і в рівні голоси, що різнить одну фонему від іншої. Таким чином, фонологію можна вважати прикладом спільного мовного праівла, описаного Соссюром: «У мові є лише різницю». Більш важливо навіть не це: відмінність зазвичай має на увазі точні умови, між якими вона перебуває; але в мові існують лише різницю без точних умов. Розглядаємо чи ми «позначення» або «позначуване» - у мові не існує ні понять, ні звуків, які існували б до того, як розвинулася мовна система.
У такій структурі, мовні аналогії визначені не за допомогою споконвічно притаманних їм якостей, а з допомогою системних («структурних») відносин.
Я вже згадав, що фонологія у своєму розвитку спиралася на ідеї Соссюра. Незважаючи на те, що його аналіз мовної фізіології в наш час за словами Харріса, «був би названий« фізичним », на противагу« психологічному »або« функціональному », в« Курсі »він чітко сформулював напрям і основні принципи функціонального аналізу мови. Його єдина видана за життя робота, «Mémoire sur le système primitif des voyelles dans les langues indo-européennes» (Записки про первісну систему голосних в індоєвропейських мовах), видана в 1878, повністю перебувала в руслі порівняльно-історичного мовознавства XIX століття. Тим не менш цією працею, як каже Джонатан Каллер, Соссюр показав «плідність уявлення про мову як про систему взаємопов'язаних явищ, навіть при його історичної реконструкції». Аналізуючи взаємозв'язки між фонемами, пояснюючи чергування голосних в сучасних мовах індоєвропейської групи, Соссюр припустив, що крім декількох різних звуків «а», мають бути й інші фонеми, описувані формально. «Що справляє особливе враження у праці Соссюра, - робить висновок Каллер, - те, що майже 50 років по тому, при відкритті і розшифровці хетської клинопису, була знайдена фонема, на листі позначається« h », яка вела себе так, як передбачав Соссюр. За допомогою формального аналізу він відкрив те, що зараз відомо як гортанний звук у індоєвропейських мовах.
У концепція відносного (діакритичних) визначення знаків, як явно вираженою, так і непрямими в «Курсі», існує і третє ключове припущення структурної лінгвістики, назване Соссюром «довільній природою знака». Під цим мається на увазі, що відношення між звучанням і значенням у мові нічим не мотивоване: з однаковою легкістю можна поєднати слово «arbre» ​​і слово «tree» з поняттям «дерево». Більш того, це означає, що звучання теж довільно: можна визначити поняття «дерево» щодо наявності у нього кори (крім пальм) і за розміром (крім «низьких деревних рослин» - кущів). З цього має бути зрозуміло, що всі представлені мною припущення не діляться на більш і менш важливі: кожне з них - системний характер знаків (найбільше зрозумілий при «синхронному» вивченні мови), їх відносна (діакритичних) сутність, довільна природа знаків - виходить з інших.
Таким чином, в соссюровского мовознавстві досліджуваний феномен розуміється як звід зіставлень і протиставлень мови. Мова - це і вираз значення слів (позначення), і їх результат (спілкування) - і ці дві функції ніколи не збігаються (див. «деконструкцію мови» Шлейфера). Ми можемо помітити чергування форми та змісту, який Греймас і Курта описують у новітньому варіанті інтерпретації: мовні контрасти визначають його структурні одиниці, і ці одиниці взаємодіють на змінюють один одного рівнях, щоб створити певний значиме зміст. Так як елементи мови випадкові, ні контраст, ні поєднання не можуть бути основою. Значить, у мові відмітні ознаки формують фонетичний контраст на іншому рівні розуміння, фонеми з'єднуються в контрастні морфеми, морфеми - у слова, слова - в пропозиції і т.д. У будь-якому випадку, ціла фонема, слово, речення і т.д. являє собою щось більше, ніж сума складових (так само як вода, в соссюровского прикладі - більше, ніж поєднання водню і кисню).
Три припущення «Курсу загальної лінгвістики» призвели Соссюра до ідеї нової науки двадцятого століття, окремо від лінгвістики вивчає «життя знаків у суспільстві». Соссюр назвав цю науку семіології (від грецького «semeîon» - знак). «Наука» семіотики, що розвивалася в Східній Європі в 1920е-1930-і в Парижі в 1950-ті and 1960-ті, розширила вивчення мови та лінгвістичних структур до літературних знахідок, складених (або сформульованих) за допомогою цих структур. Крім того, на заході своєї кар'єри, паралельно своїм курсом загальної лінгвістики, Соссюр зайнявся «семіотичним» аналізом пізньої римської поезії, намагаючись відкрити навмисне складені анаграми власних назв. Цей метод був багато в чому протилежний раціоналізму в його лінгвістичному аналізі: він був спробою, як пише Соссюр в одній з 99 записників, вивчити в системі проблему «ймовірності», яка «стає основою всього». Таке дослідження, як стверджує сам Соссюр, допомагає зосередитися на «речової стороні» ймовірності; «ключове слово», анаграму якого шукає Соссюр, як стверджує Жан Старобінський, «інструмент для поета, а не джерело життя вірші. Вірш служить для того, щоб поміняти місцями звуки ключового слова ». За словами Старобінського, в цьому аналізі «Соссюр не заглиблюється у пошуки прихованих смислів». Навпаки, в його роботах помітно бажання уникнути питань, пов'язаних зі свідомістю: «так як поезія виражається не тільки в словах, але і в тому, що породжують ці слова, вона виходить з-під контролю свідомості і залежить тільки від законів мови».
Спроба Соссюра вивчити імена власні в пізньої римської поезії (Цвєтан Тодоров назвав це скороченням «слова ... лише до його написання») підкреслює одну із складових його лінгвістичного аналізу - довільну природу знаків, а також формальну сутність соссюровского лінгвістики («Мова, - стверджує він, «суть форма, а не явище»), що виключає можливість аналізу змісту. Тодоров робить висновок, що в наші дні праці Соссюра виглядають на рідкість послідовними у небажанні вивчати символи [явища, що мають чітко визначене значення]. . . . Досліджуючи анаграми, Соссюр звертає увагу тільки на повторення, але не на попередні варіанти. . . . Вивчаючи «Пісня про Нібелунгів», він визначає символи тільки для того, щоб привласнити їх помилковим читань: якщо вони ненавмисно, символів не існує. Зрештою, у своїх працях з загальної лінгвістики він робить припущення про існування семіології, яка описує не тільки лінгвістичні знаки, але це припущення обмежується тим, що семілогоія може описувати лише випадкові, довільні знаки.
Раз це дійсно так, то тільки тому, що не міг уявити «намір» без предмета, і він не міг до кінця подолати прірву між формою і змістом - в його працях це перетворювалося на питання. Замість цього він звертався до «мовної законності». Перебуваючи між, з одного боку, концепціями дев'ятнадцятого століття, заснованими на історії і суб'єктивних здогадах, і методах випадкової інтерпретації, заснованих на цих концепціях, і, з іншого боку, структуралістських концепцій, які Леві-Стросс назвав «кантіанства без трансцендентного дійової особи» - стирає протистояння між формою і змістом (суб'єктом і об'єктом), значенням і походженням в структуралізмі, психоаналізі і навіть квантової механіки - праці Ферлінанда де Соссюра з лінгвістики та семіотики позначають поворотний момент у вивченні значень у мові та культурі.

Рональд Шлейфер


Література
1. Адмоні В.Г. Основи теорії граматики / В.Г. Адмоні; АН СССР.-М.: Наука, 1964.-104с.
2. Апресян, Ю.Д. Ідеї ​​та методи сучасної структурної лінгвістики. М., 1966.
3. Арапов, М.В., Херц, М.М. Математичні методи в лінгвістиці. М., 1974.
4. Арнольд І.В. Семантична структура слова в сучасній англійській мові та методика її дослідження. / І.В. Арнольд-Л.: Просвіта, 1966. - 187 с.
5. Баранов О.М. Категорії штучного інтелекту в лінгвістичній семантиці. Фрейми і сценарії / / О.М. Баранов - М., 1987 - 300 c.
6.Башликов А.М. Система автоматизованого перекладу. / А.М. Башликов, А.А. Соколов. - М.: ТОВ «Фіма», 1997. - 20 с.
7.Бодуен де Куртене: Теоретичне Насл Дие і сучасність: Тези доповідей міжнародної наукової конференції / Ред.І.Г. Кондратьєва. - К.: КДУ, 1995. - 224 с.
8. Гладкий А.В., Елементи математичної лігвістікі. /. Гладкий А.В., Мельчук І.А. -М., 1969. - 198 с.
9. Головін, Б.М. Мова і статистика. / Б.М. Головін-М., 1971. - 210 с.
10. Звегинцев, В.А. Теоретична і прикладна лінгвістика. / В.А. Звегинцев-М., 1969. - 143 с.
11. Касевіч, В.Б. Семантика. Синтаксис. Морфологія. / / В.Б. Касевіч-М., 1988. - 292 c.
12. Лекомцев Ю.К. Введення в формальна мова лінгвістики / Ю.К. Лекомцев. - М.: Наука, 1983, 204 с., Іл.
13. Лінгвістичне спадщина Бодуена де Куртене на кінець ХХ століття: Тези доповідей международской науково-практіческтй конференції 15-18 березня 2000 року. - Красноярськ, 2000. - 125 с.
Матвєєва Г.Г. Приховані граматичні значення та ідентифікація соціального обличчя («портрета») мовця / Г.Г. Матвєєва. - Ростов, 1999. - 174 с.
14. Мельчук, І.A. Досвід Побудована лінгвістичних моделей "Сенс <-> Текст". / І.А. Мельчук. - М., 1974. - 145 c.
15. Нелюбін Л.Л. Переклад і прикладна лінгвістика / Л.Л. Нелюбін. - М.: Вища школа, 1983. - 207 с.
16. Про точні методи дослідження мови: про так звану «математичній лінгвістиці» / О.С. Ахманова, І. А. Мельчук, Є.В. Падучева и др. - М., 1961. - 162 с.
17. Піотровський Л.Г. Математична лінгвістика: Навчальний посібник / Л.Г. Піотровський, К.Б. Бектаев, А.А. Піотровська. - М.: Вища школа, 1977. - 160 с.
18.Он ж. Текст, машина, людина. - Л., 1975. - 213 с.
19. Він же. Прикладне мовознавство / Под ред. А.С Герда. - Л., 1986. - 176 с.
20. Ревзін, И.И. Моделі мови. М., 1963. Ревзін, И.И. Сучасна структурна лінгвістика. Проблеми і методи. М., 1977. - 239 с.
21. Ревзін, И.И., Розенцвейг, В.Ю. Основи загального і машинного перекладу / Ревзін І.І., Розенцвейг, В.Ю. - М., 1964. - 401 с.
22. Слюсарева Н.О. Теорія Ф.де Соссюра в світлі сучасної лінгвістики / Н.А. Слюсарева. - М.: Наука, 1975. - 156 с.
23. Сова, Л.З. Аналітична лінгвістика / Л.З. Сова - М., 1970. - 192 с.
24. Соссюр Ф. де. Нотатки з загальної лінгвістики / Ф. де Соссюр; Пер. з фр. - М.: Прогрес, 2000. - 187 с.
25. Він же. Курс загальної лінгвістики / Пер. з фр. - Єкатеринбург, 1999. -426 С.
26. Статистика мови і автоматичний аналіз тексту / Відп. ред. Р.Г. Піотровський. Л., 1980. - 223 с.
27. Столл, P. Множествa. Логікa. Aксіомaтіческіе теоpии. / Р. Столл; Пер. з англ. - М., 1968. - 180 с.
28. Теньєр, Л. Основи структурного синтаксису. М., 1988.
29. Убін І.І. Автоматизація перекладацької діяльності в СРСР / І.І. Убін, Л.Ю. Коростельов, Б.Д. Тихомиров. - М., 1989. - 28 с.
30. Фоp, P. , Кофмaн, A., Дені-Пaпен, М. Совpеменнaя мaтемaтікa. М., 1966.
31. Шенк, Р. Обробка концептуальної інформації. М., 1980.
32. Шіхaновіч, Ю.A. Введення в сучасну мaтемaтіку (нaчaльние поняття). М., 1965
33. Щерба Л.В. Російські голосні в якісному і кількісному відношенні / Л.В. Щерба - Л.: Наука, 1983. - 159 с.
34. Абдулла-заде Ф. Громадянин світу / / Вогник - 1996. - № 5. - С.13
35. В.А. Успенський. Попереджання для читачів «Нового літературного огляду» до семіотичним послань Андрія Миколайовича Колмогорова. - Новий літературний огляд. -1997. - № 24. - С. 18-23
36. Перловська Л. Свідомість, мова і культура. - Знання - сила. -2000. № 4 - С. 20-33
37. Фрумкіна Р.М. Про нас - навскоси. / / Російський Журнал. - 2000. - № 1. - С. 12
38. Фітіалов, С.Я. Про моделювання синтаксису в структурній лінгвістиці / / Проблеми структурної лінгвістики. М., 1962.
39. Він же. Про еквівалентність граматики НС і граматики залежностей / / Проблеми структурної лінгвістики. М., 1967.
40. Хомський, Н. Логічні основи лінгвістичної теорії / / Нове в лінгвістиці. Вип. 4. М., 1965
41. Schleifer R. Ferdinand de Saussure / / divss. jhu.ru
42. www.krugosvet.ru
43. www.lenta.ru
44. phil.ru.ru
45. divss. jhu.ru
46. ru.wikipedia.org
47. www.smolensk.ru
Додати в блог або на сайт

Цей текст може містити помилки.

Іноземні мови і мовознавство | Курсова
244.5кб. | скачати


Схожі роботи:
Криптологія точки дотику математики та мовознавства
Принципи дидактики в навчанні математики Цілі та зміст навчання математики в середній загальноосвітній
Короткий словник з мовознавства
Парадигми в історії мовознавства XX ст
Парадигми в історії мовознавства XX в 2
Фонетика як галузь мовознавства
Відповіді на квитки з мовознавства
Конспекти лекцій з мовознавства
Течії сучасного мовознавства
© Усі права захищені
написати до нас