Прикладні аспекти квантитативной лінгвістики

[ виправити ] текст може містити помилки, будь ласка перевіряйте перш ніж використовувати.

скачати

Тема

Прикладні аспекти квантитативной лінгвістики

План роботи

1. Проблематика квантитативной лінгвістики з теоретичної та прикладної точок зору

2. Основні галузі застосування структурно-ймовірнісної моделі мови

3. Авторизація тексту: приклад експертизи

Література

1. Проблематика квантитативной лінгвістики з теоретичної та прикладної точок зору

Назва «квантитативних лінгвістика» досить умовно, хоча і досить широко використовується в сучасній науковій літературі. Воно характеризує міждисциплінарний напрям у прикладних дослідженнях, в якому в якості основного інструменту вивчення мови та мовлення використовуються кількісні або статистичні методи аналізу. Іноді квантитативних (або кількісна) лінгвістика протиставляється комбінаторної лінгвістиці. В останній домінуючу роль займає «некількісних» математичний апарат теорія множин, математична логіка, теорія алгоритмів і т.д.

Застосування кількісних методів при описі функціонування мови мало чим відрізняється від використання аналогічного інструментарію в природничих і гуманітарних науках. Залучення методів вимірювання та підрахунку мовних реалізацій дозволяє, проте, істотно модифіковані уявлення про мовну систему та можливості її функціонування. У цьому відношенні квантитативних лінгвістика виявляється найважливішим фактором, що впливає на лінгвістичну теорію. Наприклад, у сфері граматики теоретична лінгвістика, як правило, обмежується констатацією існування в російській мові системи відмінків. Зі структурної точки зору цього, бути може, й досить. Тим часом за рамками обговорення залишається вельми істотна інформація про те, як часто використовуються різні відмінки, яка динамка використання різних відмінків з плином часу. Дослідження такого роду дозволило б виявити тенденції розвитку відмінкової системи і на основі цього навіть сформулювати гіпотези про майбутній стан граматичної системи російської мови.

Інший приклад. З системної точки зору в російській, англійській і латинською мовами є форма називного відмінка однини особових займенників. Проте в англійській мові при дієслові ця форма займенника практично завжди необхідна, в російській - займенник у цих випадках зазвичай представлено, а в латині - як правило, відсутня. Відсутність достовірних кількісних даних про ці мовних явищах робить структурний опис явно недостатнім. Зрозуміло, є і змішані випадки.

Близькі проблеми виникають і в сфері лексики. Звичайні тлумачні словники не поміщають в складі словникової статті інформації про частоту використання тієї чи іншої лексеми. Це пов'язано з дуже великим обсягом роботи, який треба виконати, щоб для кожного слова вказати хоч якісь рамки частотності. Для користувача словника така інформація може виявитися дуже важливою, часто вирішальною для прийняття рішення про використання слова. Ср, наприклад, високочастотні в публіцистиці ідіоми з голови до ніг / з ніг до голови (48 входжень на 21 млн слововживань), цілком і повністю (49 входжень на 21 млн), на всі сто (42 входження на 21 млн), рівним рахунком, ні більше ні менше (71 входження на 21 млн), ні багато, ні мало (133 входження на 21 млн) і дуже рідкісні для газетно-журнального стилю висловлювання море розливане (9 входжень на 21 млн), (і) старий і млад (8 входжень на 21 млн), різні різниці (1 входження на 21 млн)).

З теоретичної точки зору використання статистичних методів у мовознавстві дозволяє доповнити структурну модель мови імовірнісним компонентом, тобто створити структурно-імовірнісну модель, що володіє значним пояснювальним потенціалом. Цю сторону використання кількісних методів слід вважати додатком статистики в мовознавстві. До моделей такого роду відноситься, наприклад, «модель життєвого циклу слова», запропонована А. А. Полікарповим. Проведений ним квантитативних аналіз показав, що в досить значній часовій перспективі є явна тенденція до збільшення ступеня абстрактності значень у багатозначного слова - чим пізніше виникає значення, тим воно більш абстрактно. Розроблена кількісна модель дозволяє робити цікаві припущення про відносне «віці» різних частин мови, тенденцій розвитку лексичної системи мови і т.д.

З наведеного прикладу видно, що завдання побудови структурно ймовірнісної моделі функціонування мови відноситься до теоретичних проблем лінгвістики і входить в компетенцію теорії мови. У прикладній же області квантитативних лінгвістика представлена ​​перш за все використанням фрагментів цієї моделі.

2. Основні галузі застосування структурно-ймовірнісної моделі мови

Лінгвістичний моніторинг функціонування мови. Завдання лінгвістичного моніторингу полягає у виявленні загальних особливостей функціонування мовної системи в конкретному типі дискурсу (науковому, політичному дискурсі, текстах засобів масової інформації і т.д.). Як предмет лінгвістичного моніторингу можуть виступати такі феномени природної мови, як типи мовних помилок, сфера іноземних запозичень, нові слова і значення, нові (креативні, творчі - не конвенціональні) метафори, тематичний розподіл лексики (наприклад, лексика тимчасових і просторових відносин, лексика вираження почуттів та емоцій, спортивна лексика і т.д.), особливості використання в текстах тих або інших граматичних форм, синтаксичних конструкцій. Технологія лінгвістичного моніторингу грунтується на двох найважливіших передумови: по-перше, на регулярності і періодичності аналізованих даних, і, по-друге - на досить великому обсязі притягається матеріалу, на репрезентативності вибірки даних. У силу цього лінгвістичний моніторинг неможливий без відповідного комп'ютерного забезпечення. Використання комп'ютерної технології дозволяє давати оцінку досліджуваного феномену, вишукуючи його розподіл за часом, за джерелами, авторам і т.д.

Інформація про статистичні закономірності функціонування мовної системи лежить в основі деяких методик аналізу даних, що розробляються в політичній лінгвістиці. До них належить, зокрема, методика контентаналіза, використовувана для виявлення структури та стану суспільної свідомості. За допомогою контентаналіза з'являється можливість за частотою вживання лексем реконструювати, наприклад, ціннісні орієнтації суспільства, виявляти актуальні теми публічної політики, оцінювати динаміку зміни тематики політичних дискусій, тощо.

Комп'ютерне моделювання мови й мови. Інша важлива область прикладного використання знань про частоту використання тих чи інших мовних структур - комп'ютерна лінгвістика. Багато комп'ютерні програми, пов'язані з функціонуванням мови, використовують алгоритми, що грунтуються на даних про частоту вживання фонем, морфем, лексичних одиниць і синтаксичних конструкцій. Наприклад, програми автоматичної корекції орфографії містять словники, як правило, тільки найбільш частотних лексем. Рідкісні слова користувач може вводити в свій індивідуальний словник. Аналогічні словники використовуються в програмах автоматичного розпізнавання письмового тексту й мови (типу Fine Reader). Абсолютна частота появи лексем (особливо термінологічної лексики) використовується в системах автоматичного анотування та реферування. Так, згідно статистико-дистрибутивного методу автоматичного індексування інформативними для даного тексту вважаються скупчення слів, розташованих досить близько один від одного, частота яких перевершує деяку порогову величину, наприклад, середню частоту слів у документі (метод ACSI - Matic).

Дешифрування кодованого тексту. У процесі дешифрування також можуть використовуватися дані про частоту вживання графем, морфем і слів, а також їх взаємне розташування. До теперішнього часу розроблені продуктивні алгоритми дешифрування, засновані на частоті та дистрибуції елементів кодованого тексту, порівн. деші-Фровочние алгоритми Б. В. Сухотина, статистико-комбінаторний метод М. Д. Андрєєва. Близькі до завдань дешифрування формальні процедури «відкриття» морфемного складу неописаної мови, запропоновані 3. Харрісом.

Авторизація атрибуція тексту. Проблема авторизації тексту належить до числа класичних проблем філологічного дослідження. Часто вона розглядається в рамках «кількісної стилістики» - стилеметрії. Авторизація включає як літературну, так і лінгвістичну складову. В. В. Виноградов у книзі «Проблема авторства та теорія стилів» сформулював типологію факторів атрибуції тексту. До суб'єктивних чинників він відносить:

а) суб'єктивно-комерційні;

б) суб'єктивно-кон'юнктурні;

в) суб'єктивно-естетичні;

г) суб'єктивно-психологічні;

д) суб'єктивно-ідеологічні чинники.

Є й об'єктивні чинники:

а) документально-рукописні (археологічні);

б) історичні (біографії, свідчення сучасників);

в) історико-ідеологічні та зіставно-ідеологічні;

г) історико-стилістичні;

д) художньо-стилістичні;

е) мовностилістичні. Проте чисто філологічний напрямок авторизації не дозволяє побудувати об'єктивні операціональні критерії аналізу та атрибуції тексту. На жаль, більшість факторів, на які звертає увагу В. В. Виноградов, погано формалiзуються,. Іншими словами, різні експерти, використовуючи одні й ті ж фактори, можуть зробити абсолютно різні висновки.

Перспектива об'єктивізації експертного знання була виявлена ​​у використанні кількісних, статистичних методів аналізу тексту. Піонером у цій області став Н. ​​А. Морозов, перу якого належить опублікована в 1915 р. робота «Лінгвістичні спектри. Засіб для відмінності плагіат від істинних творів того чи іншого відомого автора. Стилеметричних етюд ». Істотно, що в квантитативно аналізі Морозов пропонував спиратися не на тематично пов'язану лексику слова, зумовлені специфікою описуваного матеріалу, його предметної і проблемної орієнтацією, - а на службові слова і слова тематично нейтральні. Справа в тому, що саме особливості вживання службових слів, лексем із загальною семантикою, не прив'язаної до тематики художнього твору, формують авторський стиль і практично не піддаються імітації.

В даний час розвиток методик авторизації тексту найбільш продуктивно проходить в рамках стилеметрії. Лінгвістичні підстави авторизації можуть бути різні, але використання кількісних методів аналізу виявляється неминучим. Один із перспективних напрямів у цій області - залучення до авторизації тексту теорії розпізнавання образів. При такому підході стиль описується як простір кількісно виразність параметрів - середня довжина речення, кількість вкладених синтаксичних структур, кількість слів у реченні, кількість пропозицій в абзаці і т.д. Далі кожен аналізований текст виражається через вектор, координати якого задаються значеннями вибраних параметрів. Подібність векторів визначає і схожість стилів.

Розробляються підходи, засновані на вивченні кількісних особливостей реалізації синтаксичних структур, а також на виявленні деяких особливостей формальної структури тексту, пов'язаних з виразом типів чужий і авторській мові. Співвідношення чужої мови (прямий, змішаної, вкладеної) з авторською також виявляється стілеобразующим чинником. Ця характеристика стилю відображена в «формально-пунктуаційно» методі структуризації тексту, який реалізований у комп'ютерній системі DISSKOTE [Грінбаум 1996]. Нижче розбирається приклад авторської експертизи тексту, заснований на методиці аналізу квазісінонімічних лексем.

3. Авторизація тексту: приклад експертизи

Одна з найбільш поширених областей використання знань про статистичні закономірності мовних явищ - експертиза авторства тексту. Типологічно можна подати такі базові ситуації експертного аналізу.

A. Множинна невизначеність. Є безліч текстів чи їх фрагментів. Необхідно встановити, скільком авторам належать тексти, і атрибутувати кожен текст конкретному автору. Це, зрозуміло, найбільш складний випадок аналізу.

Б. Порівняння за зразком. Є приклад тексту (текстів) деякого автора X. Необхідно встановити, чи є він і автором деякого іншого тексту (текстів).

B. Конкуренція зразків. Є зразки текстів авторів X, Y, Z ... . Необхідно встановити, хто з них є автором текстів Т 1, Т 2, ... , Т n

Наведена нижче експертіза12) вписується в рамки випадку В. Мова йшла про спірний авторство. Як матеріал для дослідження були отримані тексти наступних творів: «Слідчий президента», «Смоленська площа», «Божевільні очі», «У гонитві за невидимим вбивцею», «Незнайомець"; «Шакали»; «Важке рішення».

Тексти були представлені в друкованій та електронній формі (файли у форматі DOS TEXT). Вибіркове порівняння файлів і сторінок друкованих текстів творів показало, що вони повністю збігаються з точністю до розмітки гарнітури і фафіческіх вьщеленій у файлах. При комп'ютерній обробці символи розмітки не враховувалися.

Вихідна проблема експертизи була сформульована наступним чином. Автором творів «Божевільні очі», «У гонитві за невидимим вбивцею», «Незнайомець" є Е. Плющіхін, а творів «Шакали», «Важке рішення» - В. Непомнящий. Авторство творів «Слідчий президента», «Смоленська площа» є предметом спору.

У процесі проведення експертизи необхідно було підготувати відповідь на наступні питання:

  1. Чи є специфічні мовні особливості, що відрізняють твори В. Непомнящего «Шакали», «Важке рішення» від творів Е. Плющіхіна «Божевільні очі», «У гонитві за невидимим вбивцею», «Незнайомець", а також від спірної групи творів - «Слідчий президента »,« Смоленська площа »?

  2. Чи є специфічні мовні особливості, характерні одночасно для творів Е. Плющіхіна «Божевільні очі», «У гонитві за невидимим вбивцею», «Незнайомець" і спірною групи творів «Слідчий президента», «Смоленська площа», але не притаманні творам В. Непомнящего «Шакали» і «Важке рішення»?

  3. Чи можна вважати, що виявлені мовні особливості є істотною рисою авторських стилів названих письменників і можуть використовуватися при встановленні авторства художнього тексту?

У дослідженні з експертизи використовувалася методика кількісного аналізу квазісінонімічних лексем. Сутність методики полягає у виявленні авторських переваг у виборі з групи квазісінонімов - близьких за значенням слів або стійких словосполучень (фразеологізмів). У літературознавстві та структурної поетиці близькі методи залучаються для характеристики стилю письменника та особливостей його бачення світу. Цікаву інформацію про идиолекте письменника дає вивчення частотних характеристик службових і модальних слів. Так, частки хіба і невже по-різному розподілені в романах М. Булгакова «Майстер і Маргарита» і «Біла гвардія»: хіба значно частіше зустрічається в «Майстрі і Маргариті», а невже - навпаки. Значення частки хіба передбачає більш активну, дієву позицію опонента, що ставить під сумнів деякий стан справ. На противагу хіба частка невже скоріше вказує на те, що деякий стан справ практично приймається мовцем і він лише дивується, дивується, чому воно має місце. Враховуючи значення цих частинок, зазначені факти розподілу хіба і невже можна інтерпретувати як лінгвістичний корелят авторської позиції в зображенні подій і дій героїв: щось на кшталт пасивного «подиву», «здивування» автора у «Білій гвардії» і при активному сприйнятті реальності в «Майстрі і Маргариті ».

Такі «сплески» розподілу частот службових і модальних слів характеризують не тільки окремі тексти художньої прози, а й виявляються характерологічними для одного письменника, опиняючись поверхневим проявом його ідеологічної і творчої позиції. Явна нестандартність розподілу частоти деяких службових слів спостерігається і в творах Ф. М. Достоєвського.

У художніх текстах Достоєвського ми зустрічаємося з абсолютно іншою ситуацією: на одне вживання щонайменше доводиться 342,5 вживань принаймні (принаймні - 685 входжень по 35 художніми текстами, щонайменше - 2 входження по 35 художніми текстами). Всього вживань щонайменше три, але одне з них припадає на контекст, більш підходящий для принаймні

На противагу щонайменше, принаймні з переконливістю відноситься до слів Достоєвського. Конкорданси на це словосполучення займають більше двохсот сторінок тексту.

Можна було б подумати, що в російській мові часів Достоєвського розподіл між принаймні і щонайменше було саме таким: частота принаймні істотно перевершувала частоту щонайменше. Однак це не так. Попередній аналіз корпусу текстів Гоголя (близько трьох мегабайт) показує, що різниця в частотності цих одиниць не така велика, як у Достоєвського: на 1 вживання щонайменше - 83 вживання принаймні. Досить імовірно, що у сфері публіцистики того часу відмінність в частоті вживання щонайменше і принаймні було ще меншим і наближалося до сучасної нормі. Тут теж можна бачити корелят авторського бачення світу, авторського стилю.

За отриманими файлів творів Е. Плющіхіна, В. Непомнящего і спірних творів (для кожного тексту окремо і споживачем гуртам - спірна група »,« група творів Плющіхіна »,« група творів Непомнящего ») були складені словники з зазначенням абсолютної і відносної частоти вживання (загальна кількість слововживань за творами і по групах див. у додатку до експертизи). Для комп'ютерної обробки використовувалася програма DIALEX і база даних ACCESS 7 у середовищі Windows.

Зі сфери аналізу були виключені слова з предметним значенням, частота вживання яких визначається конкретною проблемною областю. Були проаналізовані групи квазісінонімов для наступних шарів лексичної системи мови:

  • прислівники,

  • частинки,

  • вступні слова і вирази,

  • фразеологічні вирази (ідіоми),

  • дієслова мовлення,

  • союзи і союзні слова.

Розглянемо послідовно приклади квазісінонімов з кожної групи лексем. Прислівники ступеня. Перша проаналізована група - прислівники зі значенням неповноти якого-небудь властивості, характеристики - ледь й небагато. Ці прислівники в багатьох контекстах близькі за значенням. Однак стилістичні переваги авторів виявляються в тенденціях вибору цих слів. Відносна частота майже і трохи для спірних творів та творів Плющіхіна практично ідентична, проте вона істотно відрізняється від відносної частоти вживання цих одиниць у Непомнящего: ледь = 0,007% (спірні), 0,006% (Плющіхін), 0,018% (Непомнящий); трохи = 0,002 % (спірні), 0,002% (Плющіхін), 0,031% (Непомнящий) (див. табл. 1).

Таблиця 1


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют. частота

Відносить. частота

Абсолют. частота

Відносить. частота

Абсолют. частота

Відносить. частота

Ледве Трохи

6 +7 16) = 13 2 +1 = 3

0,007% 0,002%

12 +3 +12 = 27 1 +2 +2 = 5

0,006% 0,002%

11 +18 = 29

25 +25 = 50

0,018% 0,031%

Друга група досліджених прислівників мірою характеризує ступінь) очікування деякої події. До них відносяться лексеми раптом, раптово, несподівано. Всі ці прислівники дуже близькі за значенням. Тим самим їх частотний розподіл може розглядатися як характеристика j авторського стилю. Аналіз показує, що відносні частоти вживається-. лень прислівників раптом, раптово і несподівано в творах «спірною групи» і творів Плющіхіна практично збігаються: раптом - 0,052% (спірні), 0,05% (Плющіхін); раптово - 0,001% (спірні), 0,000% (Плющіхін); несподівано - 0,007% (спірні), 0,006% (Плющіхін) (див. табл. 2). Відносні частоти відповідних прислівників у групі творів Непомнящего істотно відрізняються від перших двох груп: раптом - 0,065%; раптово - 0,005%; несподівано - 0,016%.

Таблиця 2


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Раптом Раптово Несподівано

61 +30 = 91 1 +1 = 2 10 +2 = 12

0,052%

0,001%

0,007%

52 +16 +39 = 107 0 +0 +0 = 0 5 +0 +7 = 12

0,05%

0,000% 0,006%

79 +25 = 104

7 +1 = 8

12 +13 = 25

0,065%

0,005%

0,016%

Третя група проаналізованих прислівників ступеня - лексеми дуже і дуже. Частотний розподіл цих одиниць з певністю вказує на схожість спірної групи творів з творами Плющіхіна. З іншого боку, відносна частота вживання дуже і дуже в текстах Непомнящего істотно вище - 0,17% для дуже (0,06% і 0,05% в спірній групі і в групі текстів Плющіхіна відповідно), 0,06% для занадто ( 0,01% і 0,01% в спірній групі і в групі текстів Плющіхіна) - див. табл. 3. Тенденція до використання лексем, що мають у значенні ідею «перевищення норми якогось властивості», характерна для Непомнящего, виявляється і в частоті вживання кількісного прислівники багато, пор. 0,06% у текстах Непомнящего (абс. част. 100), 0,01% (абс. част. 26) в спірній групі, 0,02% (абс. част. 42) у творах Плющіхіна.

Таблиця 3


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Дуже

Занадто

47 +49 = 96 9 +4 = 13

0,06% 0,01%

32 +36 +42 = 110 3 +3 +8 = 14

0,05% 0,01%

103 +164 = 267 43 +46 = 89

0,17% 0,06%

Частинки. З лексико-граматичного розряду частинок були проаналізовані одиниці теж і також, лексема так (у різних значеннях). Якщо по відносній частоті частки також всі групи творів приблизно рівні, то по відносній частоті частинки теж перша і друга групи (спірні твори і твори Плющіхіна) об'єднуються і протиставляються третьої - творам Непомнящего. Аналогічно по частоті лексеми так протиставлені спірна група творів і твори Плющіхіна, з одного боку, і твори Непомнящего - з іншого (див. табл.4).

Таблиця 4


Спірні

твори

Твори

Плющіхіна

Твори

Непомнящего


Абсолют.

частота

Относ.

частота

Абсолют.

частота

Относ.

частота

Абсолют.

частота

Относ.

частота

Теж

74 +63 = 137

0,08%

55 +36 +66 = 157

0,07%

89 +129 = 218

0,14%

Також

13 +29 = 42

0,02%

11 +5 +15 = 31

0,01%

5 +21 = 26

0,02%

Так

208 +223 = 431

0,25%

166 +239 +118 = 523

0,25%

370 +295 = 665

0,42%

Вступні слова і вирази. Як відомо, до числа вступних слів відносяться лексеми, в яких мовець виражає своє ставлення до сказаного, зокрема оцінку достовірності-недостовірності пропозиції. Була досліджена частота вживання лексичних одиниць звичайно, зрозуміло, природно, пов'язаних з виразом впевненості в істинності затверджується (див. табл. 5). Легко бачити, що відносні частоти вживання цих висловів у групі спірних творів і в творах Плющіхіна практично збігаються, причому з групи квазісінонімов звичайно, зрозуміло, природно перевага віддається звичайно. У групі творів Непомнящего відносна частота вживання звичайно нижче, ніж у перших двох групах, що компенсується використанням вступних слів зрозуміло і природно.

Таблиця 5


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют.

Относ.

Абсолют.

Относ.

Абсолют.

Относ.


частота

частота

частота

частота

частота

частота

Звичайно

114 +86 = 200

0,12%

113 +55 +100 = 268

0,13%

88 +77 = 165

0,10%

Зрозуміло

0 +0 = 0

0,00%

0 +0 +0 = 0

0,00%

33 +13 = 46

0,03%

Природно

2 +1 = 3

0,002%

0 +0 +0 = 0

0,00%

16 +3 = 19

0,01%

Фразеологізми. Специфічні особливості використання фразеологізмів відносяться до числа найбільш характерних стильових особливостей. Для аналізу була залучена група лайливих ідіом з компонентом рис, хер і хрін типу рис / хер / хрін його знає, рис / хер / хрін їх знає і т. д. Було встановлено, що ці вирази зустрічаються тільки в групі спірних творів (абс. частота 8) і в текстах Плющіхіна (абс. частота 17).

Показово використання досить рідкісною ідіоми тим паче: вона не зустрічається у творах Непомнящего, але представлена ​​в текстах спірної групи (5 вживань) і в творах Плющіхіна (2 вживання).

Дієслова мовлення. Серед дієслів мовлення найбільший інтерес представляють ті лексеми, які використовуються як авторські ремарки для введення мови персонажів. У наявному матеріалі було проаналізовано дієслова сказати і заперечити. Незважаючи на те, що за законами жанру (досліджувалися детективні романи) конфліктних ситуацій у спірних текстах і в творах Плющіхіна не менше, ніж у творах Непомнящего, заперечити істотно частіше використовується саме в останній групі, що є незаперечною ознакою авторського стилю - див. табл. 6.

Таблиця 6


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Сказати

Заперечити

1059

2

0,61% 0,00%

1087

0

0,51% 0,00%

919

46

0,57%

0,03%

Союзи і союзні слова. Аналізувалися також союзи і союзні слова оскільки, чому і коли. Слово чому, крім власне союзного вживання, функціонує як питальне слово; для даного типу дослідження це несуттєво. За розподілом частоти вживання і в цьому випадку група творів Плющіхіна істотно зближується з групою спірних творів, а група творів Непомнящего протиставлена ​​перших двох груп, пор. для оскільки 0,03% і 0,03% vs. 0,00%; для чому 0,05% і 0,04% vs. 0,13%; для якщо 0,22% і 0,23% vs. 0,31% (див. табл. 7).

Таблиця 7


Спірні твори

Твори Плющіхіна

Твори Непомнящего


Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Абсолют. частота

Относ. частота

Оскільки Чому

Якщо

48

95

381

0,03% 0,05% 0,22%

57

95

493

0,03% 0,04% 0,23%

6

212

488

0,00% 0,13% 0,31%

Проведене дослідження дозволяє говорити про те, що існують специфічні мовні особливості, що відрізняють стиль творів Е. Плющіхіна від стилю творів В. Непомнящего. Ці особливості проявляються на різних рівнях лексичної системи мови - у виборі прислівників, вступних слів, часток, фразеологізмів, спілок і союзних слів, а також дієслів мовлення. Характерні риси стилю Е. Плющіхіна простежуються у творах спірної групи «Слідчий президента» і «Смоленська площа». З іншого боку, характерні мовні риси стилю В. Непомнящего не виявляються в творах спірної групи. У рамках даного обмеженого за обсягом матеріалу (для запропонованих текстів двох даних письменників) виявлені особливості авторської мови можуть розглядатися як суттєвий чинник на користь визнання авторства Е. Плющіхіна на твори спірної групи.

Література

  1. Виноградов В. В. Лінгвістичні основи наукової критики тексту Питання мовознавства. 2004. № 2, 3.

  2. Виноградов В. В. Проблема авторства та теорія стилів. М., 2005.

  3. Марусенко М.А. Атрибуція анонімних і псевдонимно текстів методами прикладної лінгвістики / / Прикладне мовознавство. СПб., 2008.

  4. Піотровський Р. Г., Бектаев К. Б., Піотровська А. А. Математична лінгвістика. М. 2007.

  5. Шайкевич А. Я. дистрибутивно-статистичний аналіз в семантиці Принципи і методи семантичних досліджень. М., 2006.

  6. Шайкевич А. Я. Кількісні методи Лінгвістичний енциклопедичний словник. М., 2008.


Додати в блог або на сайт

Цей текст може містити помилки.

Іноземні мови і мовознавство | Реферат
87.3кб. | скачати


Схожі роботи:
Прикладні аспекти біоенергетики
Теоретичні й прикладні аспекти реструктуризації бізнесу
Прикладні аспекти теми Швидкість хімічної реакції і каталіз на уроках хімії в середній школі
Статус лінгвістики як науки
Витоки когнітивної лінгвістики
Мовчання як об`єкт вивчення лінгвістики
Теоретичні передумови непарадігматіческой лінгвістики
Напрями комп`ютерної лінгвістики
Методологічні основи гендерної лінгвістики
© Усі права захищені
написати до нас