Реферати, курсові, дисертації, дипломи

[ Алгоритми пошуку підрядка в рядку 2 ]!

<div style="font-size:16px;text-align:justify;">
	<div><h1 align=center style=text-align:center> <a href="Федералізм" title="Федералізм"> Федеральне</a> міністерство за освітою </h1> <a href="Держава" title="Держава"> Державна</a> освітня установа вищої професійної освіти <br />  «Вятський державний гуманітарний університет» <br />  Факультет інформатики <br />  Кафедра інформатики і методики <a href="Навчання_інформатики" title="Навчання інформатики">навчання інформатики</a> <br /> <a href="Курсова" title="Курсова"> Курсова</a> <a href="робота" title="робота">робота</a> <br />  Алгоритми пошуку <a href="Підряд" title="Підряд">підрядка</a> в рядку <br />  Виконав <br /> <a href="Студент" title="Студент"> студент</a> III курсу математичного факультету <br>  <b>Бєлов Денис Володимирович</b> <br />  Перевірив викладач кафедри інформатики та методики <a href="Навчання" title="Навчання">навчання</a> інформатики <br>  <b>Іванов С. Ю.</b> <br /> <a href="Кіров" title="Кіров"> Кіров</a>, 2006 р. <b> </b><br /><h1 align=center style=text-align:center;page-break-after:avoid>  Зміст. </h1>  Введення.  3 <xml></xml><br />  Частина 1.  Теоретичні відомості про алгоритми пошуку підрядка в рядку.  5 <xml></xml><br />  1.1.  Основні <a href="Поняття" title="Поняття">поняття</a>.  5 <xml></xml><br />  1.1.1 Рядок, її довжина, <a href="Підряд" title="Підряд">підрядок</a>.  5 <xml></xml><br />  1.1.2. <a href="Поняття" title="Поняття"> Поняття</a> про складність алгоритму.  6 <xml></xml><br />  1.2.  Алгоритми засновані на методі послідовного пошуку.  7 <xml></xml><br />  1.2.1.  Алгоритм послідовного (прямого) пошуку (The Brute Force Algorithm).  7 <xml></xml><br />  1.2.2.  Алгоритм Рабіна.  7 <xml></xml><br />  1.3.  Алгоритм Кнута - Морріса - Пратта (КМП).  10 <xml></xml><br />  1.4.  Алгоритм Бойєра - Мура і деякі його модифікації.  13 <xml></xml><br />  1.4.1.  Алгоритм Боейера - Мура.  13 <xml></xml><br />  1.4.2.  Модифікації БМ.  15 <xml></xml><br />  1.5.  Пошук підрядків за допомогою кінцевого <a href="Автомат" title="Автомат">автомата</a>.  17 <xml></xml><br />  1.5.1.  Структура автомата.  17 <xml></xml><br />  1.5.2.  Приклад побудови кінцевого автомата.  19 <xml></xml><br />  Частина 2.  Експериментальний аналіз алгоритмів.  21 <xml></xml><br />  2.1.  Суть експерименту.  21 <xml></xml><br />  2.2.  Результати та аналіз експерименту.  22 <xml></xml><br />  Висновок.  24 <xml></xml><br /> <a href="Бібліографія" title="Бібліографія"> Бібліографічний</a> список.  25 <xml></xml><br /><h1 style=page-break-after:avoid><br clear=all style=page-break-before:always>  Введення </h1>  Ті, кому доводиться часто працювати з текстовими редакторами, знають ціну <a href="Функції" title="Функції">функції</a> знаходження потрібних слів у тексті, істотно полегшує редагування документів і пошук потрібної інформації.  Дійсно, сучасні програми обробки тексту привчили нас до такої зручної можливості, як пошук і заміна фрагментів, і якщо ви розробляєте подібну програму, користувач має <a href="Право" title="Право">право</a> очікувати, що ви надасте в його розпорядження <a href="Відповідь" title="Відповідь">відповідні</a> команди. <br />  Звичайно, зараз функції пошуку інкапсульовані в багато мов <a href="Програмування" title="Програмування">програмування</a> високого рівня - щоб знайти рядок у невеликому тексті ви, напевно, використовуєте вбудовану функцію.  Але якщо такого роду пошук є ключовим завданням вашої програми, знати принципи організації функцій пошуку буде зовсім не зайве.  При цьому.  в готових підпрограмах далеко не завжди все написано кращим чином.  По-перше, в <a href="Стандарт" title="Стандарт">стандартних</a> <a href="Функції" title="Функції">функціях</a> не завжди використовуються найефективніші алгоритми, а по-друге, цілком можливо, що вам знадобиться змінити <a href="Стандарт" title="Стандарт">стандартну</a> поведінку цих функцій (наприклад, передбачити можливість пошуку за шаблоном).  Нарешті, область застосування функції пошуку не обмежується одними лише текстовими редакторами.  Слід відзначити використання алгоритмів пошуку при індексації сторінок пошуковим роботом, де актуальність інформації безпосередньо залежить від швидкості знаходження ключових слів у тексті <a href="HTML" title="HTML">html</a> - сторінки [9, с.  10]. <a href="робота" title="робота"> Робота</a> <a href="Найпростіші" title="Найпростіші">найпростішого</a> спам - фільтра, полягає в знаходженні в тексті листа фраз таких, як «Мільйон за годину» або «Розкрутка сайту».  Все вищесказане свідчить про актуальність проблеми, зачепленої роботою. <br />  Поставимо задачу пошуку підрядка в рядку.  Нехай у нас є рядок, що складається з деякої кількості <a href="Символ" title="Символ">символів</a>.  Нам потрібно перевірити, чи входить інша задана рядок в даний <a href="Текст" title="Текст">текст</a>, і якщо входить, то починаючи з якого <a href="Символ" title="Символ">символу</a> тексту. <br />  У даній роботі ми ставимо за мету, виявити найбільш оптимальний алгоритм, вирішальний поставлене завдання пошуку. <br />  Завдання даної <a href="Роботи" title="Роботи">роботи</a>: <br />  · Розглянути основні алгоритми, що вирішують завдання пошуку; <br />  · Систематизувати алгоритми згідно використовуваним в них прийомів; <br />  · Виявити ефективні, з точки зору часу виконання, алгоритми. <br />  <a href="робота" title="робота">Робота</a> містить дві основні частини.  У першій будуть розглянуті алгоритми, їх теоретичне обгрунтування, алгоритмічна модель, буде проведена спроба їх класифікації.  У другій частині роботи будуть наведені дані про практичне застосування алгоритмів.  У висновку буде зроблено висновок про найбільш ефективний (з тимчасовою точки зору) алгоритмі. <br /> <b><br clear=all style=page-break-before:always></b> <h1 style=page-break-after:avoid>  Частина 1.  Теоретичні відомості про алгоритми пошуку підрядка в рядку. </h1><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>1.1.</i>  <i>Основні <a href="Поняття" title="Поняття">поняття</a>.</i> <i> </i></h2><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.1.1 Рядок, її довжина,<a href="Підряд" title="Підряд"> підрядок</a>. </h3>  Тут ми наводимо ряд визначень, які будемо використовувати у викладі матеріалу [5, 11]. <br />  <u>Визначення <i>1.</i></u> Рядок (<a href="Слово" title="Слово">слово</a>) - це послідовність знаків (званих літерами) з деякого кінцевого безлічі, званого алфавітом. <br />  <u>Визначення 2.</u>  Довжина рядка - кількість знаків у рядку. <br />  Слова будемо позначати літерами <a href="Латинська" title="Латинська">латинського</a> алфавіту, напр.  X = x [1] x [2] ... x [n] - <a href="Слово" title="Слово">слово</a> довгою n, де x [i] (i-а літера слова) належить алфавітом.  Lentgh (X) = <o:lock v:ext=edit aspectratio=t /><img width=23 height=27 src=dopb63156.zip v:shapes=_x0000_i1025><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1025 DrawAspect=Content ObjectID=_1335691744></o:OLEObject></xml>  = N - позначення довжини рядка. <br />  <u>Визначення 3.</u> <a href="Слово" title="Слово"> Слово</a> не містить жодної букви називається порожнім. <br />  Порожнє слово зазвичай позначають буквою L.  Length (L) = 0. <br />  <u>Визначення 4.</u>  Слово X називається префіксом слова Y, якщо є таке слово Z, що Y = XZ.  Причому <a href="Саме" title="Саме">саме</a> слово є префіксом для самого себе (тому що знайдеться нульове слово L, що X = LX. <br />  <i>Приклад:</i> слово ab є префіксом слова abcfa. <br />  <u>Визначення 5.</u>  Слово X називається суфіксом слова Y, якщо є таке слово Z, що Y = ZX. <a href="Аналогія_2" title="Аналогія 2"> Аналогічно</a>, слово є суфіксом самого себе. <br />  <i>Приклад:</i> слово bfg є суфіксом слова vsenfbfg. <br />  <u>Визначення 6.</u> <b> </b>  Слово X називається підрядком рядка Y, якщо знайдуться такі рядки Z <sub>1</sub> і Z <sub>2,</sub> що Y = Z <sub>1</sub> XZ <sub>2.</sub>  При цьому Z <sub>1</sub> називають лівим, а Z <sub>2</sub> - правим крилом підрядка.  Підрядком може бути й саме слово.  Іноді при цьому слово X називають входженням в слово Y.  Серед всіх входжень слова X в слово Y, входження з найменшою довжиною свого лівого <a href="Крила" title="Крила">крила</a> називають першим або головним змістом.  Для позначення входження використовують позначення X <img width=16 height=16 src=dopb63157.zip v:shapes=_x0000_i1026><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1026 DrawAspect=Content ObjectID=_1335691745></o:OLEObject></xml>  Y. <br />  <i>Приклад:</i> слова hrf і fhr є підстроками слова abhrfhr, gf <img width=16 height=16 src=dopb63157.zip v:shapes=_x0000_i1027><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1027 DrawAspect=Content ObjectID=_1335691746></o:OLEObject></xml>  sfdgfro. <br /><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.1.2.  Поняття про складність алгоритму. </h3>  Метою нашої роботи є знайти ефективний алгоритм, проте нічого поки що не було сказано про метод оцінки алгоритмів. <br />  Традиційно в програмуванні поняття складності алгоритму пов'язано з використанням <a href="Ресурси" title="Ресурси">ресурсів</a> комп'ютера: наскільки багато <a href="Процесор" title="Процесор">процесорного</a> часу вимагає програма для свого виконання, наскільки багато при цьому витрачається пам'ять машини?  Облік пам'яті зазвичай ведеться за обсягом даних і не береться до уваги пам'ять, що витрачається для запису команд програми.  Час розраховується у відносних одиницях так, щоб ця <a href="Оцінка" title="Оцінка">оцінка</a>, по можливості, була однаковою для машин з різною тактовою частотою.  [11, с.  38-40] <br />  У даній роботі будуть розглянуті дві характеристики складності алгоритмів - тимчасова і емкостная.  Ми не будемо обговорювати логічну складність розробки алгоритму - скільки «людино-днів» потрібно <a href="Витрати" title="Витрати">витратити</a> на створення програми, оскільки не представляється можливим дати об'єктивні кількісні характеристики. <br />  Тимчасову складність будемо підраховувати у виконуваних командах: кількість арифметичних операцій, кількість порівнянь, пересилань (залежно від алгоритму).  Ємнісна складність буде визначатися кількістю змінних, елементів масивів, елементів записів або просто кількістю байт [6, 7, 10, 11]. <br />  Ефективність алгоритму також буде оцінюватися за допомогою підрахунку часу виконання алгоритмом конкретно поставленої задачі, тобто  з допомогою експерименту, докладніше <a href="Про_Це" title="Про Це">про це</a> в частині 2 даної роботи. <br /><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>1.2.</i>  <i>Алгоритми засновані на методі послідовного пошуку.</i> <i> </i></h2><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.2.1.  Алгоритм послідовного (прямого) пошуку (The Brute Force Algorithm). </h3>  Найбільш очевидний алгоритм.  Позначимо S - слово, у якому шукається зразок X.  Нехай m і n - довжини слів S і X <a href="Відповідь" title="Відповідь">відповідно</a>.  Можна порівняти зі словом X всі подслова S, які починаються з позицій 1,2 ,..., m-n +1 в слові S; у разі рівності виводиться <a href="Відповідь" title="Відповідь">відповідна</a> позиція (Лістинг 1).  [1, 2] <br /><table cellpadding=0 cellspacing=0><tr><td width=100 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1026 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Лістинг 1 <br /></div></td></tr></table></td></tr></table>  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=559 height=339 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1027 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  <b>Function</b> Search (S: String; X: String; var Place: Byte): Boolean; <br />  {Функція повертає результат пошуку в слові S} <br />  {Подслова X.  Place - місце першого входження} <br />  var Res: Boolean; i: Integer; <br />  Begin <br />  Res: = FALSE; <br />  i: = 1; <br />  While (i <= Length (S)-Length (X) +1) And Not (Res) do <br />  If Copy (S, i, Length (X)) = X then <br />  begin <br />  Res: = TRUE; <br />  Place: = i <br />  end <br />  else i: = i +1; <br />  Search: = Res <br />  End; <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img width=553 height=331 src=dopb63158.zip v:shapes=_x0000_i1028><br />  Дуже просто, але дуже нерозумно.  Адже максимальне, кількість порівнянь дорівнюватиме O ((m-n +1) * n +1), хоча більшість з них насправді зайві.  Наприклад, знайшовши рядок aabc і виявивши невідповідність у четвертому <a href="Символ" title="Символ">символі</a> (співпало тільки aab), алгоритм буде продовжувати порівнювати рядок, починаючи з наступного символу, хоча це однозначно не призведе до результату. <i><u> </u></i> <br />  Наступний метод <a href="Працює" title="Працює">працює</a> набагато швидше найпростішого, але, на жаль, накладає деякі обмеження на <a href="Текст" title="Текст">текст</a> і шуканий рядок. <br /><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.2.2.  Алгоритм Рабіна. </h3>  Алгоритм Рабіна представляє собою модифікацію лінійного алгоритму; він заснований на досить простій ідеї, яку викладемо, слідуючи книзі [13 ,172-173]. <br />  «Уявімо собі, що в слові A, довжина якого дорівнює m, ми шукаємо зразок X довжини n.  Виріжемо "віконечко" розміром n і будемо рухати його з вхідного слова.  Нас цікавить, не збігається слово в "віконечку" із заданим зразком.  Порівнювати по буквах довго.  Замість цього фіксуємо деяку числову функцію на словах довжини n, тоді завдання зведеться до <a href="Порівняння_чисел" title="Порівняння чисел">порівняння чисел</a>, що, безсумнівно, швидше.  Якщо значення цієї функції на слові в "віконечку" та на зразку різні, то збігу немає.  Тільки якщо значення однакові, необхідно перевіряти послідовно збіг по буквах. »(Лістинг 2) <br /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=100 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1028 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Лістинг 2 <br /></div></td></tr></table></td></tr></table>  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=598 height=460 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1029 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  <b>Function</b> Search (S: String; X: String; var Place: Byte): Boolean; <br />  {Функція повертає результат пошуку в слові S} <br />  {Подслова X.  Place - місце першого входження} <br />  Var Res: Boolean; i: Byte; h, NowH, LenX: Integer; HowMany: Integer; <br />  Begin <br />  Res: = FALSE; <br />  i: = 1; <br />  h: = Hash (x); {Обчислення <a href="Хеш-функції" title="Хеш-функції">хеш-функції</a> для шуканого слова} <br />  NowH: = Hash (Copy (S, 1, Length (x))); <br />  HowMany: = Length (S)-Length (X) +1; <br />  LenX: = Length (X); <br />  While (i <= HowMany) And Not (Res) do <br />  If (h = NowH) and (Copy (S, i, Length (X)) = X) then <br />  Begin <br />  Res: = TRUE; <br />  Place: = i <br />  End <br />  else <br />  Begin <br />  i: = i +1; <br />  NextHash (s, i, NowH, LenX); {Обчислення наступного значення хеш-функції} <br />  End; <br />  Search: = Res <br />  End; <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img width=590 height=454 src=dopb63159.zip v:shapes=_x0000_i1029><br />  Цей алгоритм виконує лінійний прохід по рядку (n кроків) і лінійний прохід по всьому тексту (m кроків), отже, загальний час роботи є O (n + m).  При цьому ми не враховуємо тимчасову складність обчислення хеш-функції, так як, суть алгоритму в тому і полягає, щоб дана <a href="функція" title="функція">функція</a> була настільки легко обчислюється, що її робота не впливала на загальну роботу алгоритму.  Тоді, час роботи алгоритму лінійно залежить від розміру рядка і тексту, стало бути програма працює швидко.  Адже замість <a href="Того" title="Того">того</a>, щоб перевіряти кожну позицію на предмет відповідності зі зразком, ми можемо перевіряти тільки ті, які «нагадують» зразок.  Отже, для того, щоб легко встановлювати явна невідповідність, будемо використовувати функцію, яка повинна: <br />  1.  Легко обчислюватися. <br />  2.<a href="Як" title="Як">  Як</a> можна краще розрізняти неспівпадаючі рядки. <br />  3.  hash (y [i +1, i + m]) повинна легко обчислюватися за hash (y [i, i + m-1]. <br />  Під час пошуку х будемо порівнювати hash (x) з hash (y [i, i + m-1]) для i від 0 до nm включно.  Якщо виявляємо збіг, то перевіряємо посимвольно. <br />  Приклад (зручною для обчислення функції) [13, 172].  Замінимо всі букви в слові і зразку їх номерами, що представляють собою цілі числа.  Тоді зручною <a href="Функції" title="Функції">функцією</a> є сума цифр.  (При зсуві "віконечка" потрібно додати нове число і відняти "зникле".) <br />  Однак, проблема в тому, що шукана рядок може бути довгою, рядків в тексті теж вистачає.  А так як кожному рядку потрібно зіставити унікальне число, то і чисел має бути багато, а стало бути, числа будуть великими (порядку D * n, де D - кількість різних символів), і працювати з ними буде так само незручно.  Але який інтерес працювати тільки з короткими рядками і цифрами?  Розробники алгоритму придумали, як поліпшити цей алгоритм без особливих втрат у швидкості роботи. <br />  Приклад (сімейства зручних функцій) [13, 172-173].  Виберемо деякий число p (бажано просте) і деякий вирахування x за модулем p.  Кожне слово довжини n будемо розглядати як послідовність цілих чисел (замінивши літери їх кодами).  Ці числа будемо розглядати як коефіцієнти многочлена ступеня n-1 і обчислимо значення цього многочлена з модулю p в точці x.  Це і буде одна з функцій сімейства (для кожної пари p і x виходить своя <a href="функція" title="функція">функція</a>).  Зсув "віконечка" на 1 <a href="Відповідь" title="Відповідь">відповідає</a> вирахуванню старшого члена, множенню на x і додаванню вільного члена.  Наступне міркування говорить на користь того, що збігу не дуже вірогідні.  Нехай число p фіксоване і до того ж воно є простим, а X і Y - два різних слова довжини n.  Тоді їм <a href="Відповідь" title="Відповідь">відповідають</a> різні многочлени (ми припускаємо, що коди всіх букв різні - це можливо при p, більшому числа літер алфавіту).  Збіг значень функції означає, що в точці x ці два різних многочлена збігаються, тобто  їх різниця звертається до 0.  Різниця є многочлен ступеня n-1 і має не більше n-1 коренів.  Таким чином, якщо n багато менше p, то випадковим значенням x мало шансів потрапити в "невдалу" крапку. <br />  Строго кажучи, час роботи всього алгоритму в цілому, є O (m + n + mn / P), mn / P досить невелика, так що складність роботи майже лінійна.  Зрозуміло, що просте число слід вибирати великим, чим більше це число, тим швидше буде працювати програма. <br />  Алгоритм Рабіна і алгоритм послідовного пошуку є алгоритмами з найменшими трудовитратами, тому вони годяться для використання при вирішенні деякого класу задач.  Однак ці алгоритми не є найбільш оптимальними (хоча б тому, що іноді виконують явно марну роботу, про що було сказано вище), тому ми перейдемо до наступного класу алгоритмів.  Ці алгоритми з'явилися в результаті ретельного дослідження алгоритму послідовного пошуку.  Дослідники хотіли знайти способи більш повно використовувати інформацію, отриману під час сканування (алгоритм прямого пошуку її просто викидає).  Розглянемо алгоритм Кнута - Морріса - Пратта. <br /><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>1.3.</i>  <i>Алгоритм</i> Кнута - Морріса - Пратта <i> </i>  (КМП). </h2>  Спочатку розглянемо деякі допоміжні затвердження.  Для довільного слова X розглянемо всі його початку, що одночасно є його кінцями, і виберемо з них найдовше (не рахуючи, звичайно, самого слова X).  Позначимо його n (X).  Така функція носить назву префікс - функції [13]. <br />  <strong><u><b>Приклади.</b></u></strong> <br />  n (aba) = a, n (n (aba)) = n (a) = L; <br />  n (abab) = ab, n (n (abab)) = n (ab) = L; <br />  n (ababa) = aba, n (n (ababa)) = n (aba) = a, n (n (n (ababa))) = n (a) = L; n (abc) = L. <br />  <strong>Доведемо кілька використовуваних згодом фактів, а саме <u>пропозиція</u></strong> (за [Шень, 1995, с.165-166]): <br />  (1) Послідовність слів n (X), n (n (X)), n (n (n (X ))),...  "Обривається" (на порожньому слові L). <br />  (2) Усі слова n (X), n (n (X)), n (n (n (X ))),..., L є началами слова X. <br />  (3) Будь-яке слово, що одночасно є початком і кінцем слова X (крім самого X), входить в послідовність n (X), n (n (X )),...., L. <br />  <strong><u><b>Доказ.</b></u></strong> <br />  (1) Тривіально, тому що  кожне слово, яке коротше попереднього. <br />  (2) Кожне з них (за визначенням) є початком попереднього.  З тієї ж причини всі вони є кінцями слова X. <br />  (3) Нехай слово Y є одночасно початком і кінцем X.<a href="Слово" title="Слово">  Слово</a> n (X) - найдовше з таких слів, так що Y не довше n (X).  Обидва ці слова є началами X, тому більш короткий з них є початком більш довгого: Y є початок n (X).  Аналогічно, Y є кінець n (X).  Міркуючи по індукції, можна припускати, що затвердження завдання вірно для всіх слів коротше X, зокрема, для слова n (X).  Так що слово Y, що є кінцем і початком n (X), або дорівнює n (X), або входить в послідовність n (n (X)), n (n (n (X ))),...,, L . <br />  <a href="Пропозиція" title="Пропозиція">Пропозиція</a> доведено. <br />  Метод КМП використовує предобработку шуканого рядка, а саме: на її основі створюється префікс-функція.  При цьому використовується наступна ідея: якщо префікс (він же суфікс) рядки довгою i довше одного символу, то він одночасно і префікс підрядка довгою i-1 (Лістинг 3).  Таким чином, ми перевіряємо префікс попередньої підрядка, якщо ж той не підходить, то префікс її префікса, і т.д.  Діючи так, знаходимо найбільший шуканий префікс.  Наступне питання, на який варто ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=629 height=245 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1030 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  Procedure PrefFunc (P: String; Var Fl: TMas); <br /></div></td></tr></table></td></tr></table></div><div><td><tr><table><td><tr><table>  Var n, i, j: Integer; <br />  Begin <br />  n: = Length (P); <br />  Fl [1]: = 0; <br />  For i: = 2 To n Do <br />  Begin <br />  j: = Fl [i-1]; <br />  While (j <> 0) And (P [j] <> P [i-1]) Do j: = Fl [j]; <br />  Fl [i]: = j +1; <br />  End; <br />  End; <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img width=620 height=238 src=dopb63160.zip v:shapes=_x0000_i1030> <a href="Відповідь" title="Відповідь"> відповісти</a>: чому час роботи процедури лінійно, адже в ній присутній вкладений цикл?  Ну, по-перше, присвоєння префікс-функції відбувається чітко m разів, решту часу змінюється мінлива k.  Так як у циклі while вона зменшується (P [k] <k), але не стає менше 0, то зменшуватися вона може не частіше, ніж зростати.  Змінна k зростає на 1 не більше m разів.  Значить, мінлива k змінюється всього не більше 2m разів.  Виходить, що час роботи всієї процедури є O (m) [1, 2]. <br /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=100 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1031 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Лістинг 3 <br /></div></td></tr></table></td></tr></table>  А зараз ми переходимо до самого алгоритму, що шукає підрядок в рядку (Лістинг 4). <br /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=100 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1032 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Лістинг 4 <br /></div></td></tr></table></td></tr></table>  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=582 height=356 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1033 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  Function KMPSearch (S, P: String): Integer; <br />  {Алгоpитм Кнута-Моpіса-Пpатта, що встановлює} <br />  {Входження непорожній стpок P в стpок S} <br />  Var Fl: TMas; <br />  i, j, n, m: Integer; <br />  Begin <br />  n: = Length (S); <br />  m: = Length (P); <br />  PrefFunc (P, Fl); <br />  j: = 1; <br />  For i: = 1 To n Do <br />  begin <br />  While (j <> 0) And (P [j] <> S [i]) do j: = Fl [j]; <br />  If j = m Then Break; <br />  j: = j +1 <br />  end; <br />  If (j = m) then Result: = i-j +1 Else Result: = 0; <br />  End; <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img width=573 height=348 src=dopb63161.zip v:shapes=_x0000_i1031><br />  Довести що ця програма працює за лінійний час, можна точно так само, як і для префікс - функції.  Стало бути, загальний час роботи програми є O (n + m), тобто лінійний час. <br />  Наостанок зауважимо, що алгоритм послідовного пошуку та алгоритм КМП крім знаходження самих рядків вважають, скільки символів збіглося в <a href="Процес" title="Процес">процесі</a> роботи. <br /><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>1.4.</i>  <i>Алгоритм Бойєра</i> - <i>Мура і деякі його модифікації.</i> <i> </i></h2><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.4.1.  Алгоритм Боейера - Мура. </h3>  Алгоритм Бойєра-Мура, розроблений двома вченими - Бойером (Robert S. Boyer) і Муром (Strother Moore), вважається найбільш швидким серед алгоритмів загального призначення, призначених для пошуку підрядка в рядку. <br /> <a href="Найпростіші" title="Найпростіші"> Найпростіший</a> варіант алгоритму Бойєра-Мура складається з наступних кроків.  На першому кроці ми будуємо таблицю зміщень для шуканого зразка. <a href="Процес" title="Процес"> Процес</a> побудови <a href="Таблиці" title="Таблиці">таблиці</a> буде описано нижче.  Далі ми поєднуємо початок рядка і зразка і починаємо перевірку з останнього символу зразка.  Якщо останній <a href="Символ" title="Символ">символ</a> зразка та <a href="Відповідь" title="Відповідь">відповідний</a> йому при накладенні символ рядка не збігаються, зразок зрушується щодо рядка на величину, отриману з таблиці зміщень, і знову проводиться <a href="Порівняння" title="Порівняння">порівняння</a>, починаючи з останнього символу зразка.  Якщо ж <a href="Символ" title="Символ">символи</a> збігаються, проводиться <a href="Порівняння" title="Порівняння">порівняння</a> передостаннього символу зразка і т. д. Якщо всі символи зразка збіглися з накладеними символами рядки, значить ми <a href="Знайшли" title="Знайшли">знайшли</a> підрядок і пошук закінчено.  Якщо ж якийсь (не останній) символ зразка не співпадає з <a href="Відповідь" title="Відповідь">відповідним</a> <a href="Символ" title="Символ">символом</a> рядка, ми зрушуємо зразок на один символ вправо і знову починаємо перевірку з останнього символу.  Весь алгоритм виконується до тих пір, поки або не буде знайдено входження шуканого зразка, або не буде досягнуто кінець рядка. <br />  Величина зрушення у разі неспівпадання останнього символу обчислюється виходячи з таких міркувань: зрушення зразка повинен бути мінімальним, таким, щоб не пропустити входження зразка в рядку.  Якщо цей символ рядка зустрічається у зразку, ми зміщуємо зразок таким чином, щоб символ рядка збігся з найбільш правим входженням цього символу у зразку.  Якщо ж зразок взагалі не містить цього символу, ми зрушуємо зразок на величину, що дорівнює його довжині, так що перший символ зразка накладається на наступний за перевіряється символ рядка. <br />  Величина зміщення для кожного символу зразка залежить тільки від порядку символів у зразку, тому зсуву зручно обчислити наперед і зберігати у вигляді одновимірного масиву, де кожному символу алфавіту відповідає зміщення відносно останнього символу зразка.  Пояснимо все вищесказане на простому прикладі.  Нехай у нас є алфавіт з п'яти символів: a, b, c, d, e і ми хочемо знайти входження зразка "abbad" в рядку "abeccacbadbabbad".  Наступні схеми ілюструють всі етапи виконання алгоритму. <a href="Таблиці" title="Таблиці"> Таблиця</a> зсувів буде виглядати так. <br /><img width=96 height=40 src=dopb63162.zip v:shapes=_x0000_i1032><br />  Початок пошуку. <br /><img width=308 height=40 src=dopb63163.zip v:shapes=_x0000_i1033><br />  Останній символ зразка не співпадає з накладеним символом рядка.  Зрушуємо зразок вправо на 5 позицій: <br /><img width=308 height=40 src=dopb63164.zip v:shapes=_x0000_i1034><br />  Три символу зразка збіглися, а четвертий - ні.  Зрушуємо зразок вправо на одну позицію: <br /><img width=308 height=40 src=dopb63165.zip v:shapes=_x0000_i1035><br />  Останній символ знову не збігається з символом рядка. <a href="Відповідь" title="Відповідь"> Відповідно</a> до таблиці зміщень зрушуємо зразок на 2 позиції: <br /><img width=308 height=40 src=dopb63166.zip v:shapes=_x0000_i1036><br />  Ще раз зрушуємо зразок на 2 позиції: <br /><img width=308 height=40 src=dopb63167.zip v:shapes=_x0000_i1037><br style=mso-special-character:line-break><br style=mso-special-character:line-break><br />  Тепер, згідно з <a href="Таблиці" title="Таблиці">таблицею</a>, зрушуємо зразок на одну позицію, і отримуємо шукане входження зразка: <br /><img width=308 height=40 src=dopb63168.zip v:shapes=_x0000_i1038><br />  Реалізуємо вказаний алгоритм на мові Pascal. <br />  Перш за все слід визначити тип даних «таблиця зсувів».  Для кодової таблиці, що складається з 256 символів, визначення цього типу буде виглядати так: <br />  Type <br />  TBMTable = Array [0 .. 255] of Integer; <br />  Далі наводиться процедура, що обчислює таблицю зміщень для зразка p (Лістинг 5). <br /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=100 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1034 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Лістинг 5 <br /></div></td></tr></table></td></tr></table>  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=526 height=163 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1035 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  <b>Procedure</b> MakeMBTable (var Bmt: TBMTable; Const p: string); <br>  Var i: Integer; <br>  Begin <br>  For i: = 0 to 255 do Bmt [i]: = Length (p); <br>  For i: = Length (p) Downto 1 Do <br>  If Bmt [Byte (p [i])] = Length (p) Then <br>  Bmt [Byte (p [i])]: = Length (p) - i; <br>  End; <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img width=520 height=157 src=dopb63169.zip v:shapes=_x0000_i1039><br />  Тепер напишемо функцію, що здійснює пошук (Лістинг 6). <br />  Параметр StartPos дозволяє вказати позицію в рядку s, з якою слід починати пошук.  Це може бути корисним у тому випадку, якщо ви захочете знайти всі входження p в s.  Для пошуку з самого початку рядка слід задати StartPos рівним 1.  Якщо результат пошуку не дорівнює нулю, то для того, щоб знайти наступне входження p в s, потрібно задати StartPos рівним значенням «попередній результат плюс довжина зразка». <br /><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.4.2.  Модифікації БМ. </h3><h4>  Швидкий пошук (Класифікація <i>Thierry Lecroq [2]).</i> </h4>  Зрушення поганого символу, який використовується в алгоритмі Боуер - Мура, не дуже ефективний для маленького алфавіту, але, коли розмір алфавіту велику у порівнянні з довжиною зразка, як це часто має місце з <br />  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=526 height=430 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1036 style="padding:4.35pt 7.95pt 4.35pt 7.95pt">  function bmsearch (startpos: integer; const s, p: string; <br>  const bmt: tbmtable): integer; <br>  var <br>  pos, lp, i: integer; <br>  begin <br>  lp: = length (p); <br>  pos: = startpos + lp -1; <br>  while pos <length (s) do <br>  if p [lp] <> s [pos] then pos: = pos + bmt [s [pos]] <br>  else for i: = lp - 1 downto 1 do <br>  if p [i] <> s [pos - lp + i] then <br>  begin <br>  inc (pos); <br>  break; <br>  end <br>  <i>else if i = 1 then</i> <i><br></i>  <i>begin</i> <i><br></i>  <i>result: = pos - lp + 1;</i> <i><br></i>  <i>exit;</i> <i><br></i>  <i>end;</i> <i><br></i>  <i>result: = 0;</i> <i><br></i>  <i>end;</i> <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img border=0 width=520 height=424 src=dopb63170.zip v:shapes=_x0000_i1040><br /> <a href="Таблиці" title="Таблиці"> таблицею</a> ASCII і при звичайному пошуку в текстовому редакторі, він стає надзвичайно корисний.  Використання в алгоритмі тільки його одного може бути досить ефективним. <br />  Після спроби поєднання x і y [i, i + m-1], довжина зсуву - не менше 1.  Таким чином, символ y [i + m] обов'язково буде залучений в наступну спробу, а значить, може бути використаний в поточній спробі для зрушення поганого символу.  Модифікуємо функцію поганого символу, щоб прийняти до уваги останній символ х: <br />  bc [a] = min {j | 0 <img border=0 width=13 height=16 src=dopb63171.zip v:shapes=_x0000_i1041><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1041 DrawAspect=Content ObjectID=_1335691748></o:OLEObject></xml>  j <img border=0 width=13 height=16 src=dopb63171.zip v:shapes=_x0000_i1042><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1042 DrawAspect=Content ObjectID=_1335691749></o:OLEObject></xml>  m і x [m - 1 - j] = a}, якщо a зустрічається в x, <br />  bc [a] = m в протилежному випадку. <br /> <a href="Порівняння" title="Порівняння"> Порівняння</a> тексту і зразка можуть проводитися у будь-якому порядку. <br /><h4><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=108 height=36 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1037 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  <b>Лістинг 6</b> <br /></div></td></tr></table></td></tr></table>  Турбо БМ (Класифікація <i>Thierry Lecroq [2]).</i> </h4>  Турбо - БМ є також є поліпшенням алгоритму Боуер - Мура.  Ми будемо запам'ятовувати сегмент тексту, який зійшовся з суфіксом зразка під час минулої спроби (і тільки, якщо стався зсув хорошого суфікса). <br />  Це дасть нам дві переваги: <br />  1.  Можливість перескочити через цей сегмент <br />  2.  Можливість застосування «турбо - зсуву» <br />  «Турбо - зрушення» може відбутися, якщо ми виявимо, що суфікс зразка, який збігається з текстом, коротше, ніж той, який був запам'ятати раніше. <br />  Нехай u - запомненний сегмент, а v - cуффікс, який співпав під час поточної спроби, <a href="Такий" title="Такий">такий</a> що uzv - суфікс x.  Тоді av - суфікс x, два символи а і b зустрічаються на відстані p в тексті, і суфікс x довжини | uzv | має період довжини p, а значить не може перекрити обидва появи символів а і b у тексті.  Найменший можливий зсув має довжину | u | - | v | (його ми і називаємо «турбо - зрушенням»). <br /><img border=0 width=538 height=128 src=dopb63172.zip v:shapes=_x0000_i1043><br /><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>1.5.</i>  <i>Пошук підрядків за допомогою кінцевого автомата.</i> <i> </i></h2><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.5.1.  Структура автомата. </h3>  За визначенням, кінцевий <a href="Автомат" title="Автомат">автомат</a> є п'ятірку М = (Q, q <sub>0,</sub> A, <img border=0 width=15 height=16 src=dopb63173.zip v:shapes=_x0000_i1044><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1044 DrawAspect=Content ObjectID=_1335691750></o:OLEObject></xml>  , <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1045><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1045 DrawAspect=Content ObjectID=_1335691751></o:OLEObject></xml>  ), Де: <br />  Q - кінцеве безліч станів; <br />  q <sub>0</sub> <img border=0 width=24 height=16 src=dopb63175.zip v:shapes=_x0000_i1046><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1046 DrawAspect=Content ObjectID=_1335691752></o:OLEObject></xml>  Q - початковий стан; <br />  А  <sub><img border=0 width=16 height=16 src=dopb63157.zip v:shapes=_x0000_i1047></sub> <xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1047 DrawAspect=Content ObjectID=_1335691753></o:OLEObject></xml>  Q - кінцеве безліч допускають станів; <br /><img border=0 width=15 height=16 src=dopb63173.zip v:shapes=_x0000_i1048><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1048 DrawAspect=Content ObjectID=_1335691754></o:OLEObject></xml>  - Кінцевий вхідний алфавіт; <br /><img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1049><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1049 DrawAspect=Content ObjectID=_1335691755></o:OLEObject></xml>  - Функція Q х <img border=0 width=15 height=16 src=dopb63173.zip v:shapes=_x0000_i1050><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1050 DrawAspect=Content ObjectID=_1335691756></o:OLEObject></xml><img border=0 width=20 height=15 src=dopb63176.zip v:shapes=_x0000_i1051><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1051 DrawAspect=Content ObjectID=_1335691757></o:OLEObject></xml>  Q, звана функцією переходів автомата. <br />  Спочатку кінцевий <a href="Автомат" title="Автомат">автомат</a> знаходиться в стані q <sub>0.</sub>  Потім він по черзі читає символи з вхідного рядка.  Перебуваючи в стані q і читаючи символ а,<a href="Автомат" title="Автомат"> автомат</a> переходить в стан <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1052><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1052 DrawAspect=Content ObjectID=_1335691758></o:OLEObject></xml>  (Q, a).  Якщо автомат знаходиться в стані q <img border=0 width=13 height=13 src=dopb63177.zip v:shapes=_x0000_i1053><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1053 DrawAspect=Content ObjectID=_1335691759></o:OLEObject></xml>  A говорять, що він допускає прочитану частина вхідного рядка.  Якщо q <img border=0 width=13 height=16 src=dopb63178.zip v:shapes=_x0000_i1054><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1054 DrawAspect=Content ObjectID=_1335691760></o:OLEObject></xml>  А, то прочитана частина рядка відкинута. <br />  З кінцевим станом М пов'язана функція <img border=0 width=76 height=24 src=dopb63179.zip v:shapes=_x0000_i1055><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1055 DrawAspect=Content ObjectID=_1335691762></o:OLEObject></xml>  , Звана функцією кінцевого <a href="Стану" title="Стану">стану</a>, що визначається таким чином: <img border=0 width=37 height=21 src=dopb63180.zip v:shapes=_x0000_i1056><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1056 DrawAspect=Content ObjectID=_1335691763></o:OLEObject></xml>  є стан, в який прийде автомат (з початкового стану), прочитавши рядок w.  Автомат допускає рядок w тоді і тільки тоді, коли <img border=0 width=37 height=21 src=dopb63180.zip v:shapes=_x0000_i1057><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1057 DrawAspect=Content ObjectID=_1335691764></o:OLEObject></xml><img border=0 width=13 height=13 src=dopb63177.zip v:shapes=_x0000_i1058><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1058 DrawAspect=Content ObjectID=_1335691765></o:OLEObject></xml>  А <br />  Для кожного зразка Р можна побудувати кінцевий автомат, що шукає цей зразок у тексті.  Першим кроком у побудові автомата, <a href="Відповідь" title="Відповідь">відповідного</a> рядку-зразку Р [1 .. m], є побудова за Р допоміжної суфікс-функциии (як у алгоритмі КМП).  Тепер визначимо кінцевий автомат, <a href="Відповідь" title="Відповідь">відповідно</a> до моделі Р [1 .. m], наступним чином: <br />  · Його безліч станів Q = {0,1 ,..., m}.  Початковий стан q <sub>0</sub> = <sub>0.</sub>  Єдине допускає стан m; <br />  · Функція переходів <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1059><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1059 DrawAspect=Content ObjectID=_1335691766></o:OLEObject></xml>  визначена співвідношенням (q - стан, <img border=0 width=39 height=17 src=dopb63181.zip v:shapes=_x0000_i1060><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1060 DrawAspect=Content ObjectID=_1335691767></o:OLEObject></xml>  - Символ): <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1061><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1061 DrawAspect=Content ObjectID=_1335691768></o:OLEObject></xml>  (Q, a) = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1062><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1062 DrawAspect=Content ObjectID=_1335691769></o:OLEObject></xml>  (P <sub>q</sub> a).  (1) <br />  Пояснимо це співвідношення.  Потрібно сконструювати автомат таким чином, щоб при його дії на рядок Т співвідношення <br /><img border=0 width=15 height=17 src=dopb63183.zip v:shapes=_x0000_i1063><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1063 DrawAspect=Content ObjectID=_1335691770></o:OLEObject></xml>  (Т <sub>i)</sub> = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1064><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1064 DrawAspect=Content ObjectID=_1335691771></o:OLEObject></xml>  (Т <sub>i)</sub> <br />  було інваріантом (тоді рівність <img border=0 width=15 height=17 src=dopb63183.zip v:shapes=_x0000_i1065><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1065 DrawAspect=Content ObjectID=_1335691772></o:OLEObject></xml>  (Т <sub>i)</sub> = m буде рівносильно тому, що Р входить в Т зі зрушенням i - m, і автомат тим самим знайде всі допустимі зрушення).  Однак у цьому випадку обчислення переходу за формулою (1) необхідно для підтримки істинності інваріанту, що випливає з теорем, наведених нижче. [3] <br />  Теорема.  Нехай q = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1066><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1066 DrawAspect=Content ObjectID=_1335691773></o:OLEObject></xml>  (Х), де х - рядок.  Тоді для будь-якого символу а має місце <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1067><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1067 DrawAspect=Content ObjectID=_1335691774></o:OLEObject></xml>  (Ха) = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1068><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1068 DrawAspect=Content ObjectID=_1335691775></o:OLEObject></xml>  (P <sub>q</sub> a). <br />  Теорема.  Нехай <img border=0 width=15 height=17 src=dopb63183.zip v:shapes=_x0000_i1069><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1069 DrawAspect=Content ObjectID=_1335691776></o:OLEObject></xml>  - Функція кінцевого стану автомата для пошуку підрядка Р [1 ..  m].  Якщо Т [1 ..  n] - довільний текст, то <img border=0 width=15 height=17 src=dopb63183.zip v:shapes=_x0000_i1070><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1070 DrawAspect=Content ObjectID=_1335691777></o:OLEObject></xml>  (Т <sub>i)</sub> = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1071><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1071 DrawAspect=Content ObjectID=_1335691778></o:OLEObject></xml>  (Т <sub>i)</sub> для i = 0,1 ,..., n.  [14] <br />  З викладеного випливає, що завдання пошуку підрядка складається з двох частин: <br />  побудова автомата за зразком (визначення функції переходів для заданого зразка); <br />  застосування цього автомата для пошуку входжень зразка в заданий текст. <br /><h3 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  1.5.2.  Приклад побудови кінцевого автомата </h3>  Побудуємо кінцевий автомат, що допускає рядок ababaca.  Оскільки довжина зразка m = 7 символів, то в <a href="Автомат" title="Автомат">автоматі</a> буде m + 1 = 8 станів. <br />  Знайдемо функцію переходів <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1072><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1072 DrawAspect=Content ObjectID=_1335691779></o:OLEObject></xml>  .<a href="Відповідь" title="Відповідь">  Відповідно</a> до визначення (1), <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1073><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1073 DrawAspect=Content ObjectID=_1335691780></o:OLEObject></xml>  (Q, a) = <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1074><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1074 DrawAspect=Content ObjectID=_1335691781></o:OLEObject></xml>  (Р <sub>q</sub> а), де <img border=0 width=16 height=15 src=dopb63182.zip v:shapes=_x0000_i1075><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1075 DrawAspect=Content ObjectID=_1335691782></o:OLEObject></xml>  - Префікс-функція, а - довільний символ з алфавіту <img border=0 width=15 height=16 src=dopb63173.zip v:shapes=_x0000_i1076><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1076 DrawAspect=Content ObjectID=_1335691783></o:OLEObject></xml>  , Q - номер стану.  Таким чином, необхідно для кожного префікса P <sub>q</sub> = P [0 .. q], q = 0 ..  m зразка Р і для всіх символів а вхідного алфавіту <img border=0 width=15 height=16 src=dopb63173.zip v:shapes=_x0000_i1077><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1077 DrawAspect=Content ObjectID=_1335691784></o:OLEObject></xml>  знайти довжину максимального префікса Р, який буде суфіксом рядка Р <sub>q</sub> а.  Довжина цього префікса і буде значенням функції переходів <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1078><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1078 DrawAspect=Content ObjectID=_1335691785></o:OLEObject></xml>  (Q, a).  Якщо а = P [q + 1] (черговий символ тексту збігся з наступним символом зразка), то Р <sub>q</sub> а = Р <sub>q +1</sub> та <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1079><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1079 DrawAspect=Content ObjectID=_1335691786></o:OLEObject></xml>  (Q, a) = q +1. <br /> <a href="Такий" title="Такий"> Такий</a> <a href="Випадок" title="Випадок">випадок</a> відповідає успішним етапам пошуку.  Інакше, <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1080><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1080 DrawAspect=Content ObjectID=_1335691787></o:OLEObject></xml>  (Q, a) <img border=0 width=13 height=16 src=dopb63171.zip v:shapes=_x0000_i1081><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1081 DrawAspect=Content ObjectID=_1335691788></o:OLEObject></xml>  q.  Наприклад, для префікса Р [0 .. 5] = ababa і символу b максимальним суфіксом рядка Р [0 .. 5] b = ababab, який одночасно є префіксом Р, буде abab.  Його довжина дорівнює 4, тому значення функції переходів <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1082><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1082 DrawAspect=Content ObjectID=_1335691789></o:OLEObject></xml>  (5, b) = 4. <br />  Запишемо побудовану таким чином функцію переходів у вигляді таблиці (Табл. 1): <br /><table border=1 cellspacing=0 cellpadding=0 style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;mso-border-insideh:.5pt solid windowtext;  mso-border-insidev:.5pt solid windowtext"><tr style="mso-yfti-irow:0;mso-yfti-firstrow:yes;height:17.0pt;mso-height-rule:   exactly"><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly"></td><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  1 <br /></td><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  2 <br /></td><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  3 <br /></td><td width=71 valign=top style="width:53.2pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  4 <br /></td><td width=71 valign=top style="width:53.2pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  5 <br /></td><td width=71 valign=top style="width:53.2pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  6 <br /></td><td width=71 valign=top style="width:53.2pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:   exactly">  7 <br /></td></tr><tr style=mso-yfti-irow:1;height:17.0pt;mso-height-rule:exactly><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-top:none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:exactly">  a <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  1 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  1 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  3 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  1 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  5 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  1 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  7 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  1 <br /></td></tr><tr style=mso-yfti-irow:2;height:17.0pt;mso-height-rule:exactly><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-top:none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:exactly">  b <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  2 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  4 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  4 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  2 <br /></td></tr><tr style="mso-yfti-irow:3;mso-yfti-lastrow:yes;height:17.0pt;mso-height-rule:   exactly"><td width=71 valign=top style="width:53.15pt;border:solid windowtext 1.0pt;   border-top:none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;mso-height-rule:exactly">  c <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.15pt;border-top:none;border-left:   none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;background:#E6E6E6;padding:0cm 5.4pt 0cm 5.4pt;   height:17.0pt;mso-height-rule:exactly">  6 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td><td width=71 valign=top style="width:53.2pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt;height:17.0pt;   mso-height-rule:exactly">  0 <br /></td></tr></table>  Рядки відповідають вхідним <a href="Символ" title="Символ">символам</a>, стовпці - станам автомата.  Осередки, відповідні успішним етапам пошуку (вхідний символ збігається з наступним символом зразка), виділені сірим кольором. <br />  Побудуємо за таблицею граф переходів <a href="Автомат" title="Автомат">автомата </a>(Мал. 1), що розпізнає зразок ababaca.  Перебуваючи в стані q і прочитавши черговий символ а, автомат переходить в стан <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1083><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1083 DrawAspect=Content ObjectID=_1335691790></o:OLEObject></xml>  (Q, a).  Звернемо увагу, що його кістяк позначений символами зразка (ці переходи виділені жирними стрілками). <br /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=84 height=44 bgcolor=white style="vertical-align:top;background:   white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1038 style="padding:3.6pt 7.2pt 3.6pt 7.2pt">  Рис.  1 <br /></div></td></tr></table></td></tr></table><img border=0 width=414 height=95 src=dopb63184.zip v:shapes=_x0000_i1084><br />  Тут 0 - початковий стан, 7 - єдине допускає стан (затемнена).  Якщо з вершини i у вершину j веде стрілка, позначена буквою а, то це означає, що <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1085><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1085 DrawAspect=Content ObjectID=_1335691791></o:OLEObject></xml>  (I, a) = j.  Відзначимо, що переходи, для яких <img border=0 width=15 height=19 src=dopb63174.zip v:shapes=_x0000_i1086><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1086 DrawAspect=Content ObjectID=_1335691792></o:OLEObject></xml>  (I, a) = 0, на графі переходів для його спрощення не позначені.  Жирні стрілки, що йдуть зліва направо, відповідають успішним етапам пошуку підрядка Р - наступний вхідний символ збігається з черговим символом зразка.  Стрілки, що йдуть справа наліво, відповідають невдач - наступний вхідний символ відрізняється від чергового символу зразка. <br />  Нижче наведено результат застосування автомата до тексту Т = abababacaba.  Під кожним символом Т [г] записано стан автомата після прочитання цього <a href="Символ" title="Символ">символу </a>(іншими словами, значення <img border=0 width=15 height=17 src=dopb63183.zip v:shapes=_x0000_i1087><xml><o:OLEObject Type=Embed ProgID=Equation.3 ShapeID=_x0000_i1087 DrawAspect=Content ObjectID=_1335691793></o:OLEObject></xml>  (Т <sub>i))</sub> (Табл. 2). <br /><img border=0 width=463 height=70 src=dopb63185.zip v:shapes=_x0000_i1088><br />  Знайдено одне входження зразка (починаючи з позиції 3).  Знайдений зразок у тексті позначено сірим кольором.  Чорним кольором позначено допускає стан автомата (стан з номером 7). <br /><br clear=all style=mso-special-character:line-break;page-break-before:always><h1 style=page-break-after:avoid>  Частина 2.  Експериментальний аналіз алгоритмів. </h1><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>2.1.</i>  <i>Суть експерименту.</i> <i> </i></h2>  Ми розглянули кілька алгоритмів, провели оцінку їх часової та ємнісної складності.  Однак, як уже говорилося, дані критерії оцінки не дозволяють нам напевно сказати, який з алгоритмів буде швидше працювати.  Тому, для додаткової оцінки проведемо їх експериментальний аналіз, тобто  виміряємо час, за який алгоритм виконує конкретно поставлене завдання. <br />  Є кілька текстових файлів, що містять 10000 записів види: <br>  <i>рядок</i> <i><br></i>  <i>підрядок (наявна в цьому рядку)</i> <i><br></i>  <i>місце входження</i> <i><br></i>  <i>довжина підрядка</i> <br />  з різними максимальними довжинами рядків і підрядків. <br />  Алфавітом є 66 російських великих і малих літер. <br />  Нехай це будуть рядка довжиною не більше 10, 100, 250 символів. <br />  Проведемо пошук підрядків в рядках для кожного з алгоритмів і виміряємо час роботи програми.  При цьому будемо враховувати наступне: <br />  · Строки попередньо завантажуємо в оперативну пам'ять (у вигляді масиву), причому час зчитування в <a href="Масив" title="Масив">масив</a> не враховується.  Передобробка (створення таблиць переходу) входить в загальний час. <br />  · Кожен алгоритм запускається 5 разів, час вибирається найменше. <br />  <u>Стенд для експерименту.</u> <br /> <a href="Процес" title="Процес"> Процесор</a> <a href="Intel" title="Intel">Intel</a> <a href="Pentium_IV" title="Pentium IV">Pentium IV</a> 2,66 Ггц <br />  1024 Мб ОЗУ <br />  Компілятор Borland Delphi Enterprise, version 6.0 (Build 6.163) <br />  Фрагмент коду програми, що тестується наведемо в лістингу 7. <br /><div>  ref SHAPE \ * MERGEFORMAT <o:lock v:ext=edit rotation=t position=t /><w:anchorlock /><table cellpadding=0 cellspacing=0><tr><td width=486 height=225 bgcolor=white style="border:.75pt solid black;   vertical-align:top;background:white"><table cellpadding=0 cellspacing=0 width=100%><tr><td><div v:shape=_x0000_s1039 style="padding:4.35pt 7.95pt 4.35pt 7.95pt"><br />  LoadFromFile ('C: \ String_250.txt'); <br />  {Відбувається завантаження в масив} <br />  Tick: = GetTickCount; <br />  {Запам'ятовуємо текцщее значення змінної Tick} <br />  Poisk; <br />  {Процедура в якій відбувається пошук 10000 разів} <br />  Tick: = GetTickCount-Tick; <br />  {Отримуємо різницю - час в мілісекундах} <br />  WriteLn ('Za vremja', Tick, 'ms'); <br /></div></td></tr></table></td></tr></table><o:lock v:ext=edit rotation=t position=t /><img border=0 width=480 height=219 src=dopb63186.zip v:shapes=_x0000_i1089><br />  Зрозуміло, що <a href="Такий" title="Такий">такий</a> вимір часу дасть нам дуже розпливчасті результати, оскільки безпосередньо залежить від характеристик і завантаження процесора.  Тому під час проведення експерименту, відключалися всі сторонні та фонові програми, які не впливають на роботу програми.  При запуску однієї і тієї ж задачі ми можемо отримати різний час, тому відбувається кілька запусків, з яких вибирається найкращий результат. <br /><h2 style="margin-top:12.0pt;mso-pagination:widow-orphan;page-break-after:avoid; mso-layout-grid-align:auto;text-autospace:ideograph-numeric ideograph-other">  <i>2.2.</i>  <i>Результати та аналіз експерименту.</i> <i> </i></h2>  Експеримент проводився для чотирьох алгоритмів - представників класів алгоритмів.  Так як всі алгоритми ставилися в однакові умови, то можна провести їх <a href="Порівняльний_аналіз" title="Порівняльний аналіз">порівняльний аналіз</a>.  Зауважимо, що даний аналіз застосуємо тільки для даних параметрів пошуку, і за інших умов може відрізнятися. <br />  <u>Результати експерименту</u> занесемо до таблиці (Табл. 3). <br /><div align=center><table border=1 cellspacing=0 cellpadding=0 style="border-collapse:collapse;border:none;mso-border-alt:solid windowtext .5pt;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;mso-border-insideh:.5pt solid windowtext;  mso-border-insidev:.5pt solid windowtext"><tr style=mso-yfti-irow:0;mso-yfti-firstrow:yes;page-break-inside:avoid><td width=173 rowspan=2 style="width:129.55pt;border:solid windowtext 1.0pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм <br /></td><td width=349 colspan=3 style="width:261.75pt;border:solid windowtext 1.0pt;   border-left:none;mso-border-left-alt:solid windowtext .5pt;mso-border-alt:   solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  Час виконання <br /></td></tr><tr style=mso-yfti-irow:1;page-break-inside:avoid><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  Довжина ≤ 10 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  Довжина ≤ 100 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  Довжина ≤ 250 <br /></td></tr><tr style=mso-yfti-irow:2><td width=173 style="width:129.55pt;border:solid windowtext 1.0pt;border-top:   none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt">  Послід.  пошук <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  15 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  93 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  234 <br /></td></tr><tr style=mso-yfti-irow:3><td width=173 style="width:129.55pt;border:solid windowtext 1.0pt;border-top:   none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм Рабіна <br />  (Хеш - сума кодів) <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  15 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  63 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  93 <br /></td></tr><tr style=mso-yfti-irow:4><td width=173 style="width:129.55pt;border:solid windowtext 1.0pt;border-top:   none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt">  КМП <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  5 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  30 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  50 <br /></td></tr><tr style=mso-yfti-irow:5;mso-yfti-lastrow:yes><td width=173 style="width:129.55pt;border:solid windowtext 1.0pt;border-top:   none;mso-border-top-alt:solid windowtext .5pt;mso-border-alt:solid windowtext .5pt;   padding:0cm 5.4pt 0cm 5.4pt">  БМ <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  31 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  31 <br /></td><td width=116 style="width:87.25pt;border-top:none;border-left:none;   border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;   mso-border-top-alt:solid windowtext .5pt;mso-border-left-alt:solid windowtext .5pt;   mso-border-alt:solid windowtext .5pt;padding:0cm 5.4pt 0cm 5.4pt">  32 <br /></td></tr></table></div>  Як і передбачалося, алгоритм Бойєра - Мура впорався з експериментальною завданням швидше за інших.  Слід, однак, зауважити, що його ефективність зростає лише зі збільшенням довжини рядка і, відповідно, довжини зразка.  Так при довжині рядка меншою або рівною 10 символів, він показав себе гірше, ніж послідовний пошук. <a href="Аналогія_2" title="Аналогія 2"> Аналогічні</a> результати показує і алгоритм КМП, як для коротких, так і для довгих слів.  Його можна використовувати як універсальний, коли невідомі довжини рядка й зразка. <br />  Алгоритм Рабіна, при його схожості з послідовним працює швидше, а його простота і <a href="Малі" title="Малі">малі</a> трудовитрати на реалізацію, роблять його привабливим для використання у неспеціальних програмах. <br />  Найгірший результат показав алгоритм послідовного пошуку.  Як передбачалося лише при невеликому збільшенні довжини рядка, він працює в рази повільніше інших алгоритмів. <br />  У даний експеримент не включений алгоритм пошуку за допомогою кінцевого автомата, тому що  ми використовуємо алфавіт, що складається з 66 букв російського алфавіту, і побудований автомат був би занадто громіздкий.  Ефективність цього алгоритму зростає при малій кількості букв в алфавіті. <br /><br clear=all style=mso-special-character:line-break;page-break-before:always><h1 style=page-break-after:avoid>  Висновок. </h1>  Ми розглянули різні алгоритми пошуку підрядка в рядку, зробили їх аналіз.  Результати можна представити в таблиці (Табл. 4). <br /><table border=1 cellspacing=0 cellpadding=0 style="border-collapse:collapse;border:none;mso-border-alt:solid black 1.5pt;  mso-padding-alt:0cm 5.4pt 0cm 5.4pt;mso-border-insideh:.75pt solid black;  mso-border-insidev:.75pt solid black"><tr style=mso-yfti-irow:0;mso-yfti-firstrow:yes><td width=83 style="width:62.05pt;border-top:1.5pt;border-left:1.5pt;   border-bottom:1.0pt;border-right:1.0pt;border-color:black;border-style:solid;   mso-border-top-alt:1.5pt;mso-border-left-alt:1.5pt;mso-border-bottom-alt:   .75pt;mso-border-right-alt:.75pt;mso-border-color-alt:black;mso-border-style-alt:   solid;padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм <br /></td><td width=85 style="width:63.9pt;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-top-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Час на перед.  обробку <br /></td><td width=96 style="width:71.7pt;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-top-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Середній час пошуку <br /></td><td width=84 style="width:63.25pt;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-top-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Гірший час пошуку <br /></td><td width=70 style="width:52.3pt;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-top-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt"> <a href="Витрати" title="Витрати"> Витрати</a> пам'яті <br /></td><td width=107 style="width:80.3pt;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-top-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Час <a href="Роботи" title="Роботи">роботи </a>(мс) при довжині рядка ≤ 250 <br /></td><td width=113 style="width:3.0cm;border-top:solid black 1.5pt;border-left:   none;border-bottom:solid black 1.0pt;border-right:solid black 1.5pt;   mso-border-left-alt:solid black .75pt;mso-border-top-alt:1.5pt;mso-border-left-alt:   .75pt;mso-border-bottom-alt:.75pt;mso-border-right-alt:1.5pt;mso-border-color-alt:   black;mso-border-style-alt:solid;padding:0cm 5.4pt 0cm 5.4pt">  Примітки <br /></td></tr><tr style=mso-yfti-irow:1><td width=638 colspan=7 style="width:478.55pt;border-top:none;border-left:   solid black 1.5pt;border-bottom:solid black 1.0pt;border-right:solid black 1.5pt;   mso-border-top-alt:solid black .75pt;mso-border-top-alt:.75pt;mso-border-left-alt:   1.5pt;mso-border-bottom-alt:.75pt;mso-border-right-alt:1.5pt;mso-border-color-alt:   black;mso-border-style-alt:solid;padding:0cm 5.4pt 0cm 5.4pt">  Алгоритми засновані на алгоритмі послідовного пошуку <br /></td></tr><tr style=mso-yfti-irow:2;page-break-inside:avoid><td width=83 style="width:62.05pt;border-top:none;border-left:solid black 1.5pt;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-alt:solid black .75pt;mso-border-left-alt:solid black 1.5pt;   padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм прямого пошуку <br /></td><td width=85 style="width:63.9pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  Ні <br /></td><td width=96 style="width:71.7pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O ((m-n +1) * n +1) / 2 <br /></td><td width=84 style="width:63.25pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O ((m-n +1) * n +1) <br /></td><td width=70 style="width:52.3pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  Ні <br /></td><td width=107 style="width:80.3pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  234 <br /></td><td width=113 rowspan=2 style="width:3.0cm;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.5pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-right-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Mалие трудовитрати на програму, мала ефективність. <br /></td></tr><tr style=mso-yfti-irow:3;page-break-inside:avoid><td width=83 style="width:62.05pt;border-top:none;border-left:solid black 1.5pt;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-alt:solid black .75pt;mso-border-left-alt:solid black 1.5pt;   padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм Рабіна <br /></td><td width=85 style="width:63.9pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  Ні <br /></td><td width=96 style="width:71.7pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O (m + n) <br /></td><td width=84 style="width:63.25pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O ((m-n +1) * n +1) <br /></td><td width=70 style="width:52.3pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  Ні <br /></td><td width=107 style="width:80.3pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  93 <br /></td></tr><tr style=mso-yfti-irow:4><td width=638 colspan=7 style="width:478.55pt;border-top:none;border-left:   solid black 1.5pt;border-bottom:solid black 1.0pt;border-right:solid black 1.5pt;   mso-border-top-alt:solid black .75pt;mso-border-top-alt:.75pt;mso-border-left-alt:   1.5pt;mso-border-bottom-alt:.75pt;mso-border-right-alt:1.5pt;mso-border-color-alt:   black;mso-border-style-alt:solid;padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм Кнута-Морріса-Пратта <br /></td></tr><tr style=mso-yfti-irow:5><td width=83 style="width:62.05pt;border-top:none;border-left:solid black 1.5pt;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-alt:solid black .75pt;mso-border-left-alt:solid black 1.5pt;   padding:0cm 5.4pt 0cm 5.4pt">  КМП <br /></td><td width=85 style="width:63.9pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O (m) <br /></td><td width=96 style="width:71.7pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O (n + m) <br /></td><td width=84 style="width:63.25pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O (n + m) <br /></td><td width=70 style="width:52.3pt;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  O (m) <br /></td><td width=107 style="width:80.3pt;border-top:none;border-left:none;   border-bottom:solid black 1.0pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   padding:0cm 5.4pt 0cm 5.4pt">  31 <br /></td><td width=113 style="width:3.0cm;border-top:none;border-left:none;border-bottom:   solid black 1.0pt;border-right:solid black 1.5pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-right-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt">  Універсальний алгоритм, якщо невідома довжина зразка <br /></td></tr><tr style=mso-yfti-irow:6><td width=638 colspan=7 style="width:478.55pt;border-top:none;border-left:   solid black 1.5pt;border-bottom:solid black 1.0pt;border-right:solid black 1.5pt;   mso-border-top-alt:solid black .75pt;mso-border-top-alt:.75pt;mso-border-left-alt:   1.5pt;mso-border-bottom-alt:.75pt;mso-border-right-alt:1.5pt;mso-border-color-alt:   black;mso-border-style-alt:solid;padding:0cm 5.4pt 0cm 5.4pt">  Алгоритм Бойєра-Мура <br /></td></tr><tr style=mso-yfti-irow:7;mso-yfti-lastrow:yes;height:56.4pt><td width=83 style="width:62.05pt;border-top:none;border-left:solid black 1.5pt;   border-bottom:solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-top-alt:.75pt;mso-border-left-alt:1.5pt;   mso-border-bottom-alt:1.5pt;mso-border-right-alt:.75pt;mso-border-color-alt:   black;mso-border-style-alt:solid;padding:0cm 5.4pt 0cm 5.4pt;height:56.4pt">  БМ <br /></td><td width=85 style="width:63.9pt;border-top:none;border-left:none;border-bottom:   solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-bottom-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt;   height:56.4pt">  O (m + s) <br /></td><td width=96 style="width:71.7pt;border-top:none;border-left:none;border-bottom:   solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-bottom-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt;   height:56.4pt">  O (n + m) <br /></td><td width=84 style="width:63.25pt;border-top:none;border-left:none;   border-bottom:solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-bottom-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt;   height:56.4pt">  O (n * m) <br /></td><td width=70 style="width:52.3pt;border-top:none;border-left:none;border-bottom:   solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-bottom-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt;   height:56.4pt">  O (m + s) <br /></td><td width=107 style="width:80.3pt;border-top:none;border-left:none;   border-bottom:solid black 1.5pt;border-right:solid black 1.0pt;mso-border-top-alt:   solid black .75pt;mso-border-left-alt:solid black .75pt;mso-border-alt:solid black .75pt;   mso-border-bottom-alt:solid black 1.5pt;padding:0cm 5.4pt 0cm 5.4pt;   height:56.4pt">  32 <br /></td><td width=113 style="width:3.0cm;border-top:none;border-left:none;border-bottom:   solid black 1.5pt;border-right:solid black 1.5pt;mso-border-top-alt:solid black .75pt;   mso-border-left-alt:solid black .75pt;padding:0cm 5.4pt 0cm 5.4pt;height:   56.4pt">  Алгоритми цієї групи найбільш ефективні в звичайних ситуаціях.  Швидкодія підвищується при збільшенні зразка або алфавіту. <br /></td></tr></table>  Виходячи з отриманих результатів, видно, що алгоритм Бойєра - Мура є провідним за всіма параметрами, здавалося б, знайдено найбільший ефективний алгоритм.  Але, як показує експеримент, алгоритм Кнута - Моріса - Пратта, перевершує алгоритм БМ на невеликих довжинах зразка.  Тому я не можу зробити висновок, що якийсь з алгоритмів є найоптимальнішим.  Кожен алгоритм дозволяє ефективно діяти лише для свого класу завдань, про це ще говорять різні вузькоспрямовані поліпшення.  Алгоритм пошуку підрядка в рядку слід вибирати тільки після точної постановки завдання, які повинна виконувати програма. <br />  Зробивши такий висновок, ми виконали мета даної роботи, тому що  для різних класів задач був виділений свій ефективний алгоритм. <br /> <b><br clear=all style=page-break-before:always></b> <h1 align=center style=text-align:center;page-break-after:avoid>  <a href="Бібліографія" title="Бібліографія">Бібліографічний</a> список. </h1>  1).  Kurtz, St.  Fundamental Algorithms For A Declarative Pattern Matching System [Текст].  - Bielefeld:.  Universität Bielefeld, 1995.  - 238 с. <br />  2).  Lecro, T.  Exact string matching algorithms [Електронний ресурс].  Режим доступу http://algolist.manual.ru/ <br />  3).  Ахметов І. Пошук підрядків за допомогою кінцевих <a href="Автомат" title="Автомат">автоматів</a> [Текст]: <a href="Курсова" title="Курсова">Курсова</a> робота .- З-П державний університет <a href="Інформація" title="Інформація">інформаційних</a> технологій, механіки й оптики. <br />  4).  Ахо, Альфред Структура даних і алгоритми [Текст].  - М.: Видавничий дім «Вільямс», 2000.  - 384 с. <br />  5).  Бєлоусов А. <a href="Дискретна_математика" title="Дискретна математика">Дискретна математика</a> [Текст].  - М.: Видавництво МГТУ ім.  Н.Е.  Баумана, 2001.  - 744 с. <br />  6).  Брайан, К. Практика <a href="Програмування" title="Програмування">програмування</a> [Текст] .- СПб:.  Невський діалект, 2001.  - 381 с. <br />  7).  Вірт, М. Алгоритми і <a href="Структури_даних" title="Структури даних">структури даних</a> [Текст] .- М:.  Світ, 1989.  - 360 с. <br />  8).  Гілл, Арт.  Введення в теорію кінцевих автоматів [Текст].  - М., 1966.  - 272 с. <br />  9).  Глушаков С. Програмування Web - сторінок [Текст].  - М.: ТОВ «Видавництво АСТ», 2003.  - 387 с. <br />  10).  Кнут, Д. <a href="Мистецтво" title="Мистецтво">Мистецтво</a> програмування на ЕОМ [Текст]: Том 3.  - М:.  Світ, 1978.  - 356 с. <br />  11).  Матрос Д. Елементи абстрактної та комп'ютерної алгебри: Учеб.  посібник для студ.  педвузів [Текст].  - М.: Видавничий центр «Академія», 2004.  - 240 с. <br />  12).  Успенський В. <a href="Теорія_алгоритмів" title="Теорія алгоритмів">Теорія алгоритмів</a>: основні відкриття та використання [Текст].  - М.: <a href="Наука" title="Наука">Наука</a>, 1987.  - 288 с. <br />  13).  Шень, А. Програмування: теореми і задачі [Текст].  - М.: Московський центр безперервної <a href="Математика" title="Математика">математичної</a> освіти, 1995. <br />  14).  Кормен, Т. Алгоритми: побудова та аналіз [Текст] / Т. Кормен, Ч. Лейзерсон, Р. Ривест - М. МЦНМО, 2002.  М. МЦНМО, 2002. <br /></div>
	</div>

Будь ласка, не зберігайте тестовий текст.
Ваш ip: 3.145.143.239 буде збережений.

категорії
за типом
за алфавітом
завантажені