Структурні методи розпізнавання складноорганізованих історичних табличних форм

В.М. Кляцкін, Є.В. Щепін, К.М. Зінгерман, В.В. Лазарєв

Анотація

Дана робота присвячена проблематиці структурного розпізнавання складних табличних форм, що зустрічаються в історичних джерелах. Запропоновано оригінальну модель "пов'язаних ієрархій", в рамках якої може бути розпізнана і описано велике сімейство табличних форм і бланків. Застосування моделі "пов'язаних ієрархій" в табличному структуризатор OCR-системи Cript дозволило успішно розпізнавати складноструктурованих табличні форми з різних історичних джерел [1].

Введення

Сфера застосування систем оптичного розпізнавання безперервно розширюється не тільки вшир (по різних областях людської діяльності), але і вглиб (за рівнем складності документів, що вводяться). Рівень складності залежить від багатьох факторів і може бути охарактеризований з точки зору змісту вводяться аркушів (структура представленої на аркуші інформації, шрифти та інші друкарські параметри), якості друку та умов сканування. Спектр доступних для оптичного розпізнавання структур друкованих аркушів досить широкий, і тим не менше їм не вичерпуються потреби практичного використання OCR для розпізнавання різних історичних джерел. У даній роботі проведено огляд сучасних методів структурного розпізнавання друкованої продукції та зроблено спробу розширити діапазон автоматично оброблюваних OCR-системами структур документів у бік сложнооорганізованних табличних форм, поширених в історичних дослідженнях. Що підлягають обробці таблиці можуть мати багаторівневої горизонтальної і вертикальної ієрархіями, рівні яких можуть мати нерегулярну (не завжди лінійно впорядковану) структуру. Крім того, структура елементів таблиці може бути досить складною, несвідомих до традиційного опису текстів "параграф-рядок-слово-символ". У комірках можуть зустрічатися об'єкти різної структури, наприклад математичні вирази (індекси, дробу, спецсимволи), три крапки, нелінійно-зв'язані рядка. Для аналізу подібних структур авторами запропонована досить універсальна модель "пов'язаних ієрархій", що дозволяє розпізнавати, описувати і представляти в текстовій формі широкий клас табличних форм і бланків. Розроблена методологія структурного розпізнавання таблиць заснована на моделі "пов'язаних ієрархій". Програмною реалізацією цієї методології є табличний структуризатор Cript, що входить в однойменну OCR-систему.

Застосування табличній версії OCR-системи Cript до аналізу табличних форм з різних історичних джерел засвідчило конструктивність запропонованої моделі та її алгоритмічне наповнення. У статті наведені ілюстрації основних етапів структурного розпізнавання таблиць історичного характеру.

Огляд методів аналізу складних ієрархічних форм

В останні роки системи оптичного розпізнавання символів (OCR-системи) застосовуються до розпізнавання джерел різної природи: рукописних текстів, технічних публікацій [2], бізнес-карт [3], записів шахових партій [4] і музичних творів [5], історичних джерел [6]. У багатьох випадках аркуші документів, призначених для автоматичного введення, певним чином структуровані. Наприклад, сторінка книги або наукового журналу може бути розбита на колонки, може містити заголовки, примітки, креслення і малюнки, сторінка газет може бути розбита на блоки, містити контурні рамки та інші розділяють графічні елементи.

Одним з найбільш типових прикладів структурованого способу подання інформації є таблиці. Для правильної інтерпретації структурованих документів необхідно спочатку виділити елементи структури (колонки і блоки в технічних публікаціях, графи, рядка і осередка в таблицях) і тільки після цього розпізнавати окремі символи цих елементів [7].

Проблеми виділення структурних блоків на зображенні аркуша документа розглянуті в ряді робіт. Так, створено систему виділення блоків тексту, заснована на синтаксичному аналізі "знизу-вверх" і використовує деяку інформацію про структуру документа, попередньо задану користувачем [8]. Ця система дозволяє виділяти на аркуші ізотетічние прямокутні блоки. При поділі тексту на блоки автори цих робіт використовують той факт, що текстові блоки зазвичай відокремлені один від одного білими проміжками, ширина яких більше межсловного інтервалу та інтервалу між рядками. Цей же факт використовується для виділення текстових блоків в інших роботах [9], але тут можуть мати більш складну форму. Особливість запропонованого в цих роботах підходу в тому, що він не потребує будь-яких попередніх знань про структуру листа і здійснює розмітку аркуша, використовуючи тільки інформацію про розміри білих проміжків між габаритними рамками компонент. Метод заснований на загальних для більшості форматів текстових документів припущенні про те, що текстові блоки відокремлюються один від одного білими (тобто незаповненими текстом) проміжками. Можна ввести поняття максимальних білих прямокутників (під якими розуміються прямокутники фону, всі сторони яких стосуються кордонів рамок компонент тексту) і розглядається алгоритм знаходження всіх максимальних білих прямокутників на растрі [10].

Методи, використовувані при виділенні текстових блоків, можуть бути використані і для аналізу структури таблиць. Відзначимо, що в багатьох випадках (хоча і не завжди) колонки і рядки таблиць можуть бути розділені лініями розграфки. Використовуючи інформацію про розташування цих ліній, можна більш надійно розділити елементи таблиці, ніж використовуючи тільки інформацію про міжколонних і міжрядкових проміжках в таблиці. Однак для цього система аналізу структури листа повинна мати у своєму розпорядженні засобами виявлення ліній. Необхідні також кошти об'єднання відрізків ліній в прямокутні рамки, що обмежують елементи таблиць. Один з алгоритмів швидкого виявлення горизонталей і вертикалей на зображенні і виділення обмежених ними елементів таблиці представляеьтся вельми ефективним [11]. Наведемо короткий опис алгоритму пошуку суцільних горизонтальних ліній. Растрове бінарне зображення проглядається в напрямку зверху вниз і на ньому фіксуються послідовності чорних пікселів, довжина яких перевищує заздалегідь заданий поріг. Потім пов'язані (межують один з одним в сенсі 8-зв'язності) послідовності об'єднуються, утворюючи елементи ліній і для кожного такого елемента обчислюється його середня товщина. Занадто товсті елементи відкидаються. В якості кандидатів у елементи пунктирних ліній розглядаються всі компоненти зв'язності, які не дуже великі і є достатньо "щільними" ("щільність" компоненти визначається як відношення числа чорних пікселів до площі її рамки). Потім для об'єднання залишилися компонент в горизонтальні пунктирні лінії виконується наступна процедура: для кожної пари елементів лінії перевіряється виконання двох умов: 1) горизонтальний проміжок між двома елементами ліній менше заздалегідь заданого порогу; 2) ці елементи ліній перекриваються по вертикалі. Якщо деяка пара елементів лінії задовольняє обом цим умовам, то ці елементи вважаються близькими. В результаті виконання цієї процедури виділяються кластери лінійних фрагментів.

Особливість іншого алгоритму виділення прямокутних блоків, обмежених горизонтальними і вертикальними лініями полягає в тому, що спершу за допомогою скелетизації зображення знаходяться точки перетину ліній, а потім перевіряється наявність самих ліній [12]. Засобами виділення текстових блоків і обробки таблиць своєму розпорядженні також система ExpertVision [1].

* * *

Істориками-дослідниками за останні роки нагромаджено певний досвід з автоматизованого вводу документів складної сруктурури в комп'ютер з використанням різних OCR-пакетів. Так, в ряді робіт наведено приклади розпізнавання відсканованих історичних документів, що являють собою таблиці різної структури. У статті Г. Торвальдсена розглянуті чотири приклади розпізнавання документів, що мають табличну структуру за допомогою OCR-системи Omnipage Professional [14]. На рис. 1a цієї статті наведена копія листа архівної інформації, що містить записи про народження (відзначимо, що в таблиці відсутній разграфка), а на рис. 1b - результат розпізнавання. У роботі зазначено, що при обробці документів вказаного типу результат може бути інтерпретований у відсутність інформації приналежності даних до певної колонці таблиці, тому автором не робилися будь-які заходи для збереження цієї інформації при розпізнаванні. У результаті у вихідному документі таблична структура даних порушена. На рис. 2a цієї статті наведено зображення списку емігрантів. Розділові лінії між колонками і рядками в цьому вихідному документі також відсутні. Автор відзначає, що в цьому прикладі формат документа більш важливий для його розуміння, оскільки в одному з стовпців таблиці міститься інформація про пункт призначення і вартості проїзду, розташована у двох суміжних рядках і водночас ставиться не до окремих емігрантам, а до сімей. Відзначається, що система Omnipage в цілому здатна правильно розподілити інформацію по колонках, вставляючи у потрібні місця рядка знаки табуляції, які можуть бути оброблені текстовим процесором. Як видно з рис. 2b, у вихідному документі таблична структура вхідного документа збережена.

На рис. 3a статті наведено зображення іншого списку емігрантів, а на рис. 3b - результати розпізнавання. На початковому зображенні колонки розділені вертикальними лініями, що, на думку автора, створює додаткові проблеми для OCR, а саме, сприяє переплутування символів між колонками. Однак автор вважає, що в даному випадку ця проблема не є основною перешкодою до використання системи Omnipage. На його думку, більш серйозною проблемою є в даному випадку неправильне розпізнавання окремих символів. На рис. 4а цієї статті наведено зображення сторінки списку оподаткування фермерських господарств, а на рис. 4b - результати обробки цієї сторінки OCR-системою Omnipage. Можна бачити, що таблиця в даному випадку має складну ієрархічну структуру як по вертикалі, так і по горизонталі, причому колонки розділені вертикальними лініями різної товщини і типу (одинарними і подвійними). Відзначено, що в цьому випадку використання системи Omnipage не дозволило забезпечити відповідність структури вихідного документа структурі вихідної таблиці. Інформація часто потрапляє в невідповідну колонку, ліва колонка опущена. У деяких випадках (але не завжди) вертикальні лінії переносяться у вихідний текстовий файл. У результаті, на думку автора, для даного документа ефективніше вводити дані вручну, ніж використовувати стандартну OCR-систему. Також, на його думку, можна для автоматизованого читання цих документів використати кращу OCR-систему. У роботі Г. Торвальдсена [15] описана подальша обробка документа, який був приведений ним раніше [16] в якості прикладу. Зазначено, що перетворення текстового файлу, сформованого OCR-системою, у файл, придатний для вводу в реляційну базу даних, здійснювалося програмою, розробленою для цієї мети автором. Відзначено помилка неправильної класифікації даних по полях бази.

У роботі А. Маквейг розглянуті питання, пов'язані з автоматизованим читанням таблиць, що містять статистичну інформацію про сімейний стан людей у різних районах Ірландії в XIX-XX ст [17]. Обробка зображень виконувалася OCR-системою ProLector. Отриманий в результаті роботи OCR текстовий файл піддавався додаткової програмної обробці з метою виявлення помилок (така обробка виявилася можливою, оскільки таблиці містили контрольні суми), потім ці помилки виправлялися вручну і здійснювався введення виправленої інформації в базу даних. Вихідні таблиці мають складну ієрархічну структуру, стовпці цих таблиць мають різну ширину і розділені вертикальними лініями. Рядки, що містять контрольні суми, виділені горизонтальними лініями. Автор відзначає, що розділові лінії мали неоднакову товщину, що призводило до додаткових ускладнень при їх видаленні засобами системи ProLector: після видалення ліній залишалися перешкоди. Автор вказує також на проблеми, пов'язані зі збереженням структури таблиці в текстовому файлі, сформованому OCR-системою.

У роботі М. Олсена розглянуто застосування OCR до обробки списку оподаткування почала XX століття в одному з міст провінції Нью-Брунсвік (Канада) [18]. На рис. 2 цієї статті наведено зображення сторінки вихідного документа, а в табл. 3 - результати обробки зображення системою Kurzweil (після додаткової коригування). Як видно з рис. 2, вихідна таблиця має просту структуру, колонки її розділені вертикальними лініями, які мають численні розриви. Автор відзначає, що OCR-система Kurzweil відчуває деякі труднощі при обробці вертикальних ліній, внаслідок чого виникають помилки, пов'язані з неправильним розміщенням даних у колонках.

Автори всіх вищезазначених робіт із застосування OCR при виконанні історичних проектів відзначають, що використання OCR-систем для автоматизованого введення в ЕОМ документів, що містять таблиці, дозволило значно заощадити час в порівнянні з ручним введенням даних в ЕОМ (перенабівкой). Разом з тим, значні зусилля потрібні для пошуку і виправлення помилок. Однією з причин появи помилок стало відсутність досить потужних засобів опису та розпізнавання структури таблиць у використаних OCR-системах.

Моделі опису структури текстових і табличних документів

Модель опису структури текстових документів - дерево регулярного ортогонального чергування розбиття.

Традиційною для текстових документів є наступна деревоподібна структура листа: лист розбитий на текстові блоки, звані колонками, колонки розбиті на параграфи, параграфи складаються зі слів, слова - з символів, символи - з однієї або кількох компонент зв'язності.

Використовувана в системі CRIPT структура опису листа являє собою узагальнення традиційної деревоподібної схеми. Суттєвими є наступні особливості реального графа опису формату листа:

Структурні методи розпізнавання складноорганізованих історичних табличних форм

Рис. 2. Дерево колонок, відповідне структурі листа, схематично зображеного на рис. 1a.

Для кожного нетермінального об'єкта (тобто об'єкта, що має "дочок"), зберігається інформація про відносне взаємне розташування його дочок на аркуші, що дозволяє в разі необхідності зберегти у вихідному документі те ж взаємне розташування структурних елементів тексту в межах ієрархічного блоку більш високого рівня, що і в початковому документі. Передбачено, зокрема, наступні варіанти взаємного розташування об'єктів: упорядкування по горизонталі, впорядкування по вертикалі, матричний порядок, індексний порядок (одна з дочок є індексом інший), неупорядковане розташування.

Структурні методи розпізнавання складноорганізованих історичних табличних форм

Рис.1 Послідовні кроки розщеплення листа на колонки за методом "зверху вниз"

Колонки утворюють ієрархічну структуру, тобто кожна колонка може бути розбита на подколонкі, причому на сусідніх рівнях орієнтація поділяють колонки ліній змінюється на ортогональну (так, наприклад, якщо на деякому рівні колонки можуть бути розділені горизонталями, то на наступному рівні вони поділяються вертикалями). Саме тому така модель опису структури документів була названа деревом регулярного ортогонального чергування розбиття. На рис. 1 наведена схема, яка пояснює дану модель. На рис. 1, a схематично показано розташування колонок на аркуші, на рис. 1, bd - послідовні кроки розщеплення, на рис. 2 - побудоване "дерево регулярного ортогонального чергування розбиття"

Структурні методи розпізнавання складноорганізованих історичних табличних форм

Рис. 3. Приклади таблиць ієрархічної структури: a) Таблиця з горизонтальною ієрархією; b) Таблиця з вертикальною ієрархією; c) Таблиця з горизонтальною і вертикальною ієрархією; d) Таблиця з двома рівнями горизонтальної ієрархії.

Рядки можуть бути розбиті на підрядка, що розрізняються якимись властивостями (наприклад, шрифтом).

Об'єкти ієрархічної структури можуть мати дочок як на наступному один по одному ієрархічному рівні (наприклад, дочками параграфа можуть бути рядки), так і на більш низькому ієрархічному рівні (наприклад, дочками колонки можуть бути символи).

Модель опису структури табличних форм - узагальнена модель пов'язаних ортогональних ієрархій;

Розглянемо особливості табличних структур, що визначають необхідність використання спеціальної моделі для їх опису:

Правильне розуміння таблиці читачем неможливо без обліку інформації про взаємне розташування рядків, колонок та осередків таблиці. Тому при автоматизованому розпізнаванні табличних форм необхідно у вихідному документі зберегти те ж взаємне розташування цих структурних табличних елементів, що і у вихідній таблиці.

Рядки і колонки таблиць можуть мати ієрархічну структуру (рис. 3), причому ієрархія може бути багаторівневою (рис. 3, d).

Колонки та горизонтальні блоки різних ієрархічних рівнів в таблицях можуть мати заголовки. Орієнтація тексту у заголовках може бути як горизонтальною, так і вертикальною.

Колонки та рядки в таблицях можуть бути розділені лініями. Товщина лінії, її тип (наприклад, одинарна або подвійна, суцільна або пунктирна), а також сам факт наявності або відсутності розділової лінії між двома колонками або рядками таблиці можуть бути пов'язані певним чином із структурою і семантикою таблиці і, отже, при автоматизованому розпізнаванні таблиць повинні бути відображені у разі необхідності у вихідному документі.

З урахуванням перерахованих особливостей ясно, що ні дерево регулярного ортогонального чергування, ні матрична структура в більшості випадків не підходять для моделювання структури табличних форм. Хоча дерево регулярного ортогонального чергування і зберігає деяку інформацію про взаємне розташування елементів таблиці, цієї інформації недостатньо, щоб відтворити вихідну структуру таблиці у вихідному документі. Приклад наведено на рис. 4. Хоча структура таблиць на рис. 4, a) і b), різна, дерева регулярного ортогонального чергування, що описують структуру цих таблиць, збігаються (див. рис. 4c). Непридатна в загальному випадку до таблиць і матрична структура, так як вона не дозволяє описувати таблиці з ієрархічною організацією.

Щоб з'ясувати, яка модель даних може бути використана для представлення таблиць, розглянемо спочатку загальноприйняту в технічній документації структуру таблиць. Звичайно таблиця складається з шапки, може бути, боковика і так званого "тіла" таблиці (рис. 5), причому як шапка, так і бокових можуть мати ієрархічну структуру (рис. 6). Модель такої таблиці може складатися з дерева горизонтальної ієрархії, що описує структуру боковика, дерева вертикальної ієрархії, що описує структуру шапки та зв'язків між деревами горизонтальної і вертикальної ієрархій.

Розглянуту модель будемо називати узагальненою моделлю пов'язаних ортогональних ієрархій. Приклад опису структури таблиці з використанням цієї моделі наведено на рис. 7 (b, c).

Загальний алгоритм розпізнавання таблиць

Система розпізнавання табличних форм складається з наступних основних компонентів: 1) підсистеми передобробки; 2) табличного структуризатор; 3) підсистеми розпізнавання символів (OCR-систе-ми); 4) табличного форматізатора; 5) підсистеми постобробки.

OCR-система здійснює розпізнавання текстової інформації на зображенні (основа методу розпізнавання розглянута в роботі [19].

Табличний форматізатор виводить таблицю, структура якої визначена структурізаторов, у вигляді текстового файлу, маючи в своєму розпорядженні розпізнані OCR-системою символи в належному порядку у відповідних осередках таблиці. Підсистема постобробки здійснює контекстно-залежну корекцію символів (наприклад, замінює при необхідності малі літери на прописні в залежності від розташування їх у слові).

Розглянемо більш докладно роботу табличного структуризатор. Ця підсистема послідовно виконує наступні дії: 1) виявлення і видалення ліній на растрі, 2) автономну обробку ліній; 3) автономну обробку тексту; 4) розпізнавання структури таблиць, 5) аналіз елементів таблиці.

Процедура виявлення ліній обробляє растрове зображення аркуша документа і виявляє на ньому відрізки прямих ліній. Потім ці лінії видаляються з растрового зображення, щоб відокремити їх від зображень символів і забезпечити можливість автономної обробки ліній і тексту.

Процедура автономної обробки ліній виконує наступні дії: а) зрощування розривів ліній; б) оцінювання та ліквідація перекосу; в) виділення кластерів співвісних ліній; г) визначення типів ліній. Процедура автономної обробки тексту полягає в основному в контекстно-незалежної фільтрації обривків ліній й фільтрації шумів на текстовому шарі растра. Вхідними даними для процедури розпізнавання табличної структури є: апріорне опис структури таблиці; набір відрізків горизонтальних і вертикальних ліній, класифікованих за типами; інформація про положення і розмірах рамок текстових компонент зв'язності.

Ця процедура перевіряє, чи відповідає структура оброблюваного зображення апріорно опису, і в разі відповідності формує ієрархічну модель структури таблиці. Для того, щоб забезпечити стійке розпізнавання, ця процедура враховує специфічні особливості таблиць певного типу. Основні дії, що виконуються цією процедурою:

ідентифікація горизонтальних ліній, що обмежують шапку;

глобальна контекстно-залежна фільтрація ліній;

ідентифікація вертикальних ліній відповідно до апріорним описом і перевірка відповідності структури таблиці цьому опису;

контекстно-залежна фільтрація компонент (обривків ліній і шуму);

побудова вертикальної ієрархії (структури колонок);

оцінювання горизонтальної ієрархії.

Призначення процедури аналізу осередків - структуризація тексту всередині елементів таблиці. Процедура виконує наступні дії: виділення рядків і слів, виявлення знаків пунктуації, індексних виразів, дробів і крапок всередині елементів таблиці.

Висновок

Таким чином, у цій роботі проведено огляд сучасних технологій автоматизованого введення в комп'ютер складноструктурованих друкованих документів і зроблений висновок про наявність певної обмеженості коштів структурного розпізнавання таблиць складної форми.

Авторами запропонована досить універсальна структурна модель пов'язаних ієрархій, придатна для опису широкого класу текстових документів, табличних форм і бланків. У роботі описується заснована на моделі пов'язаних ієрархій методологія розпізнавання табличних структур. Ця методологія була покладена в основу розробленого в рамках OCR-системи Cript універсального текстово-табличного структуризатор.

Наведені в роботі базові алгоритми структуризатор Cript можуть знайти застосування в багатьох задачах автоматизованої обробки текстів і таблиць різної природи, що демонструється прикладами структурного розпізнавання таблиць з різних історичних джерел. Тому занурення OCR системи Cript в різні автоматизовані системи введення та опрацювання історичних джерел дозволить підвищити ефективність і ступінь автоматизації подібних систем. Гнучкість і простота розробленого в рамках проекту Cript мови опису табличних форм істотно спростять процедуру налаштування кінцевим користувачем OCR-системи на специфічні особливості вводяться табличних структур.

Автори висловлюють вдячність А.В. Тюленєва і Л.І. Бородкіна, завдяки яким багато в чому і відбулася ця стаття.

Список літератури

1.OCR (Optical Character Recognition) - оптичне розпізнавання образів, Cript - одна з ефективних вітчизняних OCR-систем (Прим. ред.)

2.L. O'Gorman, "The document spectrum for page layout analysis", IEEE Journal on Pattern Analysis and Machine Intelligence, vol. 15, no. 11, p. 1162-1173, 1993; M. Krishnamoorthy, G. Nagy, S. Seth, M. Viswanathan, "Syntactic segmentation and labelling of digitized pages from technical journals", IEEE Journal on Pattern Analysis and Machine Intelligence, vol.15, no.7, p.737-747, 1993; G. Nagy, S. Seth, M. Viswanathan, A prototype document image analysis system for technical journals, Computer, no.7, p.10-21, 1992.

3.L. O'Gorman, The document spectrum for page layout analysis, IEEE Journal on Pattern Analysis and Machine Intelligence, vol. 15, no. 11, p. 1162-1173, 1993

4.HS Baird, K. Thompson, Reading Chess, Proc. of Workshop on ComputerVision, Washington, 1987.

5.V. Poulian d'Andecy, J. Camillerapp, I. Lemplumey, Kalman Filtering for Segment Detection: Application to Music Scores Analysis, Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. - V.1.

6.M. Thaller. The Processing of Manuscripts, Images and Manuscripts in Historical Computing, Goettingen, 1992; T. Kruyt, J. van der Voort van der Kleij. Converting the Historical Dictionary of Dutch to Electronic Form, Optical Character Recognitionin The Historical Discipline., Goettingen, 1993; 22. L. Borodkin, V. Lazarev, E. Zlobin, Applications of OCR in Russian Historical Sources: a Comparison of various programs, Optical Character Recognition in The Historical Discipline, Goettingen, 1993.

7.V. Klyahzkin, E. Shchepin, K. Zingerman. Application of hierarchical methods of cluster analysis to the printedtext structure recognition, Shape, Structure, and Pattern Recognition, Dov Dori and Alfred Bruckstein, Eds. World Scientific, 1995; V. Klyahzkin, E. Shchepin, K. Zingerman. Hierarchical analysis of multi-column texts, Pattern Recognition and Image Analysis, Vol.5, No.1, 1995, Interperiodica, pp. 1-12; В.М. Кляцкін. Ієрархічний кластер-аналіз багатоколонний текстів, Одеса, 1994, Праці V Міжнародної конференції (Статистичний і дискретний аналіз даних і експертні оцінки), Вид-во Одеського політехнічного університету, стор 132-134.

8.M. Krishnamoorthy, G. Nagy, S. Seth, M. Viswanathan, Syntactic segmentation and labelling of digitized pages from technical journals, IEEE Journal on Pattern Analysis and Machine Intelligence, vol.15, no.7, p.737-747, 1993

9.HS Baird, SE Jones, SJ Fortune, Image Segmentation by Shape-Directed Covers, Proc. IAPR 10-th Intern. Conf. on Pattern Recognition, Atlantic City, 1990; HSBaird, Background Structure in Document Images, Proc. IAPR Workshop on Structural and Syntactic Pattern Recognition, Bern, 1992.

10.HS Baird, Background Structure in Document Images, Proc. IAPR Workshop on Structural and Syntactic Pattern Recognition, Bern, 1992.

11.H. Saiga, Y. Kitumura, S. Ida, "High-Speed Recognition of Tabulated Data", Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. - V.2.

12.JFArias, A. Prasad, R. Kasturi, A. Chhabra, Interdivtation of Telephone Company Central Office Equipment Drawings, Proc. IAPR 12-th Intern. Conf. on Pattern Recognition, Los Alamos, 1994. - V.2.

13.P. Wayner, Optimal Character Recognition, Byte, 1993, no. 12, p.203-210.

14.G. Thorvaldsen. Making Printed Historical Sources Machine Readable: Some Experiences with OCR, History and Computing, Vol.5 No 2, Edinburgh University Press, 1993.

15.G. Thorvaldsen. Historical OCR Projects in Norway, Optical Character Recognition in The Historical Discipline., Goettingen, 1993

16.G. Thorvaldsen. Making Printed Historical Sources Machine Readable: Some Experiences with OCR, History and Computing, Vol.5 No 2, Edinburgh University Press, 1993.

17.A. McVeigh. The Irish Database Project: A Case for OCR?, Optical Character Recognition in The Historical Discipline., Goettingen, 1993

18.M. Olsen. Scanning, Keyboarding and Data Verification: Factors in Selecting Data Collection Technologies, Optical Character Recognition in The Historical Discipline., Goettingen, 1993

19.E. Shchepin, G. Nepomnyashchii, Character recognition via critical points, International Journal of Imaging Systems and Technology, vol.3, pp.213-221, 1991

20.Матеріали для географiі і статистики Россiі, зібрані офіцерами генерального штабу. Казанська губернiя. (Упорядник М. Лаптєв) - Санкт-Петербург, Військова друкарня. - 1861.