Реферат з дисципліни Основи цифрової обробки сигналів з теми

Ім'я файлу: Реферат ОЦОС Ксьондзик І. КН-402.docx
Розширення: docx
Розмір: 338кб.
Дата: 11.12.2023
скачати

Міністерство освіти і науки України

Національний університет «Львівська політехніка»

Інститут комп’ютерних наук та інформаційних технологій

Кафедра автоматизованих систем управління

Реферат

з дисципліни

Основи цифрової обробки сигналів

з теми:

“ Системи розпізнавання зображень або цифрових потоків”

Виконала: студентка КН-402

Ксьондзик Іванна

Прийняла: проф. каф. АСУ

Грицик В. В.

Львів – 2023

Зміст

ВСТУП 3

1.ОБРОБКА ЗОБРАЖЕНЬ 4

1.1. Використання нейронних мереж для визначення об'єктів та розпізнавання образів. 4

1.2. Сегментація зображень та виділення визначених областей. 5

1.3. Застосування технік передобробки зображень для покращення результатів. 7

2.ОБРОБКА ЗВУКУ 8

2.1. Визначення мови та розпізнавання мовлення. 8

2.2. Виявлення акустичних особливостей та емоційного забарвлення голосу. 9

2.3. Використання аудіоаналізу для виявлення аномальних звуків та подій. 10

ВИСНОВКИ 11

ДЖЕРЕЛА 12

ВСТУП

Штучний інтелект (ШІ) та Data Science вже давно перетворилися на одні з найбільш захоплюючих і швидко розвиваючих галузей технологій, що революціонізують спосіб, яким ми обробляємо та аналізуємо дані. Однією з найбільш перспективних граней цих досліджень і застосувань є використання ШІ та методів Data Science для обробки і аналізу інформації, яка міститься в зображеннях, тексті та звуку.

Основною метою дослідження є визначення оптимальних методів обробки цих типів даних, а також аналіз сфер використання моделей ШІ та систем, де вони можуть бути надзвичайно ефективними.

Сьогоднішній світ переповнений великими обсягами інформації у різних форматах, що потребують швидкого та ефективного аналізу та обробки. Застосування штучного інтелекту та методів Data Science дозволяє автоматизувати цей процес та виділяти цінну інформацію навіть з найскладніших даних.

Використання моделей ШІ та аналіз даних є основою ряду важливих сфер, таких як медицина, фінанси, виробництво та багато інших. Ці технології допомагають у виявленні патологій на медичних зображеннях, передбаченні фінансових трендів, оптимізації виробництва і покращенні громадських послуг.

Ознайомлення з відповідними методами та сферами використання в розумінні та оптимізація використання таких інструментів є важливим завданням для подальшого розвитку індустрії штучного інтелекту та науки про дані.

ОБРОБКА ЗОБРАЖЕНЬ

Використання нейронних мереж для визначення об'єктів та розпізнавання образів.

Нейронні мережі є математичними моделями, що імітують роботу біологічних нейронів у мозку. Вони складаються з великої кількості штучних нейронів, які з’єднані між собою синаптичними вагами. Нейронні мережі можуть навчатися з даних за допомогою алгоритмів оптимізації, таких як градієнтний спуск або стохастичний градієнтний спуск.

Одним з типів нейронних мереж, які часто використовуються для визначення об’єктів та розпізнавання образів, є згорткові нейронні мережі (CNN). Згорткова нейронна мережа є нейронною мережею, яка має один або кілька згорткових шарів, де кожен нейрон отримує вхідну інформацію з невеликої області попереднього шару. Згортковий шар використовує функцію згортки для видобування основних ознак зображення, таких як ребра, контури, текстури тощо. Згортковий шар також додає інваріантність до масштабу, повороту, зсуву і інших перетворень зображення. Згорткова нейронна мережа може мати також один або кілька повно-з’єднаних шарів, де кожен нейрон отримує вхідну інформацію від усіх нейронів попереднього шару. Повно-з’єднаний шар використовує функцію активації для перетворення лінійної комбінації входів у вихідний сигнал. Повно-з’єднаний шар може слугувати для класифікації зображень за їх категоріями, наприклад, тварини, рослини, люди тощо.

Рис. 1.1. Класифікація зображення в CNN

CNN ефективніші за інші методи розпізнавання образу, тому що вони використовують згортку, яка дозволяє виділити найважливіші ознаки зображення, зменшити розмірність даних і зберегти просторову інформацію. Згортка також додає інваріантність до масштабу, повороту, зсуву і інших перетворень зображення. Крім того, CNN можуть навчатися від великої кількості прикладів за допомогою градієнтного спуску та алгоритму зворотного поширення помилки. Це дозволяє CNN адаптуватися до різних задач розпізнавання образів, таких як класифікація, локалізація, сегментація, детекція тощо.

Сегментація зображень та виділення визначених областей.

Сегментація зображень полягає у розділенні цифрового зображення на декілька сегментів, які мають спільні візуальні характеристики, такі як колір, яскравість, текстура тощо. Виділення визначених областей означає видобування інформативних частин зображення, таких як об’єкти, межі, контури тощо.

Рис. 1.2. Сегментація зображення.

Існує багато методів та алгоритмів для сегментації зображень та виділення визначених областей, які базуються на різних підходах та критеріях. Деякими загальними методами є:

Визначення порогів: цей метод використовує деяке порогове значення для перетворення зображення в градаціях чорного в бінаризоване зображення, де пікселі, що перевищують поріг, належать до одного сегмента, а пікселі, що не перевищують поріг, належать до іншого сегмента.
Методи, засновані на кластеризації: цей метод групує пікселі зображення за деякою метрикою схожості, такою як евклідова відстань або кутова подоба.
Виділення країв: цей метод шукає пікселі, які мають розриви яскравості на зображенні, що свідчать про наявність меж між областями.
Методи розростання областей: цей метод починається з деяких початкових точок (насадок) і додає до них сусідні пікселі, якщо вони задовольняють деяку умову однорідності. Процес продовжується до тих пір, поки не будуть видобуті всi областi.
Методи, заснованi на диференцiальних рiвняннях з частинними похiдними: цей метод моделює еволюцiю кривих або поверхонь на зображеннi.
Методи розрiзу графу: цей метод представляє зображення у виглядi графу, де вершини вiдповiдають пiкселям, а ребра вiдповiдають вагам, якi залежать вiд схожостi пiкселiв.
Сегментацiя методом водоподiлу: цей метод аналогiчний процесу розливання води на зображеннi, де локальнi мiнiмуми яскравостi є джерелами води, а градiєнт яскравостi є рельєфом. Сегменти утворюються шляхом з’єднання пiкселiв, якi належать до одного басейну стоку.
Сегментація за допомогою моделі: цей метод використовує апріорну інформацію про форму, розмір, положення або орієнтацію об’єктів на зображенні для їх видобуття.

Застосування технік передобробки зображень для покращення результатів.

Застосування технік передобробки зображень для покращення результатів є важливим кроком у багатьох задачах обробки зображень, таких як сегментація, класифікація, розпізнавання об’єктів, реставрація тощо. Передобробка зображень має на меті покращити якість зображення, зменшити шум, підвищити контраст, вирівняти освітлення, виправити спотворення та інші артефакти. Деякими загальними методами передобробки зображень є:

Фільтрація: цей метод використовує деякий фільтр для модифікації пікселів зображення на основі їх сусідства.
Гамма-корекцiя: цей метод використовує деяку функцiю перетворення для змiни iнтенсивностi пiкселiв зображення. Гамма-корекцiя може бути використана для пiдвищення або зниження контрасту, а також для компенсацiї ефекту гамми, який виникає при вiдтвореннi зображень на рiзних пристроях.
Гiстограмна рiвномiрнiсть: цей метод використовує деяку функцiю перетворення для розподiлу iнтенсивностей пiкселiв зображення таким чином, щоб гiстограма iнтенсивностей була рiвномiрною або наближеною до рiвномiрної.
Колоризацiя: цей метод використовує деяку модель кольору для перетворення зображення з одного кольорового простору в iнший.

ОБРОБКА ЗВУКУ

Визначення мови та розпізнавання мовлення.

Визначення мови та розпізнавання мовлення - це два різні, але пов’язані процеси, які використовують методи обробки природної мови (NLP) для аналізу текстових або голосових даних.

Визначення мови - це процес визначення, до якої мови належить певний текст або голос. Наприклад, визначення мови може бути використане для перекладу, сортування або фільтрації документів за мовними критеріями. Визначення мови може бути здійснене за допомогою правил, які використовують лексичні, граматичні або орфографічні ознаки для ідентифікації мови, або за допомогою машинного навчання, яке використовує статистичні моделі для навчання з прикладів.

Перетворення звуку у цифрову форму - це процес аналогово-цифрового перетворення (АЦП), який полягає в тому, що голосовий сигнал, який є аналоговим (тобто неперервним), розбивається на дискретні (тобто скінченні) частини, які називаються семплами. Кожен семпл має певне значення амплітуди (сили) та частоти (швидкості) коливань. Перетворений звук може бути представлений у вигляді послідовності чисел або графіка, який називається. Далі відбувається порівняння звуку з еталонами різних мов - це процес статистичного аналізу, який полягає в тому, що перетворений звук порівнюється з попередньо навченими моделями різних мов.

Рис.3.1. Перетворення звуку в цифрову форму.

Розпiзнавання мовлення - це процес перетворення голосового сигналу в текстовий потiк. Наприклад, розпiзнавання мовлення може бути використане для диктування, транскрибування, керування пристроями за допомогою голосу або розумiння змiсту та настрою голосового повiдомлення. Розпiзнавання мовлення може бути здiйснене за допомогою правил, якi використовують акустичнi, фонетичнi або лексичнi ознаки для розпiзнавання слiв, або за допомогою машинного навчання, яке використовує нейроннi мережi для класифiкацiї звукiв у текст.

Для розпізнавання мовлення потрібно виконати три етапи. Спочатку відбувається сегментація - це процес розбиття голосового сигналу на окремі одиниці, такі як слова, склади, фонеми. Далі необхідно ідентифікувати окремі одиниці мовлення, отримані на попередньому етапі. І вкінці відбувається постобробка розпізнаного тексту. Це включає в себе виправлення помилок, додавання пунктуації та форматування.

Виявлення акустичних особливостей та емоційного забарвлення голосу.

Виявлення акустичних особливостей та емоційного забарвлення голосу - це процес аналізу голосового сигналу, який дозволяє визначити різні параметри, що характеризують звук та його вплив на слухача.

Для цього, як і для визначення мови і розпізнавання мовлення, потрібно перетворити звук у цифрову форму. Далі видобуваються акустичні особливості з цифрового сигналу. Це означає, що з перетвореного звуку витягуються різні ознаки, які характеризують його спектральний, темпоральний та просодичний рельєф. Спектральний рельєф - це розподіл енергії звуку по різних частотах. Темпоральний рельєф - це часовий перебіг звуку. Просодичний рельєф - це висотне, силове та темброве розмаїття звуку. Для цього можна використати різні методи, такі як Фур’є-аналiз, мел-частотнi кепстральнi коефiцiєнти, швидкість мовлення, висоту та силу звуку. Після аналізу особливостей звуку, його можна класифікувати. Це означає, що на основі видобутих ознак призначається певна емоційна категорія для голосового сигналу. Категорії можуть бути різними, наприклад: радість, смуток, гнів, страх тощо. Для класифікації емоційного забарвлення голосу можна використати вже різні моделі ШІ.

Використання аудіоаналізу для виявлення аномальних звуків та подій.

Використання аудіоаналізу для виявлення аномальних звуків та подій - це процес, який дозволяє розпізнавати та класифікувати звуки, які не відповідають звичайному фону або очікуваному сценарію. Цей процес може мати різні застосування, такі як безпека, медицина, екологія, розваги тощо.

Для виконання цього процесу потрібно виконати наступні кроки:

Записати або отримати аудіосигнал, який потребує аналізу.
Перетворити аудіосигнал у цифрову форму, тобто розбити його на дискретні частини, які мають певні значення сили та швидкості коливань.
Видобути ознаки з цифрового сигналу, тобто визначити розподіл енергії звуку по різних частотах, часовий перебіг звуку та напрямок та вiдстань до джерела звуку.
Класифікувати звук за допомогою ознак, тобто призначити певну категорію для звуку, яка вказує на його тип або подію.

ВИСНОВКИ

Це дослідження вказує на широкий потенціал використання штучного інтелекту (ШІ) та Data Science у обробці різних типів даних, таких як зображення, текст і аудіодоріжки. Оптимальний вибір методів обробки даних залежить від конкретного завдання та вимог, але важливо розуміти, що ці технології можуть принести значні переваги у багатьох сферах.

У сфері обробки зображень, глибокі нейронні мережі, зокрема згорткові нейронні мережі (CNN), демонструють вражаючі результати в розпізнаванні об'єктів, сегментації та аналізі медичних зображень. Для обробки тексту і природної мови (NLP), трансформерні моделі стають стандартом і дозволяють робити автоматичне розпізнавання текстів, класифікацію та переклад мов. Аналіз аудіоданих також зазнає великого розвитку завдяки глибокому навчанню і може бути застосованим у виявленні емоцій, розпізнаванні мовлення та безлічі інших застосувань.

Сфери використання ШІ та Data Science безмежно розширюються. Вони ефективні в медицині для діагностики та лікування, в автомобільній промисловості для автономного водіння, в сільському господарстві для оптимізації вирощування, в рекламі для персоналізації та багатьох інших галузях. Дослідження показують, що вони можуть підвищити продуктивність, зменшити ризики і покращити якість життя.

Зростаюча доступність даних, розвиток алгоритмів та збільшення обчислювальних ресурсів сприяють подальшому розвитку цих технологій. Проте важливо також враховувати етичні та безпечні аспекти в їх використанні, а також забезпечити захист приватності даних.

Усе це свідчить про те, що ШІ та Data Science відкривають нові горизонти в аналізі та обробці даних і мають потенціал змінити спосіб, яким ми взаємодіємо з інформацією і розвиваємо наші суспільства і промисловість.

ДЖЕРЕЛА

“Штучний Інтелект.” uk.wikipedia.org, Sept. 2023, uk.wikipedia.org/wiki/%D0%A8%D1%82%D1%83%D1%87%D0%BD%D0%B8%D0%B9_%D1%96%D0%BD%D1%82%D0%B5%D0%BB%D0%B5%D0%BA%D1%82.
Wikiwand - Сегментація Зображення.” Wikiwand, https://www.wikiwand.com/uk/%D0%A1%D0%B5%D0%B3%D0%BC%D0%B5%D0%BD%D1%82%D1%83%D0%B2%D0%B0%D0%BD%D0%BD%D1%8F_%D0%B7%D0%BE%D0%B1%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D1%8C.
Розробка І Навчання Нейронної Мережі. ✓ Deep Learning ✓Neural Network. evergreens.com.ua/ua/development-services/neural-network.html.
“Що Таке Обробка Природної Мови (NLP) Та Як Вона Може Використовуватися У Бізнесі.”, metinvest.digital/en/page/1052.
“Визначення Мови.” uk.wikipedia.org, Apr. 2023, uk.wikipedia.org/wiki/%D0%92%D0%B8%D0%B7%D0%BD%D0%B0%D1%87%D0%B5%D0%BD%D0%BD%D1%8F_%D0%BC%D0%BE%D0%B2%D0%B8

скачати