Ім'я файлу: Тестові_питання_на_іспит_Відповіді.docx
Розширення: docx
Розмір: 24кб.
Дата: 15.09.2020

Тестові питання на іспит (ТАД)-2019


  1. Автоматичне виявлення груп семантично схожих документів серед заданого фіксованого набору – це кластеризація.

  2. Аномальні значення даних – це значення, яі суперечать суті даних.


  3. В яких областях можливе застосування Data Science?

  4. Визначте величину похибки кластеризації за евклідовою мірою (2 бали)

  5. Визначте комплекс методів і алгоритмів, що застосовуються в аналітичних платформах з метою підготовки даних до розв’язування конкретної задачі і приведення їх у відповідність до вимог предобробка даних.

  6. Визначте центр кластера для заданої множини даних (2 бали)

  7. Відмітьте вірну назву типу міри при кластеризації

  8. Вкажіть елемент «Карта» на панелі візуалізації Power BI

  9. Вкажіть майстер обробки для проведення сегментації в системі Deductor Studio? Карти Кохонена

  10. Вкажіть неіснуючий стандартний символ-роздільник записів у системі Deductor (існують символ табуляции, точка с запятой, пробел, запятая,точка,другой)

  11. Вкажіть неприйнятну структуру асоціативного правила

  12. Вкажіть характеристику асоціативного правила, що визначається як різниця між підтримкою асоціації та добутком підтримок умови і наслідку окремо: значимість правила.

  13. Вкажіть характеристику асоціативного правила, що визначається як відношення кількості транзакцій, які містять умову і наслідок, до кількості транзакцій, що містять умову Достовірність асоціативного правила

  14. Вкажіть характеристику асоціативного правила, що визначається як відношення кількості транзакцій, які містять умову і наслідок, до загальної кількості транзакцій Підтримка асоціативного правила

  15. Вкажіть характеристику асоціативного правила, що визначається як частка підтримки асоціації та добутку підтримок умови і наслідку окремо: Покращення.

  16. Вкажіть характеристику асоціативного правила, що визначається як відношення достовірності правила до підтримки наслідку: Ліфт.

  17. Встановлення відношень між ключовими поняттями - це пошук асоціацій.

  18. Головною особливістю якої схеми побудови сховища даних є те, що інформація про один вимір може зберігатися в декількох зв’язаних таблицях ?

  19. Дані особистої сторінки користувача у Facebook є

  20. Для вирішення якої проблеми був створений Web Mining? персоналізація інформації

детальне вивчення споживача. створення нових знань, що будуть поза межами доступу на Web

  1. До задач Text Mining НЕ належить предобробка даних.

  2. До якого типу завдань відносяться задачі Data Mining в контексті Real Time? задачі на передбачення

  3. Елементи якої мови програмуванні доступні для інтеграції з Power BI? R

  4. З яких частин складається асоціативне правило? Підтримка та достовірність

  5. Збагачення даних – це процес

  6. Зі списку виберіть один із етапів підготовки Web Mining. пошук ресурсів

  7. Злиття даних дозволяє об’єднати дві таблиці за однойменними полями або доповнити одну таблицю записами з іншої, які відсутні в першій.

  8. Ідентифікація фактів і відношень у тексті – це первинний витяг ключових понять.

  9. Квантування даних дозволяє розбити діапазон можливих значень числової ознаки на задану кількість інтервалів та присвоїти номера інтервалів їхнім значенням.

  10. Коли алгоритм k-means завершує свою роботу? Коли жоден запис не змінив свого членства у кластерах і положення центроїдів не змінилось.

  11. Комірки карти Кохонена можуть мати форму шестикутника.

  12. Комплекс програмних засобів ETL включає Extraction, Transformation, Loading.

  13. Метадані – це це дані, що характеризують або пояснюють інші дані.

  14. Вкажіть можливе місце проведення оцінки якості даних всі відповіді вірні.

  15. На якому рівні якості даних відбувається усунення аномальних і фіктивних значень? Аналітичний

  16. Назвіть властивість, яка визначає, що додавання довільного предмету до непопулярного набору не робить його популярним Антимонотонність.

  17. Назвіть неіснуючу архітектуру сховищ даних (СД)

  18. Назвіть нетривіальний процес виявлення дійсно нових, потенційно корисних і зрозумілих шаблонів в неструктурованих текстових даних Text Mining.

  19. Назвіть три рівні якості даних : технічний, аналітичний та концептуальний.

  20. Оберіть вірний результат кластеризації об'єктів (2 бали)

  21. Оберіть вірну підмножину доступних форматів даних у Power BI . силка на інформацію https://biprosto.ru/dax/format.html



  22. Оберіть правильне твердження стосовно операції з’єднання наборів даних

  23. Обчисліть достовірність асоціації «RAM → Motherboard» при аналізі даних про купівлю комплектуючих персонального комп’ютера на основі заданого набору транзакцій (2 бали)

  24. Обчисліть левередж асоціації «HDD → RAM » при аналізі даних про купівлю комплектуючих персонального комп’ютера на основі заданого набору транзакцій (2 бали)

  25. Обчисліть ліфт асоціації «RAM → CPU» при аналізі даних про купівлю комплектуючих персонального комп’ютера на основі заданого набору транзакцій (2 бали)






  1. Обчисліть підтримку асоціації «CPU → RAM» при аналізі даних про купівлю комплектуючих персонального комп’ютера на основі заданого набору транзакцій (2 бали)

  2. Вкажіть основні методи трансформації даних усі відповіді вірні.

  3. Переміщення документами відносно тем та істотних термінів – це навігація текстом.

  4. Перетворення часових даних дозволяє оптимізувати представлення про дані в часовому форматі з метою забезпечення ефективності аналізу в усіх можливих інтервалах дати і часу.

  5. Популярний предметний набір - це предметний набір з підтримкою, що дорівнює або більше заданого порогового значення. Такий поріг називається мінімальною підтримкою.

  6. Прикладом структурованого тексту є . Прикладом неструктурованоготексту є

Web-сторінки електронна пошта нормативні документи


  1. Серед наведених назв вкажіть існуючий тип сховищ даних? Віртуальні.

  2. Скільки полів містить файл імпорту в системі Deductor при побудові асоціативних правил на основі транзакцій? Два транзакція і товар

  3. Скорочення тексту із збереженням його змісту це – автоматичне анотування.

  4. Сортування даних дозволяє змінити порядок проходження записів вихідної вибірки даних відповідно до алгоритму, певним користувачем.

  5. Теорією, яка НЕ лежить в основі Data Mining, є теорія масового обслуговування.

  6. Трансформація даних являє собою комплекс методів та алгоритмів, направоених на оптимізацію представлення і форматів даних з точки зору розв’язування задач та мети аналізу.

  7. У процесі профайлінгу аналізується наступна інформація усі відповіді вірні.


  8. У яких відношеннях знаходяться технології Data Mining (DM) та Knowledge Discovery in Databases (KDD)?


  9. Хто є головним в процесі аналізу даних?

  10. Хто є піонером у галузі штучного інтелекту, машинного навчання та комп’ютерних ігор?Артур Семюель.

  11. Центроїд (x,y) кластеру для точок (x1,y1), (x2,y2), (x3,y3) обчислюється за формулою .

  12. Що відбувається на фінальному етапі Text Mining? Інтерпретація результатів.

  13. Що дозволяє визначити статистичну значущість підвищення якості моделі при переході від одного рівняння до двох? (2 бали)

  14. Що з переліченого є базовим поняттям в теорії асоціативних правил? транзакція – деяка множина сумісних подій.

  15. Що з переліченого є метою афінітивного аналізу? Мета методу – дослідження взаємного зв’язку між подіями, які відбуваються сумісно.

  16. Що НЕ входить до основних методів трансформації даних? Основні методи Перетворення, квантування. Сортування, злиття, Групування, налаштування. Таблична підстановка, нормалізація.


  17. Що НЕ є методами аналізу даних ?

  18. Що НЕ є типом даних у Power BI? аа

  19. Що описує методика Knowledge Discovery in Databases? Описує послідовність дій, яку необхідно виконати для побудови моделі(Добування знань)


  20. Що таке "транзакція" в теорії асоціативних правил?

  21. Що таке OLAP ? OLAP (On-LineAnalyticalProcessing) – технологія оперативної аналітичної обробки даних, яка використовує методи і засоби для збирання, зберігання та аналізу багатовимірних даних.Технологія OLAP являє собою методику оперативного добування необхідної інформації з великих масивів даних і формування відповідних звітів.

  22. Як можна охарактеризувати Batch Learning (накопичувальне навчання) в Real Time Data Mining? Збір усіх даних, що маються, та поетапний аналіз на базі алгоритмів Data Mining, починаючи з початкового та закінчуючи тим, який ми маємо зараз.

  23. Як називається етап попередньої обробки тексту, на якому відбувається перетворення кожного слова до нормальної форми? Стеммінг


  24. Як називається перетворення некількісної інформації до числової ?

  25. Як називаються два протилежні підходи в Text Mining ? Експертний метод та машинне навчання.


  26. Як називаються сховища даних які будуються на базі тільки однієї СУБД ?


  27. Як співвідносяться між собою значення відстаней до центру кластера за мірами Евкліда і Манхеттена?

  28. Як співвідносяться технології Web Mining та Information Retrieval (IR – отримання інформації) Web Mining та Information Retrieval у поєднанні утворюють технологію Data Mining????


  29. Яка задача Data Mining розв'язується з використанням алгоритму k-means?


  30. Яке значення повинна приймати залежна змінна при застосуванні логістичної регресії?

  31. Яке розширення має файл проекту у системі Deductor Studio Academic? .ded

  32. Який аналіз включає в себе сукупність математичних методів, за допомогою яких досліджують взаємозв’язки залежних змінних? Кореляційно-регресійний аналіз

  33. Який з перелічених методів відноситься до методів кореляційно-регресійного аналізу? Метод натягнутої нитки,скм та найменших квадратів


  34. Який із наведених процесів не відноситься до задач Data Mining?

  35. Який майстер відсутній в аналітичній платформі Deductor Academic? (присутні мастер визуализации, мастер импорта, обработки и экспорта)


  36. Яких рядкових даних не існує?

  37. Які джерела даних підтримує аналітична платформа Deductor Academic? Текст дедуктор файл

  38. Якого методу трансформації даних не існує? Розбиття.

  39. Якого рівня якості даних НЕ існує? Правильної відповіді немає


  40. Якої служби Power BI не існує ?

  41. Якому рівню якості характерно проведення оцінки якості даних у процесі ETL? Технічному.

скачати

© Усі права захищені
написати до нас