"Big Data in Game Industry"

Ім'я файлу: BIG DATA IN GAME INDUSTRY.docx
Розширення: docx
Розмір: 33кб.
Дата: 10.12.2021
скачати

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ДЕРЖАВНИЙ ВИЩИЙ НАВЧАЛЬНИЙ ЗАКЛАД

«КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ імені ВАДИМА ГЕТЬМАНА»

Навчально-науковий інститут

«Інститут інформаційних технологій в економіці»

Абстракт

На тему:”Big Data in Game Industry”

Виконав студент

ІН-303 групи 3 курсу

Спеціальності «Комп’ютерні науки»

Садат К.З.

Перевірив:

Краснюк М.Т.

Київ 2021

Анотація:Великі дані стали актуальним поняттям, тому що інтернет сфера постійно

розширюється та прогресує. У даній роботі аналізується використання великих даних у відеоіграх,

технології баз даних для вирішення завдань ігрової галузі та такі сервіси як Amazon Web Service. Нами

розглядаються приклади використання великих даних у відеоіграх та способи монетизації даних

додатків. Проблеми розробки відеоігор стосуються в основному ігрового дизайну та кількості різних

характеристик.

Ключові слова: Великі дані, Supercell, Blizard, технології NoSQL

Вступ. Big data - це різні інструменти, підходи та методи обробки як

структурованих, так і неструктурованих даних для того, щоб їх використовувати для

конкретних завдань та цілей. У сучасному світі Big data-соціально-економічний

феномен, який пов'язаний з тим, що з'явилися нові технологічні можливості для

аналізу великої кількості даних. Великі дані допомагають розробникам

балансувати, тестувати та монетизувати свої ігри. У майбутньому великі дані, швидше

всього, матимуть ще більше варіантів використання у відеоіграх та їх розробці. Є

кілька прикладів того, як ігрові компанії успішно впроваджують великі рішення

даних з самого початку розробки своїх продуктів, і є деякі компанії, які

адаптувалися до них пізніше. Ігровим компаніям не обов'язково використовувати великі

дані, щоб надавати свої послуги належним чином, на відміну від популярних

соціальних мереж, які обробляють величезні обсяги даних кожну секунду. Тим не

менш, такі компанії, як Supercell та Zynga, є чудовими прикладами того, як

великі дані можуть допомогти ігровій компанії досягти успіху. Петрі Кяркес із Supercell

взяв участь у Aalto Big Data Breakfast у грудні 2015 року та у своїй презентації він

перерахував такі варіанти використання великих даних у своїй компанії:

1. Щоденні показники

2. Ігровий баланс та показники популяції гравців

3. A/B тестування

4. Маркетингова оптимізація

5. Виявлення робота

Supercell – не єдина компанія, яка використовує великі дані для вирішення

тактичних та стратегічних завдань. Розглянемо деякі варіанти використання з

прикладами.

Зрівняння шансів. Балансування є важливою частиною розробки як

одиночної, так і розрахованої на багато користувачів гри, т.к. гра повинна залишатися чесною та

захоплюючою. Складність однокористувальних ігор повинна збільшуватися поступово,

щоб гравці не виходили з гри, тому що гра надто легка чи надто складна.

Розраховані на багато користувачів ігри вимагають балансування для асиметричних функцій, таких як

ігрові персонажі з різними атрибутами та здібностями. Великі дані можна

використовувати для балансування як одиночної, так і розрахованої на багато користувачів гри, але в

рамках даної роботи ми розглянемо розрахований на багато користувачів аспект.

Балансування персонажа. Blizzard Entertainment зібрала понад 35 мільйонів гравців

для гри в шутер від першої особи Overwatch [1]. Гра була запущена у травні 2016 року з 22

різними ігровими персонажами, відомими як герої, було представлено чотири

різних режиму гри та дев'ять різних карт. Існує чотири різні категорії героїв,

і всі герої мають різні навички, які Blizzard необхідно збалансувати. Ігри з

такою кількістю героїв та здібностей не можуть бути повністю збалансовані для всіх

режимів гри, карт та навичок гравця (від рівня початківців до професійних гравців).

Тому деякі комбінації героїв стали так званим «метою», що означає, що ці

герої та комбінації переважно інших. Протягом 2017 року гравці висловлювали

побоювання, що деякі, більш мобільні герої стали надто сильними, і так звана

«dive comp meta»(угруповання деяких персонажів з метою координації атак на

противника) не дозволяє повноцінно грати іншими героями, що робить гру

передбачуваною та однозначною. Дайв Комп коротко означає використання складу

певних мобільних героїв для здійснення скоординованих атак супротивника.

Директор гри Джефф Каплан відповів довгим постом, присвяченим багатьом питанням.

ж час із наступними частинами, що вирішують проблему занурення, використовуючи статистику

показати, що все гаразд. По-перше, він згадав шість найбільш вибираних героїв з

більш звичного ігрового режиму Quick і лише один із них, Генджі, є одним з

героїв "Dive Comp Meta". По-друге, він перерахував сім найпопулярніших персонажів з

режиму змагальної гри, і в цьому списку були як дуже мобільні герої,

орієнтовані як на «Дайв Комп», так і повільні герої, які вважаються побитими

героями "Дайв Комп" [3]. Він закінчив статистику свого героя, заявивши, що найпопулярніша

героїня серед найкращих гравців змагань – Ана. Ана це герой підтримки, який не

вважається найкращим варіантом для занурень. Відповідь Каплана була ефективним методом

використання статистики, отриманої з використанням інструментів збору великих

даних від Blizzard, щоб довести свою точку зору і уникнути поспішності тільки

тому, що гравці відчували, що зміна була необхідна.

Балансування ігрового середовища. Крім балансування героїв, деякі карти в

іграх також потребують балансування. Наведемо відповідний приклад. У режимі гри

під назвою «Штурм» атакуюча команда, що складається з шести людей, має десять

хвилин, щоб захопити дві команди захисту, що також складаються з шести осіб, які роблять

все можливе для запобігання захопленню. На офіційному ігровому форумі гравці розпочали

висловлювати побоювання з приводу режиму гри, що сприяє захисту

стороні. Коли гравець надіслав питання про відсоток перемог на картах Assault у режимі швидкої

ігри, ігровий директор Джефф Каплан відповів статистикою за період часу близько двох

місяців.

Технології баз даних на вирішення завдань ігрової галузі. Реляційні бази даних

широко застосовуються з їх першого використання у 1970-х роках. Незважаючи на

вибухове зростання баз користувачів онлайн-додатків та відповідно даних,

генерованих онлайновими та мобільними системами протягом цього часу, нові

рішення, які краще підходили б для управління даними такого великого обсягу, не

з'являлися і набували широкого поширення до недавнього часу. Замість

цього було впроваджено різні способи збільшення ємності традиційних систем.

 Шардинг - методика поділу даних по різних серверах, яка вимагає

знання місцезнаходження сервера з даними та обмежена відсутністю можливості

об'єднання даних із різних серверів. Необхідний супровід схем для кожного

сервера.

 Денормалізація - ще один метод, що включає групування та індексування

надлишкових даних, що часто призводить до затримки та проблем з підтримкою

паралелізму у системах реляційних баз даних.

 Розподілене кешування, яке передбачає кешування останньої

отриманої інформації в пам'яті, корисно, якщо може виникнути потреба в цих

даних. Додаток (Web-додаток, гра, соціальна мережа, пошукова система тощо)

спочатку перевіряє наявність необхідних даних у системі розподіленого кешування

(наприклад, memcached) замість звернення до реляційної бази даних.

Нові технології NoSQL дозволяють оминути типові недоліки реляційних

баз даних і уникнути потреби застосування методів, що випливають з цих недоліків

розширення, описаних у попередньому абзаці. Цим технологіям не потрібні схеми та

об'єднання, вони є реляційними. Такі бази даних можуть обробляти

структуровані, напівструктуровані та неструктуровані дані.

Додаткові дані можуть додаватися до сховищ у будь-який час незалежно від

формату та негайно стають доступними для аналізу. Ці бази даних легко

справляються з ієрархічними вкладеними структурами даних та завдяки своїй гнучкості

підтримують можливість автоматичного розподілу даних по серверах у міру

збільшення та зменшення обсягу інформації без будь-якого впливу на

продуктивність.

Існує безліч типів баз даних NoSQL, включаючи документоорієнтовані сховища, стельові сховища, сховища типу «ключ-значення»,

бази даних XML та бази даних на основі графів. На даний момент застосовується більше

150 баз даних NoSQL, та його число продовжує збільшуватися. Існує кілька

популярних варіантів NoSQL з відкритим вихідним кодом, включаючи стелі

сховища (наприклад, Apache CouchDB та MongoDB) та стельові сховища з широкими

рядками (наприклад, Apache Cassandra, Apache Hadoop та Hbase). Існують також

аналітичні інструментальні засоби з відкритим вихідним кодом, що працюють поверх

СУБД, наприклад, парадигма MapReduce в СУБД Hadoop. Механізм машинного навчання

Apache Mahout забезпечує класифікацію, кластеризацію та спільну фільтрацію. Для

виконання статистичної обробки з масовим паралелізмом безпосередньо на вузлах

Hadoop була інтегрована система R з відкритим кодом. Також популярні

комерційні варіанти NoSQL, які інтегруються з Hadoop та іншими

інструментальними засобами з відкритим вихідним кодом та значно розширюють

можливості останніх, додаючи засоби аналітики, глибинного аналізу тексту,

внутрішньої обробки додатків, функції MapReduce та можливості побудови

графіків.

Сервисы Amazon для обслуживания компании Supercell. Игры Supercell требуют тысячи серверов в любой момент времени. Для каждого из своих игроков Supercell нуждается в сеансе на стороне сервера—и количество серверов, которые требуются, растет с увеличением числа одновременных пользователей, играющих в игру. Вся игровая инфраструктура работает на Amazon Web Services (AWS). Supercell использует инстансы Amazon Elastic Compute Cloud (Amazon EC2), распределенные по нескольким зонам доступности, для повышения доступности и Amazon Simple Storage Service (Amazon S3) для хранения до 10 терабайт данных о событиях игр каждый день. Долгосрочное хранение, резервное копирование и архивирование осуществляется в недорогом сервисе Amazon Glacier storage. Эластичная балансировка нагрузки используется для распределения входящего веб-трафика и трафика событий между экземплярами. Supercell использует Amazon CloudFront, Amazon ElastiCache, Amazon API Gateway и AWS Lambda для доставки динамического веб-контента по всему миру, используя пограничные местоположения для улучшения задержки.Supercell использует Amazon Kinesis для доставки внутриигровых данных в режиме реального времени, обрабатывая 45 миллиардов событий в день. В то время как недавно он запустил собственные экземпляры Hadoop на Amazon EC2, теперь он использует Amazon Elastic MapReduce (Amazon EMR) для предоставления управляемой платформы Hadoop перед передачей данных в службу хранилища данных, работающую поверх экземпляров Amazon EC2. Данные Kinesis также считываются в Amazon DynamoDB. "Amazon DynamoDB хорош для таких случаев использования, как наш, где масштабируемость и скорость имеют решающее значение", - говорит Илихарью. Для мониторинга, управления и контроля своей среды Supercell использует ряд инструментов в консоли AWS. Amazon CloudWatch и AWS CloudTrail позволяют ему отслеживать текущую среду и предоставлять подробный журнал всех действий в среде разработки и производства. ” AWS API—один из самых важных сервисов для нас, мы часто его используем", - говорит Илихарью. "Например, команды API позволяют нам легко управлять и загружать новые серверы и даже запускать среды полного нагрузочного тестирования для моделирования различных ситуаций и определения наших потребностей в емкости". Supercell также хорошо использует Amazon API Gateway и использует AWS Lambda для запуска кода в ответ на события и автоматического управления соответствующими вычислительными ресурсами. Yliharju говорит: "Мы используем AWS Lambda и API Gateway при создании API-сервисов, которые нуждаются в масштабируемости.” Тестирование. Существуют различные методы и инструменты для тестирования видеоигр. Как правило, тестировщики игр и агенты обеспечения качества (QA) постарайтесь убедиться, что [6]: Игра сбалансирована; Игра не падает ни в каких ситуациях; Как старые, так и новые функции работают по назначению; Большие данные предлагают помощь в тестировании игр, предоставляя возможность собирать большие выборки тестовых данных и анализировать данные в прямом эфире. "Наша главная бизнес-задача состоит в том, чтобы выяснить, что заставляет людей играть в наши игры, что делает их привлекающими. Сначала мы проявляем творческий подход, а затем используем полученные данные для подтверждения правильности принятых решений. У нас есть гипотеза, игра идет в прямом эфире, и мы проверяем нашу гипотезу.-Янне Пельтола, менеджеры данных компании Supercell на примере компании Hewlett Packard Enterprise о больших данных решения Supercell [7]. А / Б тестирование означает, что помимо живой версии игры существует еще и другая вариация игры. Эти изменения могут включать, например, изменения в пользовательском интерфейсе (Пользовательский Интерфейс) или способности в персонажах игрока. Цель состоит в том, чтобы собрать достаточно данных с обеих сторон. Актуальная версия, также известная как "контрольная" версия, и вариант версии, чтобы увидеть, если модификация приводит к желаемым результатам в варианте исполнения. "Один цікавий тест A/B Supercell провів про підключення Facebook. Тест був розроблений, щоб

подивитися, чи хотіли люди, яким сподобалися ігри, також звати їх друзів, грати, та

подивитися, як ці змінні впливають на утримання гравця. З погляду А/Б

тестування, тепер ми витягуємо дані у HPE Vertica. Щось, що займало два-три

години, у минулому зараз займає чотири хвилини." Blizzard має окреме середовище PTR (Public

Test Realm), де всі гравці можуть протестувати наступний патч до фактичного випуску

на живих серверах. PTR корисний для тестування нових героїв та карт, щоб переконатися, що

немає нічого надто сильного в них, перш ніж вони будуть випущені для мільйонів гравців

[8]. До речей, що порушують правила гри, відносяться, наприклад: слабкі здібності, слабкі

персонажі гравців та помилки в картах чи героях, які ламають весь ігровий сервер.

Проблема з тестуванням в PTR полягає в тому, що воно не дуже популярне

порівняно з їхніми нинішніми активними серверами і тому обсяги зібраних даних

справді невеликі в порівнянні з їх тестовими серверами [9]. Згідно з повідомленням

на форумі ігрового директора - Джеффа Каплана у січні 2017 року лише 0,26% гравців

Повернення увійшли в PTR. На той час загальна кількість гравців для Overwatch була десь

між 20 і 25 мільйонів так що кількість гравців в області PTR було десь між 52000

та 65000 [10]. Незважаючи на те, що PTR не такий популярний, як хотілося б Blizzard, більше 50000

гравців, які надають дані у тестовому середовищі, для них все одно набагато більше, ніж

кількість співробітників з усієї організації Activision Blizzard[11]. Також варто зазначити,

що деякі гравці не просто грають на PTR, а й повідомляють про свої знахідки в

офіційний ігровий форум або інші форуми Overwatch, такі як різні субреддити

Overwatch, спільнота Reddit[12].

Монетизація. Монетизація є найважливішим фактором для ігрової компанії,

тому що без хорошої системи монетизації насправді не має значення, чи

гра хітом чи ні. Зрештою, гроші - головна мета ігрової компанії, бути

прибутковою компанією без добре продуманої моделі монетизації неможливо. Великі

дані можуть бути дуже корисними для моделі монетизації F2P, оскільки економічна

архітектура A-R-M-D, дозволяє покращувати монетизацію гри постійно, використовуючи дані

гравця у процесі. Преміум-модель не обов'язково має цю перевагу, тому

що більшість розробок робиться на початок монетизації.

Zynga була однією з перших компаній, що впровадили розробку ігор на основі даних

у своїх країнах. F2P Facebook ігри, такі як FarmVille та Mafia Wars. Член-засновник

Андрій Трейдер сказав в інтерв'ю The Wharton School: "Брудний маленький секрет Zynga -

з п'яти корпоративних цінностей жодна не є більш важливою, ніж управління

метриками. Для Zynga, це означало, що якщо ви не можете виміряти щось, не будуйте його.

Zynga уважно стежила за охопленням, утриманням позицій та доходом при цьому утримання

є найважливішим фактором. Їхній дохід був отриманий за рахунок продажу внутрішньоігрових

предметів, які хотіли їхні клієнти. Як, наприклад, було згадано, що жінки

купували речі в основному для зовнішності, у той час як чоловіки купували речі, щоб

обіграти своїх друзів у грі. Вони використовували свої показники, щоб з'ясувати, що їх

гравці хотіли [4]. Дивлячись на цифри гравців та продажів, Supercell є одним з найкращих

прикладів використання моделі F2P та великих даних для отримання максимальної

прибутку, не лякаючи неплатників. Supercell використовує хмарні сервіси Amazon,

зокрема Amazon MapReduce разом з платформою Hadoop для збору та аналізу понад 45

мільярдів ігрових подій на день. У принципі, кожна дія, що відбувається в іграх

Supercell, відправляється на їхню хмару та аналізується з використанням великого набору

даних, щоб переконатися, що все перебуває під контролем [5].

Висновок. Індустрія відеоігор виросла більше, ніж хтось міг собі уявити

час, коли вперше було опубліковано комерційні відеоігри. Цього б не сталося

без допомоги Інтернету, хоча ігри мали свою велику частку гравців ще до теперішнього часу Интернета и распространялись по всему миру. Видеоигры могут быть запущены на различных видах устройств, и подключение к Интернету воспринимаются как должное для многих из этих новых игр, которые появились в 21 веке. Объем данных в интернете вырос неожиданно быстро, и в конечном итоге традиционные реляционные базы данных не могли больше идти в ногу с объемом, скоростью и разнообразием данных. В то время как реляционные базы данных все еще служат своей цели для небольших томов, скорости и разнообразия данных, концепция больших данных была необходима, чтобы справиться с этой проблемой с базами данных NoSQL и фреймворками, такими как Hadoop и HPCC. Большие данные принесли больше в таблицу разработчиков игр с точки зрения балансировки, монетизации и тестирования. Решения по балансировке и монетизации все еще могут быть приняты интуитивно, но всегда есть данные, доступные для изучения эффектов должным образом. Разработчики также могут объяснить свои действия или бездействие, показав сырую статистику своим игрокам. С надеждой, что игроки все равно будут услышаны, хотя разработчики могут просто посмотреть на данные и увидеть, если кажется, что что-то не так вместо того, чтобы читать мнения игроков на игровых форумах.
Джерела інформації
1.researchgate.net

2.orcid.org

3.academia.edu

4.science-community.org

5.cyberleninka.ru
скачати

© Усі права захищені
написати до нас