Ім'я файлу: Курсова робота.docx
Розширення: docx
Розмір: 700кб.
Дата: 22.02.2021
Пов'язані файли:
1 Лекція.docx

КИЇВСЬКИЙ КООПЕРАТИВНИЙ ІНСТИТУТ БІЗНЕСУ І ПРАВА

Економіко-правовий коледж

Економіко-правове відділення

КУРСОВА РОБОТА

з дисципліни

«Мова програмування R»

Київ - 2020

ЗМІСТ

Вступ 3

Розділ 1

1. Історія виникнення 4

2. Як завантажити і встановити R 5

3. Як почати працювати в R 7

3.1 Запуск 7

3.2 Перші кроки 9

4 Калькулятор 11

5 Скрипти 13

6 Пакети 14

Розділ 2

1. R і робота з даними 17

Ресурси 21

Вступ

Перш за все R - мова програмування для статистичної обробки даних і роботи з графікою, але в той же час це вільне програмне середовище з відкритим вихідним кодом, що розвивається в рамках проекту GNU. У будь-якому дистрибутиві GNU / Linux, якщо його метою не є розміщення всього дистрибутива на дискеті, можна знайти це середовище.

R застосовується скрізь, де потрібна робота з даними. Це не тільки статистика в вузькому сенсі слова, а й «первинний» аналіз (графіки, таблиці з’єднання), і просунуте математичне моделювання. R без особливих проблем може використовуватися і там, де зараз прийнято використовувати комерційні програми аналізу рівня MatLab / Octave. З іншого боку цілком природно, що основна обчислювальна потужність R найкраще його проявляється при статистичному аналізі: від обчислення середніх величин до вейвлет-перетворень тимчасових рядів.

Географія використання R дуже різноманітна. Важко знайти американський або західноєвропейський університет, де б не працювали б з R. Дуже багато серйозних компаній (наприклад, Boeing) встановлюють R для роботи. R для статистиків - це дійсно глобально.

Розділ 1. Історія виникнення

R виник як вільний аналог середовища S-PLUS, яка в свою чергу є комерційною реалізацією мови розрахунків S.

Мова S - досить стара розробка (майже як TEX). Він виник ще в 1976 році в компанії Bell Labs, і був названий, природно, «за мотивами» мови С. Перша реалізація S була написана на FORTRAN і працювала під керуванням операційної системи GCOS. У 1980 р реалізація була переписана під UNIX, і з цього моменту S став поширюватися, поки ще в основному в науковому середовищі. Починаючи з третьої версії (1988 р), комерційна реалізація S називається S-PLUS. Остання в даний час поширюється компанією Insightful, і доступна під Windows і різні версії UNIX, природно, за плату, причому вельми і вельми не малу. Власне кажучи, саме висока ціна і стримувала широке поширення цього у багатьох відношеннях чудового продукту. Тут-то і починається історія R.

У серпні 1993р. двоє молодих новозеландських вчених анонсували свою нову розробку, яку вони назвали R. За задумом творців (Robert Gentleman і Ross Ihaka), це повинна була бути нова реалізація мови S, що відрізняється від S-PLUS деякими деталями, наприклад, зверненням з глобальними і локальними змінними, а також роботою з пам'яттю. Фактично, вони створили не повний аналог S-PLUS, а нову «гілку» на «дереві S». Багато речей, які відрізняють R від S-PLUS, пов'язані з впливом мови Scheme.

Спочатку проект розвивався досить повільно, але коли в ньому з'явилося достатньо можливостей, в тому числі унікальна по легкості система написання доповнень або пакетів, все більша кількість людей стало переходити з SPLUS на R. Коли ж, нарешті, були усунені властиві першим версіями проблеми з пам'яттю, то серед користувачів R стали з'являтися і «любителі» інших статистичних пакетів (перш за все тих, які мають інтерфейс командного рядка: SAS, Stata, SYSTAT). Кількість книг, написаних про R, за останніми роками зросла в кілька разів, а кількість пакетів вже наближається до півтора тисячам.

Ідея центральної системи зберігання і поширення пакетів - CRAN відомого як Comprehensive R Archive Network була запозичена з TEX-спільноти (CTAN, або Comprehensive TeX Archive Network; аналогічної схемою користується і Perl-спільнота: CPAN або Comprehensive Perl Archive Network). Всі три згаданих проекту об'єднує одне: стабільна база і безліч доповнень. На відміну від додавання нової функціональності в монолітну програму, якісний пакет може порівняно легко написати одна людина за цілком доступний проміжок часу.

2 - Як завантажити і встановити R

Оскільки R - вільна система, то його можна завантажити і встановити абсолютно вільно. Є кілька способів, які залежать від того, яка у Вас операційна система

GNU / Linux - Якщо у Вас який-небудь з поширених дистрибутивів, то R напевно входить в репозиторій «присутніх» у Вашій системі пакетів. Єдине, що потрібно врахувати - оновлення пакетів часто відстає від виходу версій.

Версія R нумерується трьома числами, перші два - це головна версія, яка оновлюється двічі на рік. З кожною головною версією в R привносяться зміни, причому часто досить значні. Як правило, це безліч нових команд, виправлені алгоритми виконання старих, і, зрозуміло, виправлення помилок. До недоліків зміни версії можна віднести можливі проблеми з зворотну сумісність. Природно, розробники намагаються мінімізувати такі зміни. З іншого боку, написані на R програми п'яти-семирічної давності, як правило, працюють без проблем. У загальному і цілому, мораль така: оновлюйте R сміливо, але при цьому завжди читайте список змін.

На кожну головну версію виходить, як правило, дві мінорних версії (Нульова і перша). Перша мінорна версія зазвичай нічого нового, крім виправлення помилок, не містить. Таким чином, якщо Ви хочете завжди мати найсвіжішу версію, то репозиторій пакетів особливо в разі стабільних дистрибутивів не підходить.

Компіляція R з вихідного коду дуже проста і не вимагає якихось особливих бібліотек. Тому, якщо процес компіляції не лякає, то зібрати R з вихідних не важко.

Mac OS X - Для того, щоб почати працювати з R в Mac OS X, потрібно спочатку переконатися, що у Вас остання версія цієї операційної системи. Останні версії R виходять тільки під Mac OS 10.4.x ("Tiger", версія під 10.5.x "Leopard" зараз в розробці). Настановний пакет викачується з CRAN. Майте на увазі, що графічна оболонка R для Mac ("R Mac GUI") оновлюється швидше, ніж сам R, тому розробники передбачили можливість скачування і установки оболонки окремо. Установка відбувається практично також, як установка будь-якої програми під Mac.

Ще потрібно відмітити, що R завоював собі популярність не в останню чергу тим, що він запускався під Macintosh, тоді як S - PLUS під цю платформу був недоступний.

Windows - Для того, щоб запускати R, можна мати будь-які версії цієї операційної системи, починаючи з Windows 95. Як і у попередньому випадку, настановний пакет викачується з CRAN. Знову-таки, установка нагадує звичайну для середовища Windows. Є інсталятор, який ставить декілька питань, від відповідей на які нічого серйозного не залежить. Після інсталяції з'являється ярлик, клацаючи на якому, можна запускати R. Тут цікаво відмітити, що Windows- інсталяція R являється, як це прийнято зараз говорити, "portable", і може запускатися, наприклад, з USB- флешки або CD. R робить пару записів в реєстр, але для роботи вони абсолютно не критичні. Єдине, потрібно мати на увазі те, що робоча тека має бути відкрита для запису, інакше нікуди буде записувати результати роботи.

Є одна, важлива для усіх операційних систем особливість: R (на відміну від того ж S - PLUS) тримає усі свої обчислення в оперативній пам'яті, тому якщо в процесі роботи, наприклад, вимкнеться живлення, то результати сесії, не записані явним чином у файл, пропадуть. Ця особливість, на жаль, також не дозволяє R працювати з дійсно великими об'ємами (близько сотень тисяч і більше за записи) даних, віддаючи їх на відкуп набагато менш зручній системі аналізу ROOT.

3. – Як почати працювати в R

Передбачається, що програмне середовище R вже встановлене, тому приступимо. . .

3.1 – Запуск

Знову-таки, кожна операційна система має свої особливості роботи. Але в цілому можна сказати, що під все три згадані вище операційні системи існує так званий "термінальний" спосіб запуску, а під Mac і Windows є і штатна GUI з деякими додатковими можливостями (різними в різних ОС). Термінальний спосіб простий: досить в командному рядку набрати:

| => R

Ми отримаємо ось таке повідомлення



і з'явиться запрошення у вигляді символу >. Тепер можна приступати до роботи. > Під Windows це трохи складніше - необхідно викликати програму R.exe, причому для цього потрібно або "знаходитися" в тій же папці, де знаходиться ця програма, або шлях до цієї папки має бути прописаний в змінній PATH. Крім того, для того, щоб в російськомовній Windows ввідний екран був читаний, потрібно змінити у вікні терміналу кодування (chcp 1251) і поставити відповідний шрифт (скажімо, Lucida Console).

Якщо термінал запущений без графічного середовища, то усі зображення "скидатимуться" в один багатосторінковий PostScript- файл Rplots.ps. Під Mac це відбуватиметься навіть якщо X11 запущений, так що повноцінно використати R під Mac можна тільки в GUI- варіанті. Термінальний запуск під Windows таких обмежень не має.

Надалі домовимося, що під "сесією R " ми матимемо на увазі термінальний запуск під X11 в GNU/Linux і GUI- запуск в Windows і Mac. GUI під ці операційні системи побудовані так, що вони все одно запускають терминал-подобное вікно. Спілкування з R можливо тільки в режимі діалогу, "команда-відповідь". Повноцінного GUI з R не поставляється, хоча існують численні спроби створити таку систему. Поки усі ці спроби далекі від завершення. Можливо, це і до кращого, оскільки система з меню-віконець-опцій не здатна замінити повноцінний інтерфейс командного рядка, особливо у разі таких складних систем як R. Цікаво, що S - PLUS має дуже пристойний GUI, але якщо відкрити будь-який підручник по цій системі, то можна помітити, що автор настійно рекомендує користуватися командним рядком.

> Для R GUI під Windows існує можливість запустити його в много- (MDI) і одновіконному (SDI) режимах. Для використання настійно рекомендується одновіконний режим (SDI), тим більше що усі інші реалізації R тільки його і "уміють".

При запуску R, насамперед з'являється ввідний екран. Якщо виконання програми робиться в оточенні з російською локалью, то стандартне введення буде виведено по русски. Якщо з якоїсь причини потрібно незлокалізований R, то в цьому випадку можна встановити змінну LANGUAGE, а саме створити файл Renviron.site, в який внести рядок

LANGUAGE=en

Цей файл повинен знаходитися в так званій "домашній" директорії R. Детальніше про це можна дізнатися, якщо прочитати допомогу по команді Startup. Під Linux викликати незлокалізований R іншими способами, наприклад, вказавши мову локали прямо в командному рядку:

=> LANG=POSIX R

3.2 – Перші кроки

Перш ніж почати працювати, потрібно зрозуміти, як вийти. Для цього досить ввести одну команду і відповісти на одне питання:



Вже такий простий приклад демонструє, що в R будь-яка команда - це функція, якій можна передати аргумент. Навіть якщо аргумент не вказаний, то дужки все одно потрібно вказати. Якщо цього не зробити, то замість виходу з R на екран буде виведено визначення функції :



Для того, щоб дізнатися як правильно викликати функцію слід навчитися користуватися вбудованою довідкою. Є два шляхи. Перший - викликати команду довідки :

> help (q)

Або

> ?q

Текст довідки буде виведений в основному вікні програми. Якщо уважно прочитати текст, то стає ясно, що вийти з R можна і не відповідаючи на додаткове питання, якщо ввести:

> q("no")

Навіщо ж потрібне це питання? Або, іншими словами, що буде, якщо відповісти позитивно? В цьому випадку в робочу теку R (ту, з якої він викликаний), запишуться два файли: бінарний .RData і текстовий .Rhistory. Перший містить усі об'єкти, створені за час сесії. Другий - повну історію введених команд. R працює з історією команд стандартним чином: доступ до попередньої команди здійснюється через клавішу-стрілку "вгору", а пошук в історії команд по комбінації ^r. Якщо при виході зберегти файл .Rhistory, то команди з цієї сесії команди будуть доступні і в наступній за умови, що R буде викликаний з тієї ж самої теки. І навпаки, якщо випадково зберегти робоче середовище (ці два файли), то при наступному старті вони завантажаться автоматично. Іноді така поведінка R стає причиною різних подивів, так що необхідно бути уважним!

Итак, як увійти і як вийти, вже зрозуміло. Залишилося ще трохи сказати про допомогу. Її можна викликати декількома різними способами. По-перше, за допомогою команд ? чи help (), як написано вище. По-друге, можна викликати команду help.start (). В цьому випадку відкриється вікно браузеру, в якому демонструватиметься так звана HTML- допомога. Основна її перевага перед звичайною текстовою допомогою в тому, що її розділи сполучені гіперпосиланнями (у Mac OS X така допомога викликається звичайними командами). У третіх, разом з R встановлюється декілька керівництва у форматі PDF. Їх можна знайти в теці, що містить документацію Нарешті, часто буває потрібна "зворотна" допомога - Ви знаєте, що Ви хочете, але не знаєте, як це зробити (яку команду викликати). В цьому випадку можуть допомогти дві команди: help.search () і apropos (). От як їх потрібно викликати:

> help.search("vector")

Результатом виконання команди буде список команд з коротким описом їх дії. Команда apropos () видасть просто список команд, що містять рядок, який був в лапках. До речі, зверніть увагу на лапки. Їх потрібно обов'язково використати в цих командах. Лапки можна використати і в звичайних командах допомоги, наприклад, help ("q") або "?q", причому іноді ці команди без лапок просто не працюють (наприклад, не можна отримати довідку по символу плюса, якщо ввести ?+, потрібно вводити "?+"). Якщо нічого не допомагає, і знайти потрібну функцію не вдається, то доводиться звертатися за довідкою в Інтернет або в список розсилки R - help.

4 – Калькулятор

Калькулятор-переросток - Так назвав один з ввідних розділів своєї книги "Introduction to R " один з творців системи, Peter Dalgaard. Це означає просто, що R можна використати у тому числі і як звичайний калькулятор.

Наприклад:



Для знайомих з інтерактивними мовами програмування типу Python тут немає нічого особливо нового. Єдина цікава деталь - це одиничка в квадратних дужках. Вона означає номер елементу вектору. Звідси відразу два логічні висновки:

1) R результат будь-якої операції з числами трактує як вектор одиничної довжини. Скалярів в R, взагалі кажучи, просто немає;

2) Елементи векторів нумеруються з одиниці, а не з нуля, як у багатьох мовах програмування.

Для, менш знайомих з програмуванням, відмітимо, що порядок арифметичних дій в R стандартний, знайомий з шкільної математики. Дужки (що розкриваються зсередини назовні) дозволяють цей порядок дій міняти:



Ці приклади поскладніші, крім того, в них є "підводні камені". Чому різниця 3/7-0.4285714 не дорівнює нулю, повинно бути зрозуміло таким, що усім, що знає арифметику. R при виведенні на консоль "невидимо" використовує функцію print (), яка округлює нескінченний періодичний дріб 0, (428571). Другий приклад цікавіший. Твір двох квадратних коренів з двійки повинен давати 2, що і відбувається. Проте якщо відняти з результату 2, вийде якесь дуже маленьке число (4,440892 × 10 − 16). Це відбувається через те, що обчислення виконуються на комп'ютері, який тільки прикидається, що працює з дробами, тоді як насправді оперує тільки з цілими числами. Будь-яка комп'ютерна система розрахунків працює так само, і з цим можна тільки змиритися. Ще один момент: наведені приклади показують, як можна користуватися символом коментаря (#).

І ще трохи про роботу з аргументами на прикладі команди round () ("округлити"). Вона має два аргументи: число, яке треба округлити, і значення digits, що повідомляє, до якого знаку округлювати. Система аргументів працює розумно, так що все одно, чт´про написати:



Це відбувається завдяки тому, що є значення аргументів за умовчанням. Наприклад, в даному випадку значення аргументу за умовчанням digits - "0". Про це говорить і результат виведення команди args():



Можна помітити також, що деякі аргументи мають імена. В результаті аргументи можна викликати не по порядку, а по іменах. Імена ж можна скорочувати аж до однієї букви, але тільки якщо немає різних аргументів, які від такого скорочення стануть невиразні. Можна викликати аргументи по порядку, через кому (не забудьте, що для десяткових дробів використовується точка!), і тоді дозволяється не використати імен.

5 – Скрипти

Просто відкрити сесію R і вводити у вікно програми команди, одну за іншою - це лише один з можливих способів роботи. Набагато продуктивніший метод, який являється заразом і серйозною перевагою R, - це створення скриптів. Інакше кажучи, програм, які потім завантажуються в R і інтерпретуються ім. З самого початку роботи слід створювати скрипти, навіть для таких завдань, які здаються дріб'язковими, - це в майбутньому значно заощадить Ваш безцінний час.

Створення скриптів з будь-якого приводу і навіть без особливого приводу - одна з основ культури роботи в R. Створити скрипт дуже просто. Припустимо, після відкриття сесії була введена необхідна для отримання шуканого результату послідовність команд. Щоб зробити свою роботу відтворної - потрібно просто зберегти історію команд. Краще всього це зробити за допомогою команди:



Після цього в поточній теці з'являється файл myscript.r, який можна відредагувати улюбленому текстовому редакторові, а потім завантажити в R командою:



Опція echo додана для того, щоб можна було бачити самі команди, а не тільки результат їх виконання.

Є ще ефективніший спосіб роботи : Ви відкриваєте Ваш скрипт в текстовому редакторові, а потім посилаєте окремі його рядки прямо в R. Є декілька редакторів, які уміють так робити. По-перше, це Emacs зі встановленим пакетом ESS ("Emacs Speaks Statistics"). Привабливість цієї системи в тому, що R запускається прямо в одному з вікон редактора. По-друге, штатні R GUI під Windows і під Mac також мають вбудовані редактори скриптів. На жаль, Windows- редактор не підсвічує синтаксис, і взагалі досить незручний. Замість нього тим користувачам, яких лякає перспектива освоєння Emacs, можна порекомендувати відмінний редактор Tinn - R, спеціально "заточений" під таку роботу.

Скрипт R можна виконати і не запускаючи інтерактивну сесію. Для цього використовуються спеціальні опції командного рядка. Ось так можна, наприклад, виконати наш скрипт-приклад:

| => R --no-save < myscript.r > out

Опція - no - save говорить R не зберігати результати сесії у файлі історії .RData/.Rhistory (фактично, відповідає "no" на згадане вище завершальне питання).

6 – Пакети

Ще одна важлива перевага R - наявність для нього численних розширень або пакетів буквально на усі випадки життя. При установки R на комп'ютер, декілька пакетів вже в наявності: так звані базові пакети, без яких система просто не працює (скажемо, пакет,



який так і називається base, або пакет grDevices, який управляє виведенням графіків), і ще "рекомендовані" пакети (пакет для спеціалізованого кластерного аналізу cluster, пакет для аналізу нелінійних моделей nlme і ін.). Крім того можна поставити будь-якій з майже півтора тисяч (!) доступних на CRAN пакетів. При доступному Інтернеті, це можна зробити прямо з R командою install.packages () (а під Mac і Windows є відповідні пункти в меню). Якщо з'єднання з мережею гірше, то можна викачати початкові тексти пакетів (під GNU/Linux) або скомпільовані пакети (під Mac або Windows) і встановити прямо з диска. Після скачування первинників пакету перед використанням спочатку його треба скомпілювати, тому що багато пакетів утримують код на FORTRAN або C. Для цього є спеціальна форма виклику R:

| => R CMD INSTALL package.tar.gz

Авжеж, це усе слід робити якщо R встановлюється не і із стандартного депозитарія дистрибутива GNU/Linux. У разі стандартної установки можна пошукати пакети по поєднанню cran. У Debian GNU/Linux Etch таких пакетів рівно 85 - це не 1500 пакетів з CRAN, але швидше за все там вже є багато що з того, що необхідно. Як тільки пакет встановлений, то він відразу готовий до роботи. Треба тільки ініціалізувати його перед вживанням. Для цього служить команда library ().

1 – R і робота з даними

Підготовка даних до роботи - це одна з найбільших проблем для новачка в R. Сама по собі обробка даних детально описана в різному керівництві і посібниках, а ось інформація як добитися того, щоб R прочитав приготовані в іншій програмі дані, як правило, опускається. Чому це так очевидно: вхідні дані можуть мати занадто різний формат, щоб написати з цього питання вичерпне і компактне керівництво.

Дані можна представити в текстовому або у бінарному виді. Не вдаючись до деталей, приймемо, що текстові дані - це дані, які можна прочитати і відредагувати в текстовому редакторові (Emacs/Vi і інше). Для того, щоб відредагувати бінарні дані, як правило, потрібна програма, яка ці дані зробила. Текстові дані для статистичної обробки - це текстові таблиці, де кожен рядок відповідає рядку таблиці, а колонки визначаються за допомогою роздільників. Зазвичай як роздільники текстових даних використовуються пробільні символи (пропуск, табуляція і тому подібне), коми або крапки з комою.

Перше що потрібно зробити перед читанням даних - це переконатися, що поточна директорія в R і та директорія, де знаходяться дані одно і те ж. Для цього в запущеній сесії R потрібно ввести команду:



Нехай це зовсім не та директорія, в якій лежать дані. Поміняти робочу директорію можна командою:



Як завжди, розгорнуту довідку можна отримати за допомогою функції виклику довідки help (getwd). Далі слід перевірити, а чи є в поточній директорії потрібний файл:



Ось тепер можна і завантажити дані. За читання табличних текстових даних відповідає команда read.table():



Все дуже просто за винятком того, що перед читанням треба знати в якому форматі зберігаються дані. Тобто те, що у стовпців є імена (head=TRUE) і роздільником є крапка з комою (sep=";"). Функція read.table () дуже хороша, але не настільки розумна, щоб визначати формат даних на льоту. Щоб подивитися вміст файлу не виходячи з R, можна скористатися функцією file.show():



У R багато команд, у тому числі і read.table (), мають для аргументів значення за умовчанням. Наприклад, значення sep за умовчанням рівне "". В даному випадку це означає, що роздільником є будь-яка кількість пропусків або знаків табуляції, тому якщо дані замість точок з комами розділені пробільними символами, то аргумент sep можна не вказувати. Природно, буває божевільна безліч різних окремих випадків, і скільки б зусиль не було докладено, все не описати. Відмітимо, проте, ще декілька важливих моментів:

1) Файли можна завантажувати і з інших директорій, при цьому можна використати відносну адресацію:



2) Російський текст у файлах читається без проблем, якщо він набраний в кодуванні співпадаючою з поточною локалью. Нехай локаль ru _ RU.UTF - 8, а сам файл закодований в KOI8 - R, тоді при його читанні слід скористатися функцією file () :



3) Іноді треба, щоб R прочитав окрім імен стовпців ще і імена рядків. В цьому випадку в першому рядку повинно бути на одну колонку менше, ніж в тілі таблиці (у цьому прикладі три замість чотирьох) :



4) За вітчизняними правилами в якості десяткового роздільника треба використати кому, а не точку. Якщо хтось при підготовці початкових даних цим правилам послідував, то необхідно перевизначити аргумент dec:



Зверніть увагу на скорочене позначення аргументу і його значення (h=T). Скорочувати можна і треба, але з обережністю, тому в далі в цьому тексті завжди буде саме TRUE/FALSE.

В цілому, з текстовими таблицями великих проблем не виникає. Різні екзотичні текстові формати, як правило, можна перетворити до "типових" якщо не за допомогою R, то за допомогою яких-небудь численних текстових утиліт (аж до "важкоатлетів" типу мови Perl). А ось з "сторонніми" бінарними форматами справа йде набагато гірше. Тут, передусім, виникають проблеми, пов'язані з повністю закритими форматами, наприклад, такими як формат популярної в певних кругах програми MS Excel. Взагалі кажучи, відповідь на питання: "Як прочитати бінарний формат в R"? - часто зводиться до ради за зразком відомого анекдота: "вимкнемо газ, виллємо воду і повернемося до умови попереднього завдання". Тобто потрібно знайти спосіб, який дозволить перетворити бінарні дані в звичайні текстові таблиці. Проблем на цьому шляху виникає зазвичай не надто багато, але аж надто вони різноманітні.

Другий шлях - це знайти спосіб прочитати дані в R без перетворення. Спеціально для цих цілей в R є пакет foreign, який може читати бінарні дані, що виводяться пакетами Minitab, S, SAS, SPSS, Stata, Systat, а також формат DBF. Щоб дізнатися детальніше про визначені в цьому пакеті команди, потрібно завантажити пакет і викликати загальну довідку:



Що ж до все того ж горезвісного формату Excel, то тут справа гірша. Є не менше п'яти різних способів, як завантажувати в R ці файли, але усі вони мають обмеження. До того ж новий формат MS Excel 2007 доки взагалі не підтримується. З усіх способів найпривабливішим видається обмін з R через буфер. Якщо відкрити в OpenOffice Calc xls- файл, те можна скопіювати у буфер будь-яка кількість осередків, а потім завантажити їх R:



Це дуже просто, і головне, працює з будь-якою Excel- подібною програмою. Тут слід зазначити ще одну річ: ні в якому разі не рекомендується робити який-небудь статистичний аналіз в програмах електронних таблиць. Не кажучи вже про те, що інтернет просто забитий статтями про помилки в цих програмах і/або в їх статистичних модулях, це ще і украй невірно ідеологічно.

Ресурси:

Підручник «введення в R» (Venables, Smith, 2014 року),

книга (Kabacoff, 2011),

керівництво (Lam, 2010).
скачати

© Усі права захищені
написати до нас