Реферати, курсові, дисертації, дипломи

[ Комп`ютер і текст ]

<div style="font-size:16px;text-align:justify;">
	<TABLE> В інформатиці текстом вважають послідовність будь-яких <a href="Символ" title="Символ">символів</a>. Зараз комп'ютери в основному користуються алфавітами, що містять 256 знаков1. Кожному із символів <a href="Відповідь" title="Відповідь">відповідає</a> свій восьмирозрядний двійковий код. Таким чином будь-який <a href="Символ" title="Символ">символ</a> тексту, включаючи пробіли, займає 8 біт (1 байт) в пам'яті комп'ютера. Знаючи це, можна легко оцінити обсяг пам'яті, необхідний для зберігання <a href="Того" title="Того">того</a> чи іншого текстового документа. Згадаймо, як пов'язано кількість біт у коді з тим, скільки потрібно різних кодів. Один біт (двійкова цифра) може приймати два значення, додавання кожного розряду в код подвоює кількість одержуваних комбінацій: двухбітовий код - чотири варіанти, трехбітовий - вісім, четирехбітовий - шістнадцять і т. д. Розглянемо приклад. Машинописна сторінка <a href="Стандарт" title="Стандарт">стандартного</a> формату (А4) містить близько 55 рядків. На кожному рядку міститься в середньому 60 сімволов2. Підрахуємо кількість текстової інформації на такій сторінці. Кожен символ - 1 байт інформації, а всього символів - 60 * 55 = 3300. Значить, на сторінці 3300 байт (близько 3 Кбайт). Як пов'язані двійкові коди та <a href="Відповідь" title="Відповідь">відповідні</a> їм символи? Це визначається <a href="Таблиці" title="Таблиці">таблицею</a> <a href="Кодування" title="Кодування">кодування</a>. Всі використовувані на <a href="Персонал_21" title="Персонал 21">персональних</a> комп'ютерах табліци3 засновані на американському <a href="Стандарт" title="Стандарт">стандарті</a> ASCII4. <a href="Він" title="Він"> Він</a> визначає перші 128 кодів: для <a href="Латинська" title="Латинська">латинських</a> літер, цифр, основних знаків пунктуації та <a href="Математика" title="Математика">математичних</a> операцій. Решта 128 кодів використовуються для спеціальних символів і букв національних алфавітів (у тому числі, російського). І, оскільки загальноприйнятого <a href="Стандарт" title="Стандарт">стандарту</a> для цього не було, виникло багато різних кодувань, у тому числі, кілька - для кірілліци5. <a href="Саме" title="Саме"> Саме</a> тому, отримавши від кого-небудь <a href="Текст" title="Текст">текст</a> і спробувавши прочитати його на своєму комп'ютері, ми часто бачимо на екрані набір незрозумілих "закорючек". <table border=0><TR><td> код </td><td> CP866 </td><td> CP1251 </td><td> KOI-8R </td><td> Mac </td></TR><TR><td> 01011010 </td><td> Z </td><td> Z </td><td> Z </td><td> Z </td></TR><TR><td> 10001111 </td><td> П </td><TD><img height=9 src=dopb477091.zip alt="Комп'ютер і текст" width=9></TD><TD><img height=9 src=dopb477092.zip alt="Комп'ютер і текст" width=9></TD><td> П </td></TR><TR><td> 11111101 </td><td> $ </td><td> е. </td><td> Щ </td><td> е. </td></TR></TABLE> У такій ситуації на допомогу приходять програми-конвертори6. Вони замінюють двійковий код кожного <a href="Символ" title="Символ">символу</a> на код, яким <a href="Такий" title="Такий">такий</a> символ представляється в іншому кодуванні. Це відповідність визначається таблицею перекодування. Зазвичай користувач повинен вказати, з якої кодування в яку йде <a href="Перетворення" title="Перетворення">перетворення</a>, однак з'явилися й програми, які вміють <a href="Автоматика" title="Автоматика">автоматично</a> визначати кодування початкового тексту. Прагнення спростити роботу з різними текстами (спершу текстами програм, потім службовими документами, <a href="Газета" title="Газета">газетами</a>, журналами, книгами і т.д.) призвело до створення безлічі програм, спеціально орієнтованих на це - текстових редакторів (або текстових процесорів). Якими ж даними оперують ці програми? Очевидно, що найменшим об'єктом буде символ. Однак можна працювати не тільки з окремими символами, але і зі словами, рядками, абзацами, довільними фрагментами і текстом у цілому. Деякі дії можна виконати з будь-якою з цих структур, інші - тільки з какй-то визначеною. Оброблюваний <a href="Текст" title="Текст">текст</a> представляється як би у вигляді рулону "папери", який можна прокручувати на екрані вперед і назад. Більшість сучасних програм дозволяє одночасно працювати з декількома текстами, кожен з яких виводиться в окреме вікно. Крім основних "листів" текстовий <a href="Процесор" title="Процесор">процесор</a>, як і інші програми використовує "конверт" (або "кишеню"), в якому можна тимчасово зберігати фрагмент тексту при його копіювання або переміщення. Текстовий процесор - не просто замінник друкарської машинки, а універсальний засіб для <a href="Роботи" title="Роботи">роботи</a> з текстами. Він надає дуже широкі можливості маніпулювання текстовими документами. Окрім таких очевидних операцій як набір тексту, видалення, копіювання і переміщення його фрагментів, а також збереження на диск і друк, є можливість змінювати шрифт, його накреслення, колір і розмір. Текстовий процесор може автоматично форматувати текст (включаючи установку абзацного відступу і вирівнювання). Можна відразу у всьому тексті замінити одне задане <a href="Слово" title="Слово">слово</a> на інше. Наприклад, поміняти "ЕОМ" на "комп'ютер". Багато редактори вміють перевіряти орфографію: комп'ютер шукає кожне слово в своєму <a href="Словник" title="Словник">словнику</a> і, якщо не знаходить, повідомляє <a href="Про_Це" title="Про Це">про це</a> користувачеві, пропонуючи можливі варіанти виправлення. <h2> Примітки </h2> Новий <a href="Стандарт" title="Стандарт">стандарт</a> Unicode, на який здійснюється поступовий перехід, дозволяє використовувати 216 = 65536 (а в останній версії - 232) символів. <a href="Текст" title="Текст"> Текст</a> в такій кодуванні буде займати істотно (у середньому - удвічі) більше пам'яті. [Примітка до примітки: реальні системи використовують не безпосередньо Unicode (UTF-32), а уявлення UTF-8 і UTF-16. У першому з них символ може займати від 1 до 6 байт, у другому - 2 або 4 байти] Це - приблизні значення для російської друкарської машинки. В англомовних <a href="Країна" title="Країна">країнах</a> зазвичай використовують більш дрібний шрифт. <a href="Мова" title="Мова"> Мова</a> йде про "стандартних" <a href="Шрифти" title="Шрифти">шрифти</a>. Крім них існують також шрифти, що містять (замість літер і цифр) спеціальні, наприклад декоративні, символи. American Standard Code for Information Interchange - <a href="Американский" title="Американский">Американський</a> <a href="Стандарт" title="Стандарт">стандартний</a> код обміну інформацією. У Росії широко використовуються в даний час чотири кодування: CP866 ("DOS-альтернативна". Для PC-сумісних комп'ютерів під <a href="MS-DOS" title="MS-DOS">MS-DOS</a> і OS / 2, а також в аматорській комп'ютерної <a href="Мережі" title="Мережі">мережі</a> Fido); CP1251 (Для PC-сумісних комп'ютерів під <a href="Windows" title="Windows">Windows</a>, а також на більшості сайтів WWW); KOI-8R (Комп'ютери під UNIX, <a href="Електронна_пошта" title="Електронна пошта">електронна пошта</a> та конференції Internet); Mac-Cyrillic (Макінтош-сумісні комп'ютери). Converter (англ.) - перетворювач. </table>
	</div>

Будь ласка, не зберігайте тестовий текст.
Ваш ip: 3.15.221.67 буде збережений.

категорії
за типом
за алфавітом
завантажені