Санкт-Петербурзький державний технічний університет
Методи визначення вторинної структури білків
Посібник для проведення лабораторних робіт
на кафедрі біофізики фізико-механічного факультету СПБДТУ
Інфрачервона спектроскопія і спектроскопія кругового дихроїзму.
Захаров В.В.
1999
Зміст
Введення
1. Спектри кругового дихроїзму білків
1.1 Явище кругового дихроїзму
1.2 Методи аналізу спектрів кругового дихроїзму білків
1.3 Робота з пакетом програм STRUCTURE з аналізу спектрів КД білків
2. Інфрачервоні спектри поглинання білків
2.1 Поглинання білків в ІК-області
2.2 Методи аналізу ІЧ-спектрів білків
2.3 Робота з пакетом програм STRUC з аналізу ІЧ-спектрів білків
Список літератури
Введення
Хромофори білкових молекул (тобто хімічні групи в молекулі білка, відповідальні за поглинання світла на певних довжинах хвиль) можна розділити на три класи: пептидні групи, бічні групи амінокислотних залишків і простетичні групи. Спектроскопічні методи дослідження вторинної структури білка засновані на вивченні спектрів саме пептидних хромофорів, оскільки конформація пептидних груп і визначає той або інший тип вторинної структури білка - a-спіраль, b-структуру та ін Вивчення поглинання світла пептидними групами білка зазвичай проводиться в ультрафіолетовому і в інфрачервоному діапазонах. Як показують експерименти, проста адсорбційна спектроскопія білків у неполяризованим ультрафіолетовому світлі мало придатна для аналізу вторинної структури білка. Більш цінну інформацію можна витягти зі спектрів кругового дихроїзму білка. Інфрачервоні спектри поглинання білка також придатні для аналізу його вторинної структури [1]. Нижче буде розглянуто застосування методів вимірювання кругового дихроїзму та інфрачервоної спектроскопії для аналізу вторинної структури білка.
1. Спектри кругового дихроїзму білків
1.1 Явище кругового дихроїзму
Білки, як практично всі біологічні молекули, внаслідок своєї просторової асиметрії мають оптичну активність. При проходженні через оптично активне середовище плоскополяризоване світло стає еліптично поляризованим. Еліптичність світла q є одним із заходів оптичної активності. Вона визначається як арктангенс відносини малої і великої осей еліпса. Іншим параметром, що характеризує оптичну активність, є відхилення великої осі еліпса від напрямку поляризації падаючого світла, зване оптичним обертанням (або дисперсією оптичного обертання) j.
Якщо уявити плоскополяризоване хвилю Е у вигляді суми двох хвиль протилежної кругової поляризації Е = Е L + Е R, то можна показати, що величина j пропорційна різниці показників заломлення середовища для цих хвиль n L - n R, а величина q - різниці коефіцієнтів екстінціі e L - e R. Таким чином, оптичне обертання і поява еліптичної поляризації у плоскополяризоване світла при проходженні його через оптично активне середовище можна пояснити різним уповільненням (n L ¹ n R) і поглинанням (e L ¹ e R) двох його складових Е L і Е R, поляризованих по колі. Різниця D n = n L - n R називають круговим двулучепреломление, а різниця De = e L - e R - круговим дихроїзм. Залежності цих величин від довжини хвилі називають спектрами дисперсії оптичного обертання (ДОВ) і кругового дихроїзму (КД).
Насправді, ДОВ і КД є проявами одного і того ж фізичного явища, а їх спектри можна виводити один з іншого. Тому на практиці досить вимірювати лише один з цих двох спектрів. Спектри КД більш зручні для використання на практиці, оскільки містять вузькі, добре розв'язні смуги. Цим пояснюється те, що в даний час метод вимірювання КД використовується набагато ширше, ніж ДОВ, незважаючи на те, що він вимагає набагато більш складного експериментального обладнання.
КД легко виміряти шляхом поперемінного пропускання через зразок ліво - і правополярізованного по колу світла і реєстрації відповідної різниці поглинань, оскільки еліптичність виходить з оптично активного зразка світла звичайно дуже мала, і її точне вимір дуже важко. Однак, різниця поглинань зазвичай перераховують у значення еліптичності. Для того, щоб можна було порівнювати результати, отримані при дослідженні різних зразків, користуються значеннями так званої молярної еліптичності:
[Q] = 100 q / Cl = 3300 De, (1.1.1)
де С - молярна концентрація, а l - довжина оптичного шляху.
У випадку білків головною метою вимірювання спектрів КД є визначення вмісту в них вторинних структур різних типів. Якщо частка ароматичних амінокислот у білку не дуже велика, його оптична активність в області від 180 до 240 нм визначається головним чином поліпептидним остовом. Численні експерименти показали, що аліфатичні бічні групи амінокислотних залишків білка також не дають помітного внеску в спектр КД в цій області. Отже, в першому наближенні білкову молекулу можна розглядати просто як комбінацію ділянок поліпептидним кістяка, що знаходяться в конформаціях a-спіралі, b-структури і безладного клубка.
Поглинання світла пептидного групою
в ультрафіолетовому діапазоні визначається електронними переходами в її електронних оболонках. У цьому процесі основну участь приймають три молекулярних орбіталі пептидної групи: n-орбіталь - несвязивающая орбіталь, на якій розташовується неподіленої пара 2 p y-електронів атома кисню, p-орбіталь - зв'язує орбіталь, на якій знаходяться 2 p z-електрон атома кисню і 2 p z-електрон атома вуглецю, в значній мірі делокалізовані по атомам кисню, вуглецю та азоту, і p *- орбіталь - розпушуються орбіталь, на якій в основному стані електрони відсутні. Два електронних переходу з найменшою енергією спостерігаються при порушенні електрона з n-орбіталі на p *- орбіталь (n ® p * перехід) і з p-орбіталі на p *- орбіталь (p ® p * перехід). N ® p * переходу в пептидах відповідає слабка смуга поглинання 210-220 нм, а p ® p * переходу набагато сильніша смуга з максимумом поблизу 190 нм (характерна для a-спіральної конформації).
КД різних типів вторинної структури білка можна оцінити за результатами вимірювання КД гомополіпептідов відомої конформації (наприклад, полі-L-лізину), після чого визначити внесок кожної зі структур в спектр КД досліджуваного білка. Однак, такий підхід має ряд великих недоліків. По-перше, ділянки впорядкованої вторинної структури модельних гомополіпептідов мають значно більшу довжину, ніж довжина типових ділянок в глобулярних білках. По-друге, їх конформація може сильно відрізнятися від конформації, що спостерігається у елементів вторинної структури реальних білків. Крім цього, серед гомополіпептідов не можна знайти "стандартів" для b-вигинів. І, нарешті, хоча внесок у КД від взаємодій між хромофорами зменшується як квадрат відстані між ними, повинен існувати певний внесок від взаємодії між ділянками з різної вторинної структурою. Ці взаємодії не можна адекватно змоделювати, розглядаючи протяжні гомополімери. Тому на практиці спектри КД гомополіпептідов не використовуються. Замість цього в якості базисних беруть спектри КД білків, структура яких відома з даних рентгеноструктурного аналізу. Різні підходи до аналізу досліджуваного спектра КД на основі цього базисного набору визначають відмінності між методами, які будуть описані нижче.
1.2 Методи аналізу спектрів кругового дихроїзму білків
Метод "еталонних спектрів" [2,3]. М етод передбачення вторинної структури білків за їхніми спектрами КД засновані на припущенні про те, що спектри КД різних структурних форм, які складають білкову молекулу, дають адитивний внесок у спектр КД білка в цілому. Це можна записати в наступному вигляді:
(1.2.1)
де - Спектр КД білка (залежність еліптичності від довжини хвилі світла), - Ідеалізований "еталонний спектр" - спектр КД, відповідний i-ої структурній формі, що бере участь в утворенні вторинної структури білка, - Частка цієї форми у вторинній структурі, причому
і . (1.2.2)
Еталонні спектри для всіх структурних форм можуть бути обчислені на підставі набору базисних спектрів КД (спектрів білків з відомою вторинною структурою - коефіцієнтами ) За допомогою методу найменших квадратів і формули (1.2.1), застосованої до кожного базисного спектру. Після цього експериментальний спектр КД досліджуваного білка за допомогою того ж методу найменших квадратів може бути апроксимовані за формулою (1.2.1) з використанням обчислених еталонних спектрів. При цьому внесок кожного з еталонних спектрів буде дорівнює частці відповідної йому структурній формі в загальній структурі білка Такий підхід до аналізу спектрів КД білків був вперше використаний в роботі [2]. Нижче буде докладніше розглянута модифікація цього методу [3].
Беручи до розгляду в якості структурних класів a-спіраль (H), b-структуру (b), b-вигин (t) і "невпорядковану" форму (R), можемо написати:
. (1.2.3)
Підсумовуючи експериментальні дані, замість в рівняння (1.2.3) вводять величину , Що враховує залежність еталонного спектру, відповідного a-спіралі, від числа амінокислотних залишків, що утворюють її:
, (1.2.4)
де і - Еталонні спектри для a-спіралі з n амінокислотних залишків і для a-спіралі "нескінченної" довжини, а k - так званий фактор довжини ланцюга ( ). Згідно з теоретичними розрахунками оптичної активності a-спіралі та експериментальними даними, спектр КД a-спіралі в діапазоні 185-240 нм може бути розкладений на три незалежних оптично активних складових (n ® p *, p ® p | | *, p ® p ^ *), які можна описати гауссовских залежностями:
, (1.2.5)
де і - Положення максимуму і полушіріна j-ої гауссовской лінії в спектрі КД a-спіралі, а - Максимальне значення еліптичності "нескінченної" a-спіралі на довжині хвилі . У остаточному вигляді для спектру КД білка можна написати такий вираз:
, (1.2.6)
де
. (1.2.7)
Тут - Середнє число амінокислот на a-спіральний ділянку ланцюга в молекулі білка.
Параметри , , і в рівнянні (1.2.7) були знайдені на основі спектра КД міоглобіну. Вони мають такі значення:
j | , Нм | , Нм | , Град × см 2 × дмоль -1 | |
1 | 223.4 | 10.8 | -3.73 × 10 | 2.50 |
2 | 206.6 | 8.9 | -3.72 × 10 | 3.50 |
3 | 193.5 | 8.4 | +10.1 × 10 | 2.50 |
Ці параметри для глобулярних білків з досить великою точністю можна вважати постійними. Спроби оцінити для конкретних білків за їхніми спектрами КД виявилися ненадійними. Для більшості досліджених білків цей параметр виявився рівним приблизно 10-11 амінокислот на a-спіральний сегмент. Поширюючи цей факт на всі аналізовані білки, автори даного методу поклали рівним 10.
Внесок b-структури в спектр КД білка виявляється залежним від набагато більшого числа параметрів: не тільки від числа амінокислотних залишків на сегмент, але і від числа ниток в даній ділянці структури та їх спрямованості, тому його опис простим рівнянням, подібним рівнянню (1.2.7 ), неможливо. Те ж саме стосується b-вигину і, особливо, "невпорядкованою" форми, під якою мається на увазі все, що не відноситься до інших класів. Використовувані в даному методі еталонні спектри b-структури, b-вигину і "невпорядкованою" форми є статистично усередненими по білках, використовуваним в якості базисних.
Процедура аналізу спектра КД досліджуваного білка підрозділяється на два етапи. Перший етап полягає в обчисленні еталонних спектрів структурних елементів, тобто значень , , і для довжин хвиль в діапазоні 185-240 нм з інтервалом в 1 нм, на основі експериментальних спектрів КД п'ятнадцяти еталонних білків зі значеннями , , , , , Відомими з рентгеноструктурного аналізу. Еталонний спектр, відповідний a-спіралі, може бути обчислений безпосередньо за формулою (1.2.7). Решта еталонні спектри знаходяться з рівняння (1.2.6) за допомогою методу найменших квадратів, причому для зменшення числа невідомих у цьому рівнянні з експериментального спектру КД кожного еталонного білка виключається внесок a-спіральної форми, обчислений за формулою (1.2.7). Еталонні спектри, обчислені за допомогою даного методу показані на малюнку 1.2.1.
Коли еталонні спектри знайдені, можуть бути обчислені коефіцієнти , , , в рівнянні (1.2.6), застосованому до спектру КД досліджуваного білка. Для цього також використовується метод найменших квадратів. Він полягає в підборі таких коефіцієнтів , Що
minimum. (1.2.8)
Тут - Експериментальний, а - Розрахований за формулою (1.2.6) спектр КД досліджуваного білка; - Число точок у спектрі. Коефіцієнти , Що є рішенням рівняння (1.2.8) з урахуванням умов (1.2.2), представляють собою шукані частки структурних елементів у вторинній структурі білка.
Метод "регуляризації" [4]. Підхід до аналізу спектра КД білка, що лежить в основі попереднього методу, полягає у визначенні еталонних спектрів, які, як можна було б припускати, повністю характеризують структурні елементи, що утворюють вторинну структуру досліджуваного білка. Однак, як показують експериментальні дані, жоден еталонний спектр не може точно описати всі різновиди таких великих і досить невизначених класів, як a-спіраль, b-структура, b-вигин і ін
Конформація елементів вторинної структури глобулярних білків значно відрізняється від ідеальної. Крім цього, внесок кожного структурного класу в спектр КД білка залежить від дуже багатьох параметрів, про які згадувалося вище. Для обліку всього розмаїття типів вторинної структури білків потрібно розширити початковий набір базисних спектрів. У результаті виникає при цьому надмірності початкових даних звичайний метод найменших квадратів стає нестійким до експериментальної помилку і призводить до свідомо невірних результатів. Застосування методу "еталонних спектрів" в тому вигляді, як він описаний у попередньому пункті, на превеликий базисного набору спектрів виявляється, по суті, некоректним.
Цю проблему частково можна вирішити, замінивши метод найменших квадратів моделлю, застосування якої, на перший погляд, не цілком виправдано і адекватно, але зате приводить до стійкого до експериментальної помилку результату навіть у випадку великої кількості параметрів. Застосування такої стабілізуючою моделі дозволяє підійти до аналізу спектрів КД з іншого боку. А саме, з'являється можливість прямого подання спктра КД досліджуваного білка у вигляді лінійної комбінації базисних спектрів. Таким чином вдається повністю уникнути проблеми, пов'язаної з визначенням еталонних спектрів окремих структурних класів і проводити більш гнучкий і точний аналіз з використанням реальних білкових спектрів.
Розглянемо даний метод більш докладно. Припустимо, що нам вдалося представити спектр КД досліджуваного білка у вигляді лінійної комбінації спектрів базисних білків, структура яких відома з рентгеноструктурного аналізу. Позначимо число цих спектрів через (У даному методі = 16). Тоді можемо записати:
, (1.2.9)
де - Спектр КД (еліптичність) досліджуваного білка.
Позначимо частку амінокислот j-ого базисного білка в i-му структурному класі через , Тоді базисні спектри можуть бути представлені у вигляді суперпозиції ідеалізованих еталонних спектрів , Що відповідають окремим структурним класів:
. (1.2.10)
Аналогічно для спектру КД досліджуваного білка:
. (1.2.11)
Підставляючи рівності (1.2.10) і (1.2.11) у рівняння (1.2.9), отримаємо зв'язок шуканих коефіцієнтів з відомими (з рентгеноструктурного аналізу) коефіцієнтами :
. (1.2.12)
Проблема полягає у визначенні коефіцієнтів в розкладанні (1.2.9). У подібних завданнях широко застосовується метод найменших квадратів, що визначає коефіцієнти з наступної умови:
minimum (1.2.13)
з обмеженнями
і . (1.2.14)
Тут і - Експериментальне і розрахована за формулою (1.2.9) значення для еліптичності на довжині хвилі , - Число точок у спектрі.
Згідно з теоремою Гауса-Маркова, серед лінійних незміщені оцінок оцінка, що отримується за допомогою методу найменших квадратів, є найбільш ефективною в тому сенсі, що розраховані з його допомогою коефіцієнти найбільш близькі до своїх істинним значенням. Однак, при великих значеннях метод найменших квадратів стає вкрай нестійким до експериментальної помилку. Підвищення стабільності методу за рахунок зниження величини , У свою чергу, також призводить до помітної помилку.
Автори методу [4] знайшли вихід у використанні замість методу найменших квадратів лінійної зміщеною оцінки, яка визначається наступною умовою:
minimum. (1.2.15)
Ця оцінка є зміщеною і, отже, призводить до систематичної помилку. Проте при великих значеннях вона дає значення ближчі реальним, ніж одержувані за допомогою методу найменших квадратів. Очевидно, що рівняння (1.2.15) також необхідно доповнити умовами (1.2.14).
Розглянемо критерій (1.2.15) більш докладно. При a = 0 ми отримуємо звичайний метод найменших квадратів, не придатний в нашому випадку. При a> 0 другий член у лівій частині (1.2.15) є регуляризатора. Він стабілізує рішення, підтримуючи коефіцієнти малими (близькими до 1 / ). Тим не менш, якщо певний спектр містить компоненти, які добре апроксимують , Це обмеження не буде мати такої сили, тому що мінімізація лівій частині рівняння (1.2.15) зможе бути досягнута в більшій мірі зменшенням першого члена, ніж другого, що призводить до найбільш оптимального значення . Таким чином виходить дуже гнучка, але стабільна модель, яка самостійно вибирає з великого набору базисних спектрів ті, які апроксимують дані найкращим чином. Що стосується аналізу спектрів КД білків рівнянню (1.2.15) можна дати таку інтерпретацію. Оскільки апріорі не можна сказати, який з спектрів буде апроксимувати краще, жоден з них не має переваги, і всі коефіцієнти покладаються приблизно рівними, близькими до 1 / (Дивись умови (1.2.14)).
При зростанні параметра a точність апроксимації експериментальних даних падає за рахунок зменшення ефективного числа ступенів свободи, відповідного числа вільних параметрів у звичайному методі найменших квадратів. Зазвичай при малих a це відбувається повільно, але коли цей параметр стає занадто великим, число ступенів свободи стає таким малим, що коефіцієнти стають рівними 1 / , І метод повністю втрачає свою гнучкість. Вибір параметра a визначається оптимальним компромісом між гнучкістю і стабільністю моделі, тим самим даючи найкращі значення . Автори даного методу здійснювали вибір a за допомогою автоматичного статистичного тесту на відносне збільшення відхилення апроксимує спектру (реконструйованого зі спектрів еталонних білків) від експериментальних даних при збільшенні цього параметра.
Якщо при аналізі спектру КД білка нам відомо, що серед білків базисного набору є білки, структурно схожі з досліджуваним, то в рівняння (1.2.15) можна ввести ці дані за допомогою різного зважування окремих членів другої суми цього рівняння, тим самим даючи відповідним коефіцієнтам велику свободу зміни. Проте зробити це об'єктивно і кількісно досить складно, тому автори методу не користувалися цим. Як показують експерименти, у разі структурної схожості білків відповідні коефіцієнти автоматично вибираються найбільшими без будь-якої додаткової інформації.
Метод "ортогональних спектрів" [5,6]. Про сновой даного методу є метод власних векторів многокомпoнентного матричного аналізу. Він дозволяє проводити швидку обробку великих наборів даних за допомогою формування з них ортогональних компонент у вигляді власних векторів з відповідними власними значеннями.
Цей метод використовує в якості базисних спектри КД 16 білків з відомою вторинної структурою в діапазоні 178-260 нм з інтервалом в 2 нм (всього по 42 точки в кожному з 16 спектрів). Нехай З - прямокутна матриця розміром 16 42, що містить в якості рядків спектри КД еталонних білків. Множачи її на свою транспоновану матрицю, отримаємо симетричну квадратну матрицю CC T розміром 16 16. Наведемо цю матрицю до діагонального вигляду за допомогою ортогональної матриці U (16 16):
(CC T) U = UE. (1.2.16)
Матриця U буде складатися з 16 власних векторів, а діагональна матриця Е - з 16 власних значень матриці CC T. Розглянемо матрицю B, яка визначається виразом
B = U T C. (1.2.17)
Це прямокутна матриця, яка, також як і матриця вихідних спектрів КД базисних білків, має розмір 16 42. Її рядки можна використовувати в якості 16 нових ортогональних базисних спектрів КД, кожен з яких представляє собою лінійну комбінацію вихідних білкових спектрів. Розкладання довільного спектру КД за цими новими базисним спектрами, замість вихідних, виявляється більш зручним, оскільки "значимість" кожного з них у цьому розкладанні, тобто ступінь, в якій він представляє вихідний набір базисних спектрів, пропорційна квадратному кореню з відповідного власного значення. З цього випливає, що будь-який неповний набір з ортогональних базисних спектрів, обраний таким чином, що відповідні їм власні значення максимальні, буде описувати довільний білковий спектр КД краще, ніж будь-який неповний набір з вихідних спектрів базисних білків.
Помилка, яка виникає при апроксимації експериментального білкового спектру КД за допомогою неповного набору найбільш "значущих" ортогональних базисних спектрів, визначається такою формулою:
. (1.2.18)
Тут s - середнє квадратичне відхилення, n - число точок у спектрі, m - число базисних спектрів у вихідному наборі, - Число ортогональних базисних спектрів в неповному наборі, що використовується для реконструкції довільного білкового спектру, а - Власні значення, розташовані в ряд у порядку убування їх величини. Випадкова помилка, пов'язана з похибкою вимірювань при знятті спектрів КД еталонних білків, приблизно дорівнює 0.3 одиниці De. Порівняємо її зі значеннями s, розрахованими за формулою (1.2.18) для різних значень m (при m = 16):
m | s, од. De |
3 | 0.38 |
4 | 0.24 |
5 | 0.17 |
6 | 0.12 |
З наведеної таблиці видно, що чотири ортогональних базисних спектру дають значення s, нe перевищує рівень випадкової помилки. Але експерименти показують, що форма реконструйованого таким чином спектру погано збігається з реальною. П'ять ортогональних базисних спектрів дають значення s, в два рази менше рівня випадкової помилки, і при цьому добре відтворюють форму спектра. Шість ортогональних базисних спектрів дають лише незначне поліпшення.
Це пояснюється тим, що залишилися базисні спектри є ні що інше, як "шум", і їх облік призводить лише до збільшення помилки при обчисленнях. Автори даного методу використовували для обчислень п'ять "найбільш значущих" ортогональних базисних спектрів (m = 5), вважаючи це кількість оптимальним. Ці спектри представлені на малюнку 1.2.2.
З виразу (1.2.17) випливає, що
С = UB. (1.2.19)
Відновлюючи за скороченим набору ортогональних базисних спектрів початковий набір базисних спектрів КД, можемо написати:
, (1.2.20)
де - Вихідні базисні спектри (i = 1,., 16; k = 1,., 42), а - - П'ять "найбільш значущих" ортогональних базисних спектрів. Експерименти з відтворення вихідних білкових спектрів за формулою (1.2.20) показують, що середньоквадратична помилка при цьому становить від 0.08 до 0.25, що є досить гарним показником.
Уявімо дані рентгеноструктурного аналізу для 16 базисних білків у вигляді матриці S розміром 16 8, яка містить величини відносного вмісту в кожному з білків восьми структурних елементів: спіральної структури, включаючи a - і 3 10-спіралі, антипараллельной і паралельної b-структури, b-вигинів I, II, III типів, інших видів b-вигинів і залишилася ("невпорядкованою") структури.
Як можна припускати з того факту, що початковий набір базисних спектрів може бути повністю відновлений але основі лише п'яти спектрів ортогонального базисного набору, спектри КД білків в діапазоні від 178 до 260 нм містять у собі інформацію лише про п'ять незалежних типах вторинної структури.
З точки зору незалежності спектрів КД в якості таких типів вторинної структури можуть бути прийняті комбінації звичайних типів вторинної структури (a-спіралі, b-структури і т.д.), відповідні п'яти "найбільш значущим" ортогональним базисним спектрами.
Якщо для ортогональних базисних спектрів також ввести матрицю структурних даних D (16 8), то аналогічно формулі (1.2.19) можна записати
S = UD (1.2.21)
Як показує експеримент, структурна матриця S може бути повністю відновлена на основі лише п'яти комбінацій елементів вторинної структури матриці D, що відповідають п'яти "найбільш значущим" ортогональним базисним спектрами. Таким чином, ці комбінації звичайних типів вторинної структури є (з точки зору незалежності спектрів КД) незалежними вторинними "суперструктура":
Номер "супер-структури" | a, 3 жовтня | b ¯ | b | b-виг. I | b-виг. II | b-виг. III | b-виг. ін | Ост. типи |
1 | 1.77 | 0.30 | 0.20 | 0.16 | 0.07 | 0.12 |