MDシミュレーションによる変性タンパク質の相互作用解析

MDシミュレーションによる変性タンパク質の相互作用解析

https://pubs.acs.org/doi/10.1021/acs.jpcb.0c06288

概要

  • タンパク質中の変性領域がLLPSの足場になっている
  • 足場となるタンパク質のアミノ戦配列がどのようにphase separationを起こすのかまだわかっていない
  • phase separationにおけるモデル分子であるN末端のDEAD-boxヘリカーゼ4(NDDX4)についてexplicit-solventシミュレーションを行った
  • NDDX4について単分子レベルでcomformational ensembleを決定し、分割統治的な手法によって他のタンパク質の高濃度でのシミュレーションに基づいて分子間相互作用が本当の凝集ぶつをmimickしているか調べた めも: NDDXは236残基からなるタンパク質のN末端
  • NMRおよび変異解析の結果と一致した詳細データを得て、アルギニンや芳香族の残基が縮合に関わっていることを示唆した

イントロ

  • phase separationでの変性領域の重要性

NMRでLLPS時にも構造のflexibilityが保存されていることがわかっている。また、LLPSは変性領域間での瞬間的な多価的な相互作用(多数の弱い相互作用の重なり)によって維持されている

Furthermore, pioneering NMR studies indicate that this conformational flexibility is preserved even upon LLPS and that the condensed phase is stabilized by a dynamical network of transient multivalent interactions.(14,15)

ポリマー理論によりアミノ酸の荷電の分布によって相分離の起こる分子が説明されてきた

Particularly, polymer theory has been used to rationalize how the patterning of charged residues in the sequence affects both the conformational ensemble of isolated proteins and their phase separation properties.(18−20)

芳香族アミノ酸または側鎖が大きく不飽和であるアミノ酸がLLPSの鍵になっておりpi-stacking相互作用により説明されてきた

Furthermore, several evidences indicate that amino acids with aromatic (Phe, Tyr) or large-sized, unsaturated side-chains (Arg, Gln) are key determinants of in vivo and in vitro LLPS,(10,14,17,21−24) and π–π or cation−π interactions have been invoked to rationalize these observations.(25)

LLPSのdriving forceの解明にはMDシミュレーションが使われてきた。

1残基1ビーズの粗視化モデルは

  • 相分離系のcoexistence curvesの決定
  • LLPSにおけるリン酸化の働きの説明
  • 単分子のconformational ensembleとphasingの間の相関の調査

に使われてきた。

Notably, coarse-grained (CG) models with a one-bead-per-residue resolution have been successfully applied for determining coexistence curves of model phase-separating systems,(26−28) for rationalizing the role of phosphorylation on LLPS,(29) and for investigating the correlation between single-molecule conformational ensembles and phase behavior.(30)

原子レベルでのシミュレーションは計算量的な制約から非常に限られている

Conversely, the contribution of atomistic simulations to this field has been limited(15,24,34−37)

さらにIDRのconformational propertyの再現についての言説を見るとforce fieldの正確性に欠ける

Furthermore, the accuracy of atomistic force fields in this context has yet to be carefully assessed, considering the debate on their capability of correctly reproducing the conformational properties of IDRs/IDPs.(38−40)

この論文では * 分割統治的な手法 * IDP解析に有効だと確かめられた最新のforce field を用いてexplicit-solventの原子シミュレーションをNDDX4などのphasing分子について行った

メソッド

2.1

  • ソフトウェア: Gromacs

  • force field: amber99sb-disp

  • trajectoryは v-rescale(43) と Parrinello–Rahman(44) schemes を用いて NPT ensemble (T = 300 K, P = 1 atm) の系で作られた

注 NpT ensembleはisothermal–isobaric ensemble(等温等圧集団)のこと

  • NDDX4の最初の状態はBradyにより報告された配列をもとにTRaDES-2により生成された

Initial configurations of NDDX4 were generated with TRaDES-2 software(45,46) by using the sequence reported by Brady et al.(14)

  • タンパク質分子は2290nm3の斜方十二面体、300000原子に溶解された

Protein molecules were solvated in a rhombic dodecahedron box with a volume of ∼2290 nm3, for a total of approximately 300000 atoms.

  • 0.1M NaClにより電荷は中和(?)された

The charge of the system was neutralized with 0.1 M NaCl.

  • 周期的な境界条件が適用され、1nmまでの範囲でparticle mesh Ewald algorithmが適用されて静電相互作用が計算され、ファンデルワールス力は1nmでcutoffされて計算された。

Periodic boundary conditions were applied, and long-range electrostatic interactions were evaluated by using the particle mesh Ewald algorithm(47) with a cutoff of 1 nm for the real space interactions, while van der Waals interactions were computed by using a cutoff distance of 1 nm

  • LINCS を使用してすべての結合長を制限した。

All bond lengths were constrained by using LINCS,(48)

  • 水素分子は高周波のbond-angle vibrationを取り除くためにvirtual sites(?)に置換された。これにより4fsのtime stepで運動方程式の統合を行うことが可能になった。(計算量的な制約?)

hydrogen atoms were substituted by virtual sites to remove their high-frequency bond-angle vibration, allowing us to use a time step of 4 fs for the integration of the equations of motion.(49)

  • ?

Each replica was run for 1 μs for a cumulated simulation time of 10 μs.

  • 10psごとにタンパク質の状態は保存され、最初の100nsは解析からのぞいた

Configurations of the protein were saved every 10 ps, and the first 100 ns of each replica was discarded from the analysis.

  • gmx gyrate と HullRad softwareによりNDDX4の回転角(Rgyr)と流体力学的角度 (Rhyd) が計算された.

The radius of gyration (Rgyr) and the hydrodynamic radius (Rhyd) of NDDX4 were computed with the tool gmx gyrate and the HullRad software,(50)

  • 分子間の接触の確率(contact probability)は、重い原子(H以外?)間の最短距離が0.5nm以下のの時に計算した。ただしペプチド結合4個ぶん以下の距離に位置するアミノ酸ペアは計算からのぞいた。

Intramolecular contact probabilities were evaluated considering a cutoff of 0.5 nm on the minimum distance between the heavy atoms of pairs of residues (Figure S12), excluding amino acids closer than four peptide bonds from the calculation

  • 各残基(i)におけるP_loc(i)の値は[i-3, i+3]の7残基のrolling window(?)のcontact probabilityを計算し平均することにより得た。

The Ploc(i) variable for each residue i was computed by locally averaging the intramolecular contact probabilities of the residues by using a rolling window of seven residues in the interval [i – 3, i + 3].

  • 11個の残基のmoving window(?)を解析することによって電荷を持つ領域およびArgやPheに富んだ領域が定義された

The definition of the charged blocks of amino acids and of regions rich in Arg and Phe was performed by analyzing the sequence with a moving window of 11 residues in the interval [i – 5, i + 5] (Figure S13).

  • gromacsのdo_dsspにより計算されたDSSPアルゴリズム(水素結合推定アルゴリズム)により二次構造の情報が推定された。

The DSSP algorithm(51) was employed to estimate the secondary structure propensities from MD simulations via the interface provided by the gmx do_dssp tool.

2.2

12残基のExtended structures(?)はambertoolのleapで生成された

Extended structures of the 12-residue long peptides were generated by using the LEaP program included in AmberTools16.(52)

末端の塩基(何を指す?前の12塩基?)の電荷による人為的な影響を防ぐために、ペプチド末端はACEとNMEグループによりキャップされた

Termini of the peptides were capped by using ACE and NME groups to avoid artificial effects introduced by the charges of the terminal residues

  • 各レプリカ(シミュレーション単位)における初期状態はgromacsのinsert-moleculesというツールによりランダムに挿入された

Initial configurations for each replica were generated by inserting the peptides in random positions and orientations in a rhombic dodecahedron box with a volume of ∼145 nm3 by using the gmx insert-molecules tool available in GROMACS 2018.3.

  • Flag1... アルギニンをリジンに置換したもの Flag2...フェニルアラニンをアラニンに置換したもの

For mutants of Frag1 and Frag2 where arginine and phenylalanine residues were mutated respectively to lysine and alanine, mutations correspond to R133K, R135K, and F137A in Frag2 and R150K, F153A, R154K, R157K, and F160A in Frag1 according to NDDX4 sequence numbering.