RFDiffusion如何選擇Hotspots?
一、理想的Hotspot特點:
| 特性 | 解釋 |
|---|---|
| 功能性 | 這個殘基和蛋白質功能直接相關,比如催化活性、底物結合、信號傳遞。 |
| 表面暴露 | 殘基要在蛋白表面、容易被binder接觸,埋藏在核心的殘基不合適。 |
| 物化性質適合 | 熱點殘基最好能形成氫鍵、疏水作用、π-π相互作用,比如 Tyr、Trp、Arg、Asp。 |
| 高能量貢獻位點 | 根據能量分解分析(如MM-GBSA、Rosetta接口分析),綁定能量集中在這些殘基上。 |
| 結構穩定 | 選擇那些在不同構象下都保持位置比較穩定的殘基。太靈活的位置不適合做Hotspot。 |
二、具體選擇Hotspot的方法:
| 方法 | 具體怎么做 | 舉例 |
|---|---|---|
| 基于已有結構 | 看已有的蛋白-配體、蛋白-蛋白復合物結構,找出關鍵結合殘基 | 查PDB結構,比如PDB 6M0J(ACE2-Spike復合物) |
| 能量貢獻分析 | 用分子動力學 + MM-GBSA分解各個殘基對結合能的貢獻 | 選 ΔG_binding 貢獻 > 1 kcal/mol 的殘基 |
| 界面分析(buried SASA變化) | 看哪些殘基結合前后埋藏面積變化最大(界面變化大=重要) | 用軟件 like PyMOL / Chimera / Rosetta InterfaceAnalyzer |
| 序列保守性 | 重要功能殘基通常是進化保守的,可以用Consurf或者Jalview分析 | |
| 突變實驗數據 | 文獻中通常有功能性殘基的突變研究,失活/失結合的殘基是好Hotspot | |
| 機器學習預測 (高級) | 用BudeAlaScan、KFC2、Robetta等工具預測界面熱點 |
三、用Pymol找
整體步驟
-
下載結構
-
用PyMOL看表面暴露的殘基
-
找界面附近的重要殘基
-
篩選出Hotspots
第1步:下載PDB結構文件
第2步:用PyMOL打開
第3步:高亮顯示表面殘基
點擊查看代碼
# 把鏈A顯示為表面
select chainA, chain A
show surface, chainA
color gray, chainA
# 選出暴露在表面的氨基酸
get_area selection=chain A, load_b=1 # 計算每個原子的SASA并保存到B-factor列(PyMOL的小trick)
select surface_residues, chain A and (b > 2.5)
show sticks, surface_residues
color green, surface_residues
注意,代碼塊中:
chain A ? 指定你的鏈
(sasa > 2.5) ? 選出溶劑可及面積大于2.5 ?2的原子(可能報錯,所以先運行get_area...)
surface_residues ? 新選出的表面殘基
直接 show sticks 和 color green 顯示它們
第4步:找靠近催化口袋的區域
點擊查看代碼
# 選出鋅離子和它附近的殘基
select zinc, resn ZN
select pocket_near_zinc, byres (br. zinc around 8)
show sticks, pocket_near_zinc
color magenta, pocket_near_zinc
這樣就能把Zn附近8?以內的所有殘基都選出來, 這些通常就是binding pocket里的核心殘基
第5步:結合兩者,篩選Hotspots
- 看既暴露在表面又靠近Zn2? pocket的殘基
- 通常這些是最有機會成為binding熱點的
另外:
? Hotspots一般優先選:
-
疏水核心殘基(Leu, Phe, Ile, Val)
-
電荷中心殘基(Arg, Asp, Glu)
-
有可能形成氫鍵的殘基(Ser, Thr, Asn, Gln)
? 最好至少挑3~5個Hotspots,設計的時候要求binder靠近它們
浙公網安備 33010602011771號