技術文章
TECHNICAL ARTICLES數據
前幾天涉及到一個數據,我和一個老師爭論了一陣的Checkcif問題。晶體數據很清晰的顯示的原子的位置,在Checkcif里卻認為是有問題的Alert。如果是修,自然是可以修掉的,但是作為一個晶體學工作者的尊嚴,為了修而修,這不是科學,就成了畫畫了。但這個爭論也只持續了一會,我自知無力改變什么,一個科學發現就這樣淹沒在checkcif里。如同Alert簡單粗暴的被90%以上的同學和老師稱之為錯誤,即便解釋了再多遍,也鮮有人認真去改正。讀過Checkcif歷史的同學都會知道,Checkcif初衷是個輔助工具幫助我們減少一些不必要的失誤。但是現在這個初衷變了味,成了大多數同學甚至審稿人眼里的一刀切標準。每個Checkcif Report都會有這么一句話
“THIS REPORT IS FOR GUIDANCE ONLY. IF USED AS PART OF A REVIEW PROCEDURE FOR PUBLICATION, IT SHOULD NOT REPLACE THE EXPERTISE OF AN EXPERIENCED CRYSTALLOGRAPHIC REFEREE."
然而這句話我相信絕大多數同學從來都沒有讀過。單一標準的問題對于做化學晶體的同學們尤為嚴重。這已經是吐槽了太久的吐槽,有時候是無奈的事情。不過我更想吐槽的是關于數據質量的判斷。雖然絕大多數做蛋白晶體的同學并沒有真實接觸過晶體學,但對于分辨率的概念理解卻比大多數做化學晶體的同學要好的太多。在化學晶體里,好像世界很單一。不管是什么樣的晶體,分辨率統一的是0.77? or 0.83 ?。對于數據質量的判斷,永遠只有信噪比,Rint,完整度,其它一概不問。可是對于晶體學來說,不應該衍射分辨率(自然不是所謂的0.83 ?)是較重要的概念么?
討論
比如下面這顆晶體的數據,學生告訴我:
“您看沒有紅色,數據質量還可以,信噪比馬馬虎虎,Rint也低于10%,可就是解不好結構。"
“分辨率呢?"
“0.84 ?"
聽到0.84 ?,其實我就已經開始懷疑了,其實這并沒有回答我問的問題。
“那這樣吧,你看下你的信噪比分布。"
“咦,這是什么?"
“…這是數據信噪比的分布,你可以看到按照信噪比3的閾值線,2theta角對應的還不到80°,分辨率是多少?"
“... 不懂…"
“好吧,那看Xprep吧.."
“假設沒那么嚴格,信噪比>2的時候,這里對應的分辨率是多少?"
“…1.05 ??"
“XPREP給你的平均信噪比是多少呢?"
“…只有3.5.."
“那這個數據看起來還好么?"
“…不好"
“看看你1.2 ?以上的數據,Rmerge值有多高呢?"
“…"
“假設30% 是閾值線,這個數據1.2 ?到0.83 ?基本上都是噪音,衍射圖上應該也很弱。這么差的數據為什么你會認為還不錯呢?"
“可是我是按照0.83 ?,信噪比10收的數據…"
“晶體的有效分辨率不是設定出來的..我也不知道為什么Olex2會計算出來那么高的平均信噪比,至少它對我來說沒有實際意義,我更關注它的真實分辨率"
“那我R1還能修到5%么?"
“…這個…別想太多了…"
...對于一個衍射較弱的數據,分辨率不足,這明顯是一個硬傷??墒沁@個簡單明顯的問題,卻很少有人去查看。甚至在拿到hkl文件后,都沒有去查看過衍射圖的習慣。同樣的統計數字,實際上對應的可能是不同數據質量的晶體。甚至這些數字也不一定是真實的。
總結
所以,在解析一個數據之前,先確定這個晶體的分辨率真實有多少,再去設定對它的期望。如果真是分辨率不到1.2?,那么就要做好相位都解析不了的心理準備。當然這些實際上在收數據的時候就應該已經了解,只是衍射圖太多時候被丟棄在一邊。當然給晶體的數據質量打分,其實是一個多參數評判的過程,取決于很多因素,并不是看hkl文件的幾個簡單的數值就結束了。甚至我們需要查看晶體對心,衍射圖,數據還原等過程。像這個看起來Rint值很低的數據,實際上也只是低角度的數據很好,反而掩蓋了基本的分辨率不足的問題。而更多常見的問題會有定錯了晶胞,沒有處理孿晶,吸收校正錯誤,冗余度太低,刪除了太多衍射點等等…也許每一步都是坑,填平了坑,才能知道下一步是不是走得下去。(未完,待續)
-轉載于《布魯克X射線部門》公眾號
掃一掃,關注公眾號
服務電話:
021-34685181 上海市松江區千帆路288弄G60科創云廊3號樓602室 wei.zhu@shuyunsh.com