近十多年来药物质量的重点已悄然地从“含量”转移到“有关物质”的研究,各种分析技术百花齐放,相争斗艳。但是就有关物质的分离和研究,尚无哪一门分离技术能取代高效液相色谱。
目前液相色谱的理论和技术在国内药物研发方面的应用还处于较低水平,主要表现在:建立创新药有关物质方法中所表现的“trial and error”思维模式;仿药杂质研究中机械地套用现成的药典方法来完成任务。无论是出现这两种形式中的任何问题,我们的分析人员都会束手无策。既看不到问题出现的原因,更找不到解决问题的思路和方法。
实际上现代液相色谱分离的技术不仅理论上突飞猛进,而且各种仪器设备和色谱柱填料也是日新月异。那么为什么这些科学技术进步在制药研发工业界引起的反响却远远不够呢?我认为主要存在以下原因:分析人员的色谱理论知识的匮乏;现代液相色谱理论的复杂性,就反相色谱而言,大部分物质都是“不规则样品”,无论是传统的“Hydrophobic Interaction”、“Distribution”、还是“Adsorption”理论,都无法单独解释液相色谱的保留和分离行为;填料供应商目前尚不能做到站在研发者的角度上分析问题,研发者就难以从项目特点出发来选择适合的色谱柱和色谱条件。
图1 缬沙坦的logD预测曲线(用ACD/Percepta logD预测模块)
图1中,缬沙坦在低pH情况下,化合物为分子态,疏水性高,反相色谱的保留强。在pH3到6之间,其疏水性变动很快,到了高pH值范围,酸性基团都电离化,分子极性增加,疏水性低。通过深入了解这条曲线,我们能够通过调控pH控制缬沙坦的出峰。
logD的范围和色谱柱的性能是应当有所匹配的。如果在某个pH下,化合物logD数值大于5,再选用保留能力特别强的柱子,肯定洗脱时间要很长,降低方法的质量;如果化合物logD数值小于-3,再用保留能力特别弱的反相柱,那此目标物一定超快被洗脱,方法的质量也不好。
其次,pKa对于色谱方法开发工作来说也是非常重要的理化参数,上文其实已经提到了很多。但是有人会把它与路易斯酸的定义混淆,也有人在看到一个化合物有多个pKa时无法判断哪些是酸性pKa哪些是碱性pKa,从而对适宜pH范围的选择无法判断。酸碱化合物的pKa计算公式如下:
图2 普萘洛尔的pKa预测(用ACD/Percepta pKa预测模块)
图2中,普萘洛尔醇羟基的pKa值为~13.9,显弱酸性,意味着在极强强碱中它才会脱去H ,带上负电荷。而结构中的仲胺pKa值为~9.5,为常规脂肪胺,在pH 0到8的范围内基本都是解离状态(BH ),带一个单位的正电荷,到了pH9.5左右,溶液中一半为离子状态一半为分子状态。上图中红色部分带正电荷为离子状态,白色部分不带电荷为游离态,蓝色部分带负电荷。根据“pH值±2”原则,如果普萘洛尔是方法开发中最重要的因素,选pH值时要要规避其pKa范围以确保其出峰的稳定性,在本例中势必要在酸性环境下进行碱性化合物的分离了。拓展来说,在pKa±1的范围内,调节pH,能够很好的控制样品的保留时间和选择性,可以因此而解决分离度的问题。
总的来说,logD可以认为是结合了pKa和logP特点的综合性参数,理解和掌握这个参数对反相色谱方法开发的研究非常重要。理解logD,再结合下文提到的疏水减法模型,将帮助分析人员进一步理解液相色谱分离的本质。
在色谱方法开发工作的前期调研阶段,可以考虑将所有已知结构物质的logD曲线绘制在一张图上来近似了解和选择适宜的pH范围。如下图3,药物分子的logD曲线的堆叠图。
图3 多个药物分子的logD曲线堆叠图
第二部分 理解色谱柱的选择性
色谱柱的选择性差异是溶质分子被分离的重要前提,而色谱柱选择性的量化和统一,则有赖于施耐德等人提出的疏水减法模型(hydrophobic-subtraction model)。
这个模型的表达式是logɑ=log(k/kEB)=Ƞ’H-δ’S β’A ɑ’B κ’C。
这个方程式总结了RPC保留机制和色谱柱选择性的理解。模型的左侧表征溶质分子的保留情况,kEB表示只有疏水相互作用的乙苯的保留。右侧的各项分别表征疏水相互作用(Ƞ’H项),分子的形状大小因素(δ’S项),相互间的氢键作用(β’A ɑ’B项),相互间的离子交换作用(κ’C项)。每一项希腊字母代表的是溶质分子,每一项的英文字母代表的是色谱柱的能力。
同时可以得到,任意两根色谱柱的选择性比较公式如下:
如果Fs<3,两根柱子具有相似的性质(选择度α相近),Fs值越大,两根柱子具有不同的性质(选择度α不同)。色谱柱的A,B,C由硅醇基和键合相来体现。不同pH值条件下,硅醇基的暴露量以及其电离情况也在动态变动。
通过这个疏水减法模型,设计和使用一定的标准物质,可以将常用的色谱柱进行量化,只有进行量化,才有可能进行比较和选择。这样的选择是有目标的,理性的,而不是随机的。
Euerby和Peterson在2003年的“Journal of Chromatography A”上发表了这个模型的应用,对市面上常见的色谱柱进行TANAKA柱效实验的测定,实现了对色谱柱选择性的量化。类似的工作还在继续,最新版数据库的色谱柱数量已超过了300根,其工作成果已经在ACD/Labs网站上的freeware上免费提供,名称为“column selector”,用户可以直接进行色谱柱比较。在各项能力上接近的色谱柱,被认为选择性比较接近。下图4则是在最新版ACD软件中固化的功能。
图4 ACD/ Column Compare的界面
前述经验公式的“H”相为上图中的“aCH2”,“S”相为“aT/O”,“A、B”相为“aC/P”,”“C”相为“aB/P”。举例来说,图中Luna C18和Zorbax SB-C18在粒径,密度方面区别较大,但是在实际应用中其疏水选择性和立体选择性接近。如果用于分析中性化合物,这两根色谱柱是可以替换的。如果用于在酸性环境下(例如pH3)分析离子型化合物,也是可以替换的。在中性,弱碱性环境下(例如pH7), Zorbax SB-C18的离子交换能力远大于Luna C18,会增大离子化溶质的保留,比如结构中具有带正电荷的基团,二者的可替换性就变差了。
与第一节的内容互相呼应,logD的数据可以认为是Ƞ’H中的Ƞ’,而对pKa的理解我们可以掌握在当前pH下溶质的离子化状态,了解其发生离子交换能力的可能性,再加上对结构本身氢键供体和受体的认知,我们拿这些知识来解决一些问题,应该说会有很好的理论支持。
第三部分 分析方法模型化和方法预筛选
疏水减法模型本身是一个等式,意味着有可能对一个方法建立一个方程式,这个方程式可以用来解释溶质在这个方法下的的保留。运用统计学对建立的保留时间预测方程式进行多元回归。
图5 ACD色谱数据库中的方法
通过计算“图5”中色谱方法收集到的化合物特性,例如疏水性logD,分子体积、极性表面积、氢键供体和受体数目,对相对保留时间建立方程式进行多元回归,见表1。
表1 四个样本建立的方程式列表
Prediction Equation | Log(tR - t0, sec) = 0.351( /-0.1114)logD 2.2771( /-0.0562) |
Prediction Equation Conditions | Type = RP, pH = 3.40, t0 = 1.21 min, Creator = LC Sim 12.03 |
Prediction Equation Statistics | n = 4, R = 0.9124, StD = 0.25 |
表1中的方程式说明当前方法物质的保留时间仅和化合物的疏水性logD成正比。这样的方程式用于预测集接近的化合物保留时间具有一定意义,但是样本量偏少。但如果将一个常用方法,给它多样性的分子,再去建立统计学模型,更具有实用性,可以用来进行方法的预筛选。下图6是用180个样本分子在10个方法基础上建立的保留时间统计学模型,然后对5个目标分子进行保留时间和分离情况的预测。
图6 用ACD/ChromGenius做方法预筛选
图6的预测结果显示,至少有4个方法能够对这5个分子有很好的分离。
第四部分 液相色谱模拟技术的应用
液相色谱的模拟技术并不是一个新颖的词汇,实际上它已经出现了超过20年。用数学方程式来拟合物质在色谱柱内的运动情况是一个成熟的技术,也发表了很多文献。不过在国内,能够熟练掌握色谱模拟软件的人还是很少。应用模拟技术,可以解决trial & error模式研究策略的弊端,可实现在短时间内使分离最优化。
有人总结过当以下一个或多个条件适用时,推荐使用计算机模拟技术,这样它的价值可能会实现最大化:
1. 梯度洗脱研究
2. 包含5-10种甚至更多组分的复杂样品
3. 方法的耐用性非常重要
4. 微小的分离度或分离时间的改善都很有意义
5. 期望快速解决分离度问题
6. 从分子结构预测溶质的保留和pKa
7. 根据相同或不同的选择性选择反相色谱柱
只含有几种成分样品的分离,时间不是问题的情况下使用模拟软件是没有优势的。以下举一个用少数几针进样,通过模拟软件解决问题的例子:
案例的背景是一个中药指纹图谱的分析方法在夏季和冬季时产生了很大的差异,图7的上半部分为夏季检测结果,下半部分为冬季检测结果。可以看出,在冬季时某个物质(夏季图中RT=48.49min)保留明显增加,此物质与其后的物质(夏季图中RT=50.84min)发生共流。
图8 35℃、25℃和45℃时的色谱图
根据以上三个温度的保留情况建立模型,目标物质分离度在2.0以上的温度范围为:32.5~38.5℃,如图9所示。在冬季,企业发现共流时,模型显示其色谱柱内的实际温度大约为29℃。估计其根本原因是柱温箱的控温能力在不同环境温度下差异较大导致。
图9 ACD/LC simulator建模后的边界和边界条件下的模拟情况
上述案例从色谱理论上可以用Van’t Hoffequation 方程来解释,公式如下:
用Log k vs. 1/Tk作图得线性关系图,其中:K为保留因子,Tk为温度(凯尔文),A为截距(常数),B为斜率(常数)。
两个化合物的k值相比得到:α=ki/kj
同样可以得到:log α = a b/Tk,
用Log α vs. 1/Tk作图得线性关系图,其中:α为分离因子,Tk为温度(凯尔文),a为截距(常数),b为斜率(常数)。
假设上述夏季图谱中的RT=48.49min为k1,RT=50.84min为k2,α=k1/k2,得到Log α vs. Tk作图,见图10.
图10 Log α vs. 1000/Tk的线性图
从图10中可以看出,当 log α=0时,k1=k2,即两个化合物发生共流,当 log α<0或log α>0时,两个化合物的洗脱顺序相反,均能达到分离。另外,温度的变化对手性化合物的分离也有很好的选择性作用。
液相色谱模拟技术的问题是它需要色谱工作者花时间学习。但应用它往往可以降低成本(人力,时间,物料)并提高最终方法的质量,对于经验丰富的开发者一样具有意义。从另一个方面来说,模拟技术不是色谱技能的替代者,色谱工作者的知识和技能是有效使用模拟软件的基础。