|
4. 文库
|
|
|
到公元2015年, 人类基因组计划将在21世纪初完成,将引发一场生物学的革命.
几乎所有人类基因的功能和表达都已被报道,
有多种基因可以导致遗传疾病. 据SNP的研究,
每个个体基因的差异都被存储起来.
这样个体组成的分析将仅通过简单检测一绺头发而实现. 比如,
你的内科医生说, "由于你有C型胰腺基因,
从遗传上分析你的胰腺很弱, 你非常可能在40岁时患上糖尿病."
根据在线数据, A型胰腺是正常的, B型胰腺约占突变总数的30%.
对B型的治疗大约自5年前开始. C型是仅占总人口0.1%的罕见变异,
由于刚刚发现, 现在还无药可救. 于是一个人致电制造药物的pharmarnomix公司,
定购恰当的新药. Pharmarnomix的科学家有C型胰腺的蛋白表达和晶体结构,
于是查找哪种化合物可以通过分子模型仿真恢复C型蛋白受损的功能.
他们选择了几百万种前导分子, 用计算机设计合成路线,
通过自动合成仪合成. 经过高通量筛选, 选出最好的10种,
在临床实验后, 与你的病最对症的药物最终送到你的门上. 文库可被定义为所有可能组合的集合或者关于集合的研究.
在组合的概念上可以说文库就是组合化学.
组合化学的含义甚广, 但我们仅取其与本章一致的含义.
文库最初的含义是储存文献和艺术资料以供阅读, 参考,
借阅等活动的地方.
现在很多国家虽在使用这个词却与其本意不同. A AA B BB AB BA 有六种可能组合. 我们可以称之为含有A和B的6种全部可能组合的集合. 以此拓展至英文词典. 字母表中有26个字母, 如果我们假设每个词总是含有5个字母, 我们可以计算一本词典含有多少词汇. AAAAA 全部可能组合是26 x 26 x 26 x 26 x 26 = 11,881,376. 如果亦考虑含有5个以内字母的词, 一个字母的有26个词, 两个的26 x 26 = 676, 三个的26 x 26 x 26 = 17,576, 四个的26 x 26 x 26 x 26 = 456,976. 如果假设全部词汇即是这些, 那将是, 26 (1) + 676 (2) + 17,576 (3) + 456,976 (4) + 11,881,376 (5) 我们称这个集合为文库. 在韦氏英语词典中, 有大约300,000词汇, 我们可以发现1200万的文库早已超过了实际使用的英语词汇数.
然而, 从以上步骤可以看出无论说英语与否,
每个人都可以编一本包含全部组合的新英语词典.
当然会有许多诸如QQQQQ这样可笑的垃圾词汇,
但是它仍然包含了全部有用的词汇. 我们称之为文库词典.
从没有出现过的词也可以在这本词典中找到. 多于5个字母的怎么办呢? 很简单. 假设最长的单词含有40个字母.
你只需要编一本40个字母组合的词典! 26 + 262 + .... + 2639 + 2640…并继续.
你可以肯定的说你编了一本含有全部可能词汇的词典. 词汇总量可以通过增加限制而大为缩减, 比如没有4个以上连续相同字母的词.
但这仍然含有很多从没用过的垃圾词汇. 文库是怎样被实际应用的
传统方法是药物化学家一次合成一个化合物然后检验其生物活性. 据说一个突出的化学家可以每年合成50~100种化合物, 每个耗资7,500美元. 与之相比, 如果采用文库技术, 每个月合成上千种化合物而每个仅耗资10美元. 为新药寻找目标细菌或蛋白质曾经是非常慢的工作, 但是自更多采用了青霉素等抗生素之后, 细菌的抗药性不断频繁且迅速产生, 甚至有预言现在的药物发展速度赶不上新细菌的产生速度, 人类终将灭亡. 尽管上面应用的主要是肽, 任何结构单元都可以构建文库, 正如我们可以用希腊字母表代替英文字母表. 事实上, 早期主要尝试的是核酸文库, 如DNA和RNA库. 除了使用A, C, G, T (或 U)的四字母表, 其他都与肽文库一样. 如果合成一个5元碱基的简单核酸, 其文库有45 = 1024 种组合. 肽及核酸都是一维高分子. 例如, A之后是C然后是G…如此继续. 这样的文库将可能有重复排列的数量. A-B-B-C-A-D-D-D 如果不是线形而是环形结构呢? 组合数不同所以会产生新型的文库. 糖类较氨基酸或核酸也可以使用, 合成分子较天然产物也可以使用. 无需必是线形或环形结构, 也无需是有机物. 金属氧化物或者聚合物是否也可以呢? 所以说, 文库的参与单元是没有限制的. 基本上文库的应用过程是这样的: (1) 选择目标. (2) 定义目标分子的特性. (3) 设计筛选目标分子的方法. (4) 合成文库. (5) 筛选出前导化合物. (6) 合成前导化合物相似结构的次级文库并再次筛选较前导化合物性能更好的分子. 重复步骤 (4) 及 (5) 决定最优活性化合物.
选择目标分子 尽管文库应用于快速生产大量化合物, 产物本身并不是最终目标. 如果文库的基本目标是发现新的特性分子, 我们需要决定找寻什么类型的特性.
既然药物工业是文库使用最多的领域,我们就讨论新药的开发吧.
我们要尝试什么类型的药? 揭开新纪元的抗癌药物? 或者20世纪的杀手,
爱滋病? 有许多疾病可以做文库的目标. 考虑研究费用是否充足,当然还有销售潜力也应该被考虑,
我们可能需要读各种不同经济的和医学杂志还有那些惊人的好主意.
由此产生一个最终目标例如治疗谢顶或汽油替代品.尝试无害,
我们就说想要发现治疗爱滋病的药吧.
一旦确定目标分子的某一特性, 就应设计恰当的筛选方法. 如果目标分子的特性是对病毒有毒性,
就可以培养病毒然后筛选对病毒致命的分子. 因为绝大多数病毒只生长在宿主细胞体内, 必须确认化合物仅杀死病毒而不影响细胞. 为检查其是否杀死被感染的细胞, 需要测试正常细胞以作为对照组.
如果要寻找一个增强免疫活性的分子, 就应当采用一个不同的筛选方法. 可以将待测分子注射,
如果可能, 入实验动物或人体内并检查相关的免疫细胞数量是否增加,
或检查免疫细胞的体外活性. 甚至仅是检查免疫细胞的活动, 也可以仅仅使用显微镜数增加细胞的数目,
或者通过将细胞活动的生化变化转变为颜色变化而后用分光光度法检测.
即使决定了目标分子的特性, 也可以由各种不同的感知其特性的筛选方法备选. 在这一点上, 可能需要相关领域专家的意见.
上述程序与通常的医学化学研究程序相同.
让我们看看下一步文库技术是如何应用的. 如果筛选方法也确定了,下个步骤就是文库合成, 这与通常的有机合成方法有根本的不同.
普通合成化学经过设计,合成和分析等几步: (1)
首先,
根据待合成的目标分子用反合成分析法设计高效的合成路线.
由于分子的体积和复杂性全合成可有几十条路线,
路线是否高效决定了成功与失败. 如果起始反应物买不到,
通常的办法是在实验室里经过几个步骤合成. (设计) (2)
根据设计合成目标分子. 一般的目标分子仅有几个化合物.
有时需要几十个, 一般只有大工业才可以.
通常大多数反应是在溶剂中进行的. (合成) (3)
合成中每一步的副反应产物通过重结晶, 萃取,
气相色谱等方法去除, 产物的结构和纯度通过元素分析, NMR,
质谱, 或红外紫外光谱等技术分析. (分析) 文库合成过程类似,
包含设计, 生产和查证等步骤. 文库设计 虽未提及, 在普通方法中已经决定了文库的设计. 换言之,
有关合成目标的信息已经在设计步骤中给出了.
这样的活性分子是新药的候选物, 称作前导化合物.
很多时候如青霉素等, 前导化合物是从天然产物中发现的,
也有时可在合成另一个目标的过程中偶然被发现. 抗生素,
重氮化合物的发现都曾是在合成染料的时候发现的, 这是非常好的例证.
此外, 谷氨酸和多种激素也是前导化合物,
它们是生化学家研究神经传递素和激素时发现的. 由于前导化合物可以简化合适分子的修正过程, 它的存在对通常的研究是必需的.
当对目标物没有任何线索的时候寻找前导化合物显得尤为重要. 大型药物公司耗费大量时间和精力收集各地土壤等天然物就是为了寻找前导化合物.
然而,除非递送到正确的部位或保持足够的浓度, 即使是对目标蛋白质活性最强的化合物都是无用的. 这些是药物代谢动力学的问题, 通常在前导结构的效能最优化之后的阶段考虑. 这就是, 首先改良效能, 然后才考虑传递. 但是,在早期阶段或与效能最优化平行的阶段就考虑这些问题的呼声正愈演愈烈. 一个好药主要要考虑的问题就是吸收,分配, 代谢, 排泄和毒性, 这被缩写为ADME. 1997年, Lipinski提出了"5规则"用以预言分子吸收性. 如果一个分子有如下性质, 一般吸收较差:(Adv. Drug Delivery Rev. 1997, 23, 3-25): 1. 多于5个氢键给予体 当然,被活跃的传送体如葡萄糖传送的分子, 对这些规则例外. 为何这些规则叫做"5规则"是因为每条规则都包含5或其倍数. 虽然有许多例外, 这些规则在开始真正的合成之前仍然对设计类药分子非常有用.
文库生产 在文库合成中, 固相反应与液相反应一样广为应用. 许多多样性合成方法已被报道因而 短时合成大量化合物的方法已经开始蓬勃发展. 但是, 合成产物的净化和提纯步骤也需要越简单越好. 另外, 原料是否可得也需要在设计高效路线之前考虑到 因为大量化合物是一次性合成的. 反应物可以购得且价格便宜是个优点, 可是合成路线还需短而简单. 因为多数情况下每一步并不能完全提纯, 考虑到终产物提纯, 整个反应必须限制在5步以内.
确认正确合成了化合物是必要的. 通常文库合成一直进行到最终步骤而不除去副产物或确认反应终结. 所以, 提出和查证终产物是必须的, 这是文库合成的最大弱点. 多数步骤可以同时平行进行, 但是这最后的一步在大多数时候仍需一个一个链式处理得到的产物. 换言之, 提纯和分析通常需要大量时间和精力. 文库产物分析中也如普通方法那样经常使用NMR, 但是色谱技术如HPLC/GC更多用于提纯而 质谱用于检验物质结构. 已经做过很多改进和自动化这一步的尝试.
一旦文库化合物被合成, 就可以使用已设计的筛选方法选择活性分子. 由于化合物量非常大, 所以高通量筛选是必需的. 最终, 第一个前导化合物被发现了. 如果前导化合物在初期已经发现了, 这一步即可省略. 前导化合物一经发现, 下个步骤就是合成与前导化合物结构相似但略有差别的次级文库. 在这一步与前导化合物的相似性比多样性更重要. 从次级文库中筛选较前导化合物活性更高的分子是个重复过程. 关于哪个结构起重要作用的信息是在这一过程中发现的, 这叫做构效关系(SAR). 这些重复的文库合成和筛选过程叫做最优化,这与抗体的突变非常相似.
|
|
| back to main page | |
|
|
| Copyright (c) 2000-2002. Young-Tae Chang, New York University. All rights reserved |
| Web Master : Young Soo Kim |