- 软件概述
Toxicity Estimation Software Tool(简称TEST)是由美国国家环境保护局(U.S. EPA) 旗下国家计算毒理学中心(NCCT)开发的一款免费、开源的定量构效关系(QSAR)毒性预测软件。它旨在帮助用户仅凭化学物质的分子结构,快速估算其多项毒理学终点和物理化学性质,是学术研究、化学品风险评估及绿色化学设计领域的重要辅助工具。
TEST基于开源Java计算化学库——The Chemistry Development Kit(CDK)构建,具备独立的图形用户界面(GUI),用户无需依赖任何外部程序即可完成预测。
- 工作原理与核心方法论
TEST的核心科学原理是定量构效关系(QSAR)。该方法基于化学物质分子结构的物理化学特征(即分子描述符,如分子量、辛醇-水分配系数logP、拓扑极性表面积等),通过数学建模建立结构与毒性效应之间的关联。
对于用户输入的每一个化合物,TEST会自动计算其分子描述符,并调用内置的多种QSAR模型进行预测,最终输出综合性的估算结果。
- QSAR建模方法
TEST集成了七种独立的QSAR建模方法,并对各方法的结果进行加权平均,得到最终的共识预测(Consensus Method)。这七种方法的原理及特点如下:
(1)层级法(Hierarchical method):使用Ward聚类算法将训练集划分为多个结构相似的簇,为每个簇分别建立模型;预测时取各簇模型预测值的加权平均。优点是预测结果更可靠,但无法为训练集化合物提供严格的外部预测。
(2)FDA法(FDA method):为每个待测化合物动态构建一个新的模型,该模型基于训练集中与待测化合物最相似的化合物进行拟合。模型在运行时生成。
(3)单模型法(Single-model method):使用多元线性回归(MLR)拟合整个训练集,建立全局预测模型。模型形式透明,便于查看和导出,但对某些特定化学类别的毒性趋势拟合可能不够精准。
(4)基团贡献法(Group contribution method):仅使用分子中特定基团(片段)的计数作为自变量,建立多元线性回归模型。模型高度透明,便于识别致毒基团,但未考虑相邻基团间的相互影响。
(5)最近邻法(Nearest neighbor method):寻找训练集中与目标化合物结构最相似的三个化合物,取其毒性实验值的加权平均作为预测结果。计算速度快,便于查找结构类似物,但外部验证中统计准确率通常最低。
(6)共识法(Consensus method):取上述多种方法预测结果的加权平均值,在外部验证中预测准确率最高,可靠性最佳。
(7)作用模式法(Mode of action method):两步法——先用线性判别模型预测水生毒性作用模式,再用对应的多元线性回归模型进行定量预测。
- 可预测的毒性终点与物理性质
4.1 毒性终点(Toxicity Endpoints)
TEST提供以下五类毒理学终点的预测模型(均针对有机物):
(1)水生毒性——96小时半数致死浓度:黑头呆鱼(Pimephales promelas),单位为mol/L
(2)水生毒性——48小时半数致死浓度:大型溞(Daphnia magna),单位为mol/L
(3)水生毒性——半数生长抑制浓度:梨形四膜虫(Tetrahymena pyriformis),单位为mol/L
(4)哺乳动物毒性——大鼠经口急性毒性:大鼠(Rattus norvegicus),单位为mg/kg
(5)特殊毒性——Ames试验致突变性:鼠伤寒沙门氏菌(Salmonella typhimurium),结果为阳性/阴性(分类)
4.2 物理化学性质(Physical Properties)
TEST还内置了多种物理化学性质的预测模型,包括常压沸点(Boiling Point)、密度(Density)、水溶性(Water Solubility)等,这些参数在化学品环境归趋评估和绿色工艺设计中具有重要参考价值。
- 安装与系统要求
5.1 系统要求
(1)操作系统:Windows 64位(官方提供专用安装包)
(2)外部依赖:无需任何外部程序,TEST可独立运行
5.2 详细安装步骤
(1)访问TEST官方下载页面:https://www.epa.gov/comptox-tools/toxicity-estimation-software-tool-test
(2)在页面中找到“Download TEST (version 5.1.2或最新版本)”部分,将安装文件下载到本地硬盘。由于文件体积较大,下载可能需要15分钟或更长时间,具体取决于网络连接速度。
(3)双击下载的安装文件(installTEST5.1.2_Windows_64bit.exe),按照图形界面提示完成安装。
(4)静默安装(可选):如需进行批量部署,可通过命令行执行静默安装。在命令提示符中进入安装文件所在目录,输入以下命令:installTEST5.1.2_Windows_64bit.exe -i silent
5.3 版本说明
截至最新官方发布,TEST版本号为v5.1.2,该版本已修复此前广泛关注的Log4j安全漏洞。
- 基本使用方法
6.1 化合物输入方式
用户可通过以下任意途径输入目标化合物结构:
(1)在软件内置的分子结构编辑器中直接绘制二维结构
(2)输入SMILES字符串
(3)输入CAS号或化合物通用名称(需在软件内置数据库中匹配)
(4)提交包含SMILES或结构信息的文本文件
6.2 标准预测流程
(1)在“Endpoint”下拉菜单中选定目标毒性终点(如“Rat Oral LD50”)
(2)在“Prediction Method”中选择QSAR方法(推荐优先选择“Consensus”共识法)
(3)(可选)如遇“Fragment Constraint”提示,可勾选“Relax fragment constraint”选项
(4)点击“Browse”指定预测报告的输出文件夹
(5)点击绿色的“Calculate!”按钮,软件将自动完成计算并生成报告
- 典型应用场景
7.1 化学品优先级排序:在大量缺少实验数据的化学品中,快速筛选出潜在高风险物质,指导后续实验资源配置
7.2 绿色化学与工艺设计:在新材料、新溶剂或新工艺开发阶段,早期评估候选物质的EHS(环境、健康与安全)属性
7.3 药物早期发现:在药物研发先导化合物优化阶段,评估化合物的潜在发育毒性或致突变性
7.4 学术研究与教学:作为QSAR方法学的实践平台,或用于不同预测工具之间的结果比对研究
- 重要声明与使用限制
8.1 官方免责声明
美国国家环境保护局(U.S. EPA)对TEST软件的适销性(Merchantability)或针对特定用途的适用性(Fitness for a Particular Purpose)不作任何明示或暗示的担保。EPA不对TEST所提供数据的准确性、完整性或用于任何目的的可靠性作出任何声明。使用本软件产生的一切风险由用户自行承担。
8.2 适用范围与技术限制
8.2.1 适用范围:TEST的模型仅适用于有机化合物的预测,无法处理无机盐、配位化合物或复杂混合物体系。
8.2.2 准确性边界:对于结构上与TEST内置训练集化合物差异较大的新型物质(即“应用域”之外的化合物),预测准确性会显著降低。TEST应作为初步筛选工具,不能替代法规要求的实验验证。
8.2.3 预测不确定性:所有预测结果均带有统计学误差,用户应结合专业知识和实际实验数据综合判断。
- 总结
TEST作为一款免费、开源且功能集中的QSAR预测工具,凭借其四种建模方法集成和共识预测机制,在化学品毒性初筛领域具有较高的实用价值。其覆盖水生毒性、哺乳动物急性和特殊毒性等多个终点,能够满足研发和评估工作中的多样化需求。建议用户在使用时充分理解其“应用域”概念,将TEST预测结果作为科学决策的参考依据之一,而非最终结论。
