yy.vip易游-体外诊断检验系统性能评价方法：检出限与定量限

更新时间：2026-04-17

点击次数：

　　YYVIP易游·(中国有限公司)官方网站-国家药品监督管理局于2022年7月1日发布了行业标准《体外诊断检验系统性能评价方法第3部分：检出限与定量限》，该标准于2024年1月1日已实施，该标准提供了体外诊断检验系统的检出限与定量限性能评价方法。

　　本文件不适用于结果报告为名义标度和序数标度的体外诊断检验系统的性能评价，例如用于血细胞鉴定、微生物分型、核酸序列鉴定、尿液颗粒鉴定，结果报告为阴性、阳性或 1+、 2+、3+的体外诊断检验系统。

　　下列文件中的内容通过文中的规范性引用构成本文件必不可少的条款。其中注日期的引用文件，仅该日期的版本适用于本文件；不注日期的引用文件，其最新版本(包括所有的修改单)适用于本文件。

　　由给定测量程序得到的测得量值，对于此值，在给定声称物质中存在某种成分的误判率为α时，声称不存在该成分的误判率为β。

　　注1：国际纯粹与应用化学联合会（IUPAC）建议α 和β 默认值等于0.05。

　　注1：在检验医学中被测量的规定需说明量类（例如质量浓度）、含有该类量的基质（例如血浆）以及涉及的化学实体（例如分析物）。

　　注3：在化学上，“分析物”，或某种物质或化合物的名称，有时被用作“被测量”术语。此用法是错误的，因为这些术语不指代量。

　　注1：参考量值可以是被测量的一个真值，在此情况下他是未知的，或者是一个约定量值，在此情况下他是已知的。

　　注1：随机测量误差参考量值是对同一被测量无穷多次重复测量结果得到的平均值。

　　注2：一组重复测量的随机测量误差形成一个可以由其期望值和方差概括的分布，期望值通常被假定为零。

　　注1：给定项目可以是，例如，一个过程、测量程序、物质、化合物或测量系统。

　　注3：在法定计量中，验证与对测量仪器的检查和标贴和（或）发放验证证书有关。

　　注5：在化学上，对于物质或活性的特征的验证需描述物质或活性的结构式或特性。

　　注6：ISO 9000:2005的3.8.4中验证的定义为：通过提供客观证据，对规定要求已得到满足的认定。

　　制造商在对体外诊断医疗器械进行性能评价时，其计划、实施、评价和文件化等相关过程应符合YY/T 1441的规定。制造商应规定所有管理和实施体外诊断医疗器械性能评估相关人员的责任和相互关系，并确保具备充足的资源。制造商设计评价方案，并进行测试，做好相关记录，所有文件和记录作为该产品技术文件的一部分。性能评价的负责人应对性能评价结果最终评定和审查，并形成评价报告。

　　检出限与定量评价分为建立及验证，检出限的建立方法应根据具体产品的原理、检测结果差异和分布，选择合适的分析方法和数据统计方法进行计算，分析方法有3种。定量限的建立应与预先确定准确性目标，满足目标的前提下，可以测量的最低被测量浓度即为定量限。准确性目标要求越严格，定量限可能越大。鉴于定量限定义的灵活性，当报告定量限估计时，要求包括其确定时的准确度目标。准确度目标应以不确定表示，当不确定度不宜获得时，准确度目标优先设定为总误差目标。在某些情况下，如无法在合适的低水平待测物浓度下确定不确定度或总误差目标，可采用其它合理的替代方法建立定量限，例如研究试剂精密度达到固定要求时的最低待测物浓度。

　　相对于建立方法而言，验证方法相对简单，只需要测定一定份数符合要求的空白样本和低浓度样本，考察检测结果是否满足条件，即可判断空白限、检出限和定量限的设置是否合理。

　　评价检出限和定量限，依赖于空白样本和低浓度水平样本的测试。宜采用独立和天然人源样本。空白样本代表不含被测量的人源样本，对于空白样本的获得，可直接来源于人源样本，或对人源样本进行技术处理得到。如空白人源样本不易获得，也可以寻找可行替代物，例如样本稀释剂、缓冲液、生理盐水、纯水、蛋白质溶液和类似的基质等。天然低浓度水平人源样本不宜获得，可采用稀释或加标样本以便提供期望的被测量水平的低浓度水平样本。所有替代物样本应在测量过程中与天然人源样本表现相似，可以通过线性，回收和/或其它适当的测试予以证明。

　　按方法一建立检出限时，如采用生理盐水、纯水等替代物作为空白样本，可选择 1 个空白样本，增加重复测试次数，保证每批试剂测试空白样本结果数量≥60个。选择低浓度样本，浓度范围在1 LoB～5 LoB，LoB 的粗略估计可计算为单个空白样本的 20 个重复测量的最大值，如 LoB 值为零，则低浓度水平样本浓度范围按期望值确定。宜将样本分装并冰冻保存（-20℃~-70℃），每次实验前取出以保证稳定性和一致性。

　　按方法三建立检出限时，应使用至少3个独立的阳性人源样本，如可获得，则世界卫生组织（WHO）标准物质或其等效标准物质应作为阳性样本。如果被测量具有遗传变异，则应选择足够的样本来代表主要基因型，特别是在测量程序的使用说明书中具体引用的那些，较不常见或较少临床相关的基因型可通过验证测试使用；阴性样本用于评估测量程序的假阳性率和/或评估 LoB，采用本方法必须使用天然人源样本，而不是加工过的样本或人工样本。可使用阴性混合样本，但是必须测试至少 30个特定的阴性样本。

　　以准确度目标评价定量限时，应已知每个样本的标准值。样本可以为参考物质样本，或通过参考测量程序或其它具有可接受准确度的测量程序测定得到具有标准值的低浓度水平样本及其稀释样本。

　　待评价产品一般是体外诊断试剂，该试剂与体外诊断仪器、校准品等组成特定的测量系统，评价时，应对包括待评价产品在内的测量系统的名称、型号、批号等基本信息进行记录并报告。

　　分析天、分析批、试剂批号、校准品批号、校准周期、操作者、仪器、实验室等因素均会对测试结果产生影响。在进行检出限和定量限评价前，可通过文献、类似产品的信息、用户反馈、已有经验、风险分析、调研、预实验数据等途径识别潜在的影响因素，并判断那些因素，并判断哪些因素会对评价产生较大影响。一般情况下，没有必要对各个影响因素进行单独评估，本标准所采用的平衡嵌套设计将各相关因素整合在一起进行考虑，例如分析天、分析批中包含校准周期、操作者、实验环境等因素。

　　检出限的建立，依赖于对低浓度水平样本的测试与建立的空白限的值。而空白限的建立，依赖于对空白样本的测试，由空白样本的结果确定。试验设计为使用仪器在多天内使用多个试剂批号对空白样本和低浓度水平样本的重复测量，并满足最少测试结果要求和最小设计要求。例如，对于经典法要求保证每个试剂批号得到至少 60 个空白样本测试结果和 60 个低浓度水平样本测试结果，最小设计要求为：1个仪器系统、2 个试剂批号、3 个测试日、4 个空白样本、4 个低水平浓度样本（浓度范围在 1 LoB～5 LoB）、每个样本重复测试 2 次（每个试剂批号，仪器系统和天的组合）。

　　定量限的建立，需要根据临床需求和厂家选定的性能规范的允许误差来设定准确度目标，最常见的是设定总误差（TE）目标值，并预先确定预期的定量限的目标浓度，在该浓度下制备多个低浓度水平样本。使用多个试剂批号，一个或多个仪器系统在多天中重复测试样本。根据测量结果计算每个试剂批号的TE。如果每个试剂批号的 TE 满足预定目标，则平均浓度报告为测量程序的定量限。要求保证每个试剂批号得到 36 个低浓度水平样本测试结果，并满足最小设计要求：1 个仪器系统、2 个试剂批号、3 个测试日、4 个独立的已知被测量浓度的低浓度水平样本、每个样本重复测试 3 次（每个试剂批号，仪器系统和天的组合）。

　　上述最小设计均不能满足每个试剂批测试结果的总数要求。可通过添加更多设计因素（例如，校准品批，校准循环，操作者）和/或增加重复次数以提供足够数量的测量结果，增加哪些因素的选择取决于特定的测量程序、用于测试的可用资源和具体的严格性要求。

　　检出限与定量限评价试验前，研究者应能正确、熟练操作待评价的产品，以及相关的仪器设备、校准程序、质控程序、维护程序等。评价实验的整个过程中，应保证仪器设备稳定运行，依照待评价产品的使用说明中的校准频率进行校准，并运行质控程序，一旦待评价产品出现失控，应重新测定。准备完成设计测试所需要足够的试剂量和样本份数，并保证每份样本量充足，足够按设计需求等分试样，并能提供额外等分试样以备可能的测试错误或处理故障。

　　试验过程中应实时检查数据的完整性和有效性。如果因质控原因或其他已识别和确认出的错误来源，影响到数据的真实性时，则剔除错误数据，并及时重复测试以补充数据。若剔除数据较多时，应考虑测量系统性能的稳定性及此时进行性能评价的适宜性。

　　检出限与定量限建立试验，有两条数据分析的路径。第一条路径用于使用 2 个或 3 个试剂批号的研究，则对每个试剂批号的数据独立计算得到每个试剂批号的检出限或定量限值，并选择最大值作为测量程序的报告检出限或定量限值；第二条路径用于使用 4 个或更多个试剂批号的研究，则对组合数据集计算得到组合数据的检出限或定量限值，作为测量程序的报告检出限或定量限值。值得注意的是仅有2个或3个试剂批号的研究可能会受到显著的试剂批号间变异性的影响。这种预期变异性在使用 4 个或更多个试剂批号时会得以减弱。在数据统计分析中，如果试剂批间或样本间检测结果变异性过大，应首先查明原因，进而决定是否采用其他实验方法重新进行评价。

　　性能评价的负责人应撰写评价报告。评价报告中应包含检出限与定量限评价的方案、数据和评价结果。

　　使用方法一评价检出限（LoD），依赖于对低浓度水平样本的测试与已经建立的空白限（LoB）的值。本标准推荐采用同时对一组空白样本和一组低浓度水平样本进行测量，选择参数或非参数数据统计分析，评价检出限。

　　推荐的试验模型为：采用 1 个仪器系统、2 个试剂批、3 个测试日、5 个空白样本、5 个低浓度水平样本（不同浓度）、每个样本进行 4 次重复测量，满足每个试剂批号的空白样本与所有低浓度水平样本测试结果数量≥60 个。依据实验设计，制定测试计划，每个测试日，根据测试计划进行每个样本的指定数量的重复测试。

　　注：本文件中所有试验均可采用其它模型，如当样本的稳定性较差，不能实现多天重复测试时，可不考虑最小设计要求中测试天数的要求，减少测试天数，增加每日重复测试数量，保证最终测试结果数量即可。

　　每个分析批结束时，检查测量结果，以便发现可能的处理错误或结果缺失。识别潜在离群值并分析可能的离群原因（例如，样本不足，仪器处理错误，样本识别混淆）。除了测量程序本身的分析误差之外，由上述可能的离群原因引起的异常值可重新测试并代入数据，尽量在同一日完成重新测试。任何此类重新测试必须与原始测试结果一起记录。如果任何一个试剂批号的所有样本结果中存在 5 个以上确定原因的异常值，则需要进行重新测试。确保在测试结束时有足够的测量结果进行数据分析。最终测试结果可通过格拉布斯（Grubbs）检验统计离群值，允许剔除 1 个离群值，否则应重新测定。

　　对测试结果进行统计学分析，判断测试结果是否为正态分布，进而确定使用参数分析法或非参数分析法计算空白限。可利用商业软件进行正态分布判定。

　　k —正态分布的第 95 百分位数的乘数(1.645 表示从 α= 0.05 的正态分布的第 95 百分位数。如果选择不同的 α 值作为 LoB 估计的基础，则该乘数将需要相应地改变)；

　　若数据呈非正态分布，适用非参数分析法计算空白限，采用非参数分析法计算空白限，方法如下：将数据按大小升序排列： X（1），X（2），...，X（i），依据排列好的数据估计 p 百分位数所在位置的值，如果这个值为非整数则进行线性插入。p 百分位数按式（3）计算。

　　首先对低浓度水平样本测试结果进行统计学分析，判断其是否为正态分布，同时开展方差齐性检验。若低浓度水平样本的测试结果呈正态分布且方差齐，则按参数分析法计算检出限。具体方法：由多个低浓度水平样本的测试结果计算出合并标准差 SDZ。多个低浓度水平样本的合并标准差按式（4）~式（6）计算。

　　k —正态分布的第 95 百分位数的乘数(1.645为β= 0.05时，正态分布的第 95 百分位数的界值。如果β改变，该数值随之变动)；

　　若低浓度水平样本的测试结果呈非正态分布，可将数据转化成其他形式（例如对数形式）再进行统计分析。如果转化后的数据也呈现非正态分布，则使用非参数分析法计算检出限。具体方法为将各批号试剂低水平样本检测结果分别统计并排序，如果满足低于 LoB 值的结果的百分比小于期望的 II 类错误（β），则该试剂批的 LoD 即为低水平样本检测结果分布的中位数。例如，典型的 β=0.05 类型 II 错误要求意味着不超过 5％的低水平样本分布结果低于 LoB。如果一个或多个试剂批号的结果不能满足 II型错误要求，则使用新一组较高的测量浓度的低水平样本重复该研究。不需要重复研究的 LoB 部分，直到每个试剂批号分布均满足 II 型错误要求。其中，II 类错误（β）是指当实际上物质存在预指定水平，错误的接受其不存在的零假设的概率，即假阴性结果。与之相关的 I 类错误（α）是指当一个物质存在时，错误的拒绝其不存在的零假设的概率，即假阳性结果。α 和 β 默认值等于 0.05。

　　当假定检出限（LoD）附近的变异很大，或者临床实验室未对 LoD 进行明确估计，期望获得更宽测量浓度范围的情形时，使用精密度特征曲线来建立 LoD。

　　推荐的试验模型为：1 个仪器系统、2 个试剂批、5 个测试日、5 个低浓度水平样本、每个样本每个试剂批每天重复测试 8 次，满足了每个样本每个试剂批号测试结果数量为 40 个。之后进行实验前准备，依据实验方案开始实验测试，测试实施过程中检测测量结果。

　　计算各样本每个试剂批号的测量平均浓度及 SD（或CV），以每个试剂批号的 SD（或CV）为 Y轴，测量浓度为 X 轴，建立室内精密度分布图。

　　使用精密度曲线法的成功在很大程度上取决于用于拟合精密度与浓度数据的特定模型以及模型的拟合质量。合适模式的选择与所测试的样本测量浓度范围有着很紧密的关系。广泛使用的是线），以及 Sadler 精密度特征曲线）。

　　使用合适的模型拟合精密度曲线，并确定适当的接受标准，以评估拟合质量。如果模型拟合结果为不可接受，考虑以不同的形式表示精密度（例如方差，SD 或CV），并重新拟合模型，要确保 LoD一定要包含在最终数据范围内。

　　从 LoB 测量值浓度开始（因为根据定义，LoD 不能小于 LoB），通过精密度模型计算预测的实验室内精密度（SDs），并使用它来计算 LoD 估计值。如果精密度曲线模型使用CV 作为变量，则需要将CV 值转换为相应的SDs值，并依据式（10）、式（11）计算 LoD。

　　以 LoB 值为初始测量浓度，作为 X 带入精密度曲线模型，计算SDs和相关的 LoD 估计值，逐渐增加测量浓度，重复该过程，直到得到一个与拟合的 LoD 估计值相等的测量浓度浓度，此值作为数据集的 LoD。

　　方法三 LoB 与 LoD 的建立可以平行或顺序进行，LoB 值的确定有两种情况，第一种定义为零并且通过测试多个阴性人源样本确认（假阳性结果的百分比不超过规定要求，每个试剂批号必须单独确认）；第二种使用多个阴性人源样本的方法确定。

　　推荐的实验模型为：2 个试剂批号、1 个仪器系统、3 个测试日、已知被测量含量的 3 个独立阳性样本、30 个独立阴性样本、每个阳性样本稀释 5 个浓度梯度、每天每个试剂批号每个稀释梯度的阳性样本重复测试 20 次、每个试剂批号每个阴性样本 2 次重复。依据实验设计，制定测试计划。

　　注：可用单个样本进行初步测试以判断稀释比和稀释梯度数量。稀释系列应当使得至少三种稀释产生在 0.10~0.90 范围内的命中率，并且至少一种稀释产生超过 0.95 的命中率。适当的增加稀释的数量可以用于改善模型的质量。

　　以被测量浓度作为 X 轴变量，命中率作为 Y 轴变量，绘制概率单位曲线，进行概率拟合。通常在X轴上使用 lg 浓度会改善概率拟合质量。使用合适的统计学检验来评价概率单位模型的拟合质量（例如偏差统计或卡方检验），判断模型拟合是否可接受。如模型拟合可接受，通过曲线找到预期命中率下的分析物浓度，将该值作为特定试剂批的 LoD。如果拟合度不可接受，通过测试另外的稀释度和/或重复测试现有稀释度，如果可以，可将这些结果和现有数据合并使用，可能可以提高拟合的质量。

　　定量限（LoQ）是指能够准确检测到的样本中分析物的最小实际量，其应满足实验室对准确度的要求。定量限可以等于或高于检出限，但不能低于检出限。如果测量值的不确定度（或总误差）偏低，则没有必要对每一种方法都测定定量限。在这些情况下，可以适合地报告每一个低水平结果的估计不确定度，并允许用户指出是否适用。LoQ 优选根据总误差目标或偏倚目标来定义。

　　根据临床需求和室间质量评价的允许误差设定总误差目标值（TE目标值）。利用式（13）或式（14）计算建立试验中每个试剂批号每个低浓度水平样本测试结果的总误差（TE）：

　　利用方法一评价定量限，应已知每个用于评价检出限低浓度水平样本的标准值。利用5.1方法评价出检出限后，计算每个样本测值与标准值的 TE，如果计算所得 TE ≤ TE目标值，则LoQ=LoD；反之，由方法二确定新的定量限。

　　注1：低浓度水平样本可以为参考物质样本，或通过参考测量程序或其它具有可接受准确度的测量程序测定得到的低浓度水平样本。

　　注2：参考物质样本为选择法定或商业化的参考物质。如果没有所需低浓度的商业化或法定的参考物质，可以在确定低浓度范围呈线性后，选择加入参考物质或适当的稀释已知浓度的样本来制备所需参考物质样本。

　　注3：当没有可比较的参考方法或参考物质时，分析偏倚可忽略，此时总误差等于 2SDS。

　　注4：当 B 为相对偏倚时，式（13）可以表示为 TE(%)= B + 2CV，在不考虑分析偏倚的条件下，总误差等于 2CV。

　　注5：如果需要更高的概率，则通过更大的因子来增加SDS。例如，置信度为 99.5%，测试结果呈正态分布，TE(%)= B+4SD 或 TE(%)= B + 4CV。

　　根据临床需求和室间质量评价的允许误差设定总误差目标值（TE目标值）。并预先确定预期的定量限（LoQ）的目标浓度，在该浓度下制备多个低浓度水平样本。使用多个试剂批号，一个或多个仪器系统在多天中重复测试样本，推荐的试验模型为：1 个仪器系统、2 个试剂批号、3 个测试日、每个样本重复测试 3 次（每个试剂批号，仪器系统和天的组合）、4 个独立的已知被测量浓度的低浓度水平样本。要求保证每个试剂批号得到 36 个低浓度水平样本测试结果，制定每日测试计划，每个测试日根据测试计划进行每个样本的指定数目的重复测试。根据测量结果计算每个试剂批号的总误差（TE）。如果每个试剂批号的 TE 满足预定目标，则平均浓度报告为测量程序的 LoQ。

　　计算给定试剂批号的所有重复样本中每个低浓度水平样本的平均值和 SD，并依据标准值计算每个低浓度水平样本的偏倚。根据式（13）或式（14）计算每个样本的 TE。如果需要，根据样本的标准值转换为百分数（5）。与 TE目标值进行比较，满足 TE TE目标值的最低浓度的样本被作为该批号的定量限值。所有批号的最大定量限被作为测量程序的定量限。

　　除上述方法一和方法二建立定量限外，还可以使用精密度曲线法来建立定量限值。此方法中可接受的准确度目标仅基于精密度要求。具体方法介绍如下。

　　获得 9 个血清标本，其浓度应覆盖测量范围的下限区域，根据临床经验，9 个样本，最低值选在 LoD 附近，高值为 6倍~7 倍 LoD，期间 7 个点大致依据等浓度点排列。

　　推荐的试验模型为：1 个仪器系统、2 个试剂批、5 个测试日、9 个低浓度水平样本、每个样本每个试剂批每天重复测试 8 次，满足了每个样本每个试剂批号测试结果数量为 40 个。之后进行试验前准备，依据实验方案开始实验测试，测试实施过程中检测测量结果。

　　采用统计学软件，计算各样本每个试剂批号的测量平均浓度及 SD（或CV），以每个试剂批号的SD（或CV）为 Y 轴，测量浓度为 X 轴，建立室内精密度分布图。开展函数回归分析，结合数据组特点，选择适合的函数（一般幂函数居多），将允许误差（允许不精密度）作为 Y 代入方程，反求 X 结果，即为该批号 LoQ，两批号取最大值作为该项目 LoQ。

　　在验证 LoD 值之前，需要首先验证 LoB 值的准确。推荐的方案是：1 个试剂批、1 个仪器系统、3个测试日、2 个空白样本、2 个检出限浓度样本、每个样本进行 4 次重复测量。

　　计算空白样本测试结果中小于或等于 LoB 声明的结果占总数的百分比。与表 1 中的下限值进行比较。如果百分比大于或等于表 1 的值，则认为空白限验证成功；如果百分比小于表 1 的值，则空白限验证不成功。

　　计算检出限浓度样本测试结果中大于或等于 LoB 声明的结果占总数的百分比。与表 1 中的下限值进行比较。如果百分比大于或等于表 1 的值，则认为检出限验证成功；如果百分比小于表 1 的值，则检出限验证不成功。

　　推荐的方案是：1 个试剂批、1 个仪器系统、3 个测试日、5 个定量限浓度样本、每个样本进行 3次重复测量，测量结果数量为 45 个（3 天×5 个样本×3 次重复）。对于每个样本，计算其目标值的允许误差范围。

　　计算每个样本的测试结果落在允许误差范围内的个数，从而计算满足 LoQ 声明的可接受目标标准的所有样本测量结果的百分比，与表 1 中的下限值进行比较。如果百分比大于或等于表 1 的值，则认为验证成功；如果百分比小于表 1 的值，则验证不成功。

　　为方便验证操作，简单验证时不考虑天间影响，对 5 份浓度近似检出限的低值样本进行检测，每份样本检测 5 次，对检测结果按大小进行排序，符合低于制造商提供的空白限数值的检测结果的数量应小于等于 3 个，即可认为制造商提供的空白限和检出限的设置基本合理。

　　对 5 份浓度近似定量限的已知浓度低值样本进行检测，每份样本检测 5 次，得到 25 个重复结果，如检测结果符合每个样本的测试结果落在允许误差范围外的个数小于等于 3 个，即可认为制造商提供的定量限的设置基本合理。

　　如果测试结果在空白限与定量限之间，可用于判定分析物存在，但测量结果不应用于临床解释。测量结果在检出限与定量限之间，可以报告，但要说明有较高的不确定性。

　　罗氏诊断国产cobas pro c 703全自动生化分析仪正式获批，本土化战略再添重磅新品！

标签：空白限检出限定量限

yy.vip易游-体外诊断检验系统 性能评价方法：检出限与定量限

yy.vip易游-体外诊断检验系统性能评价方法：检出限与定量限