基于中文语言处理及分词技术,采用无监督的自动聚类算法对样本进行自动聚类并提取类别的语义特征,基于语义特征生成分类规则,并自动对用户要保护的文档进行分类和分级;还可通过添加正反向样本,降低误报率和漏报率。