文本分类
文本自动分类Automatic Text Categorization
何谓文本自动分类:
用电脑对文本集(或其他实体或物件)按照一定的分类体系或标准进行自动分类标记
基於分类体系的自动分类
基於资讯过滤和用户兴趣(Profiles)的自动分类
基於分类体系的自动分类
所谓分类体系就是针对词的统计来分类
关键字分类,现在的全文检索
词的正确切分不易分辨(白痴造句法)
基於资讯过滤和用户兴趣的自动分类
学习人类对文本分类的知识和策略
从人对文本和类别之间相关性判断来学习文件用字和标记类别之间的关联