• 2022-06-07
    下面哪些算法不能用于文本的分词?( )
    A: 基于规则的分词
    B: TF-IDF算法
    C: 反向最大匹配法
    D: 词嵌入
  • B,D

    内容

    • 0

      ()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。 A: 机械分词算法 B: 基于统计的分词算法 C: 非机械分析算法 D: 基于语法的分词算法

    • 1

      ()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。 A: 机械分词算法 B: 基于统计的分词算法 C: 非机械分析算法 D: 基于非统计的分词算法

    • 2

      ​()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。‏ A: 机械分词算法 B: 基于统计的分词算法 C: 非机械分析算法 D: 基于语法的分词算法

    • 3

      基于词典分词的方法叙述不正确的是( )。 A: 简单、分词效率高 B: 最大匹配法首先假定文章中最长的词由4个字组成 C: 可以应用于大规模文本分词 D: 准确率有待提高

    • 4

      ()是一种基于词典和人工规则的方法。是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功。 A: 机械分词算法 B: 基于统计的分词算法 C: 非机械分词算法 D: 随机分词法