(1) 文本司成段,通常单词、 句子和段落。
(2) 文本划分为不同的词汇单元。基于 nondictionary 的处理包括空白和 n 克分割,而基于字典支持包括单词、 句子,和段分割和归类。
(Shenyang, China)