您现在的位置: 爱51代码网 >> 范文 >> 文章正文
NLP中文信息处理---正向最大匹配法分词
bsp;   word=sentence[0:maxLen] #每次取最大词长的词  
29. 
30.        meet=False;   #标记位, 判断是否找到该词  
31. 
32.        while((not meet) and (len(word)>0)): 
33.            #如果词在词表中  
34.            if(word in strList): 
35.                wordList.append(word)   #添加到输出列表  
36.                sentence=sentence[len(word):len(sentence)]#论文网 后移  
37.                meet=True; 
38.            #词不在词表中时  
39.            else: 
40.                #当词长为1时, 添加到输出表, 并后移总词位  
41.                if(len(word)==1): 
42.                    wordList.append(word) 
43.                    sentence=sentence[len(word):len(sentence)] 
44.                    meet=True; 
45.                else: 
46.                #当词长不为1时, 词长减1(最后一位)  
47.                    word=word[0:len(word)-1] 
48.    return wordList 
49. 
50.#主函数  
51.def main(): 
52.    strList,maxLen=load_dict('dict.txt') 
53.    print("词表中最大词长度为:",maxLen) 
54.    #输入句子  
55.    sentence = input('请输入中文句子:') 
56.    print('输入的句子为:',sentence) 
57.#   sentence='迈向充满希望的新世纪'  
58.    print('输入的句子为:',sentence) 
59.    length=len(sentence) 
60.    print('输入的句子长度:',length) 
61.    print("****************开始解析**********************") 
62.   

上一页  [1] [2] [3] [4] [5] [6] 下一页

  • 上一篇文章:

  • 下一篇文章: 没有了
  • 最新文章 热点文章 相关文章
    sharepoint 2010 获取用户信息Us
    设计包含max函数的队列
    随机从数组中取出指定的不重复的
    mysql主从同步延迟方案解决的学习
    青岛科学六年级下册教材分析
    生日旅行总结
    中小板生日快乐随感
    送生日快乐桑葚乳酪小蛋糕
    写给女儿的生日快乐
    总分公司财务核算
    mysql主从同步延迟方案解决的学习
    生日旅行总结
    中小板生日快乐随感
    送生日快乐桑葚乳酪小蛋糕
    写给女儿的生日快乐
    总分公司财务核算
    恢复使用繁体字可行性研究报告
    保险受益人制度相关问题的探讨
    初中生地理读图能力培养的研究
    搞笑生日祝福
    中国工作流厂商形成战略联盟
    TIME_WAIT状态下对接收到的数
    The layout of PID & PORT i
    hadoop核心逻辑shuffle代码分
    The layout of PID & PORT i
    The layout of PID & PORT i
    The layout of PID & PORT i
    MapReduce错误任务失败处理 
    Oracle恢复内部原理(介质恢
    在 Oracle 中如何确定远程 s
     



    设为首页 | 加入收藏 | 网站地图 | 友情链接 |