python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词、词性标注、关键词提取、文本分类;由于要打包成exe的关系,我将原本的项目的多个文件的集成到一个python文件(窗体文件)里,只保留了使用这个系统所需要用的函数,方便打包,通俗地讲就是,比如生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据)
运行这个系统需要数据支持,所以请务必像我这样将所要用的数据跟exe放在同一个文件夹下,否则运行不了。
Keyword extraction based on TF-IDF of specific corpus. 基于特定语料库的TF-IDF的中文关键词提取
NLP项目,主要包括atten-seq2seq和transformer模型,实现机器翻译以及对话系统。
目前transformer只做了机器翻译。
LAC全称Lexical Analysis of Chinese,是百度自然语言处理部研发的一款联合的词法分析工具,实现中文分词、词性标注、专名识别等功能