# 多模态AI能力引擎平台 **Repository Path**: luodinglin/free-nlp-api ## Basic Information - **Project Name**: 多模态AI能力引擎平台 - **Description**: 免费的自然语言处理、情感分析、实体识别、图像识别与分类、OCR识别、语音识别接口,功能强大,欢迎体验。 - **Primary Language**: Java - **License**: GPL-3.0 - **Default Branch**: master - **Homepage**: https://nlp.stonedt.com - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 345 - **Created**: 2024-03-07 - **Last Updated**: 2024-03-07 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 支持本地化部署,欢迎在线体验。 [https://nlp.stonedt.com ](http://https://nlp.stonedt.com) 无论你是使用者还是共同完善的开发者,欢迎 pull request 或者 留言对我们提出建议。
您的支持和参与就是我们坚持开源的动力!请 :star: [star] 或者 [fork] 如果您在使用过程中有任何问题,请让我们知道,您的使用与反馈对我们非常重要:** ## 产品简介 思通数科利用自然语言处理技术,让计算机具备对网页、文件、文本、声音、图像的阅读能力,帮助客户自动化处理海量文本数据,打造一系列NLP技术工具集或场景化方案,提升文字处理效率和文本挖掘深度,降低人工成本。 同时可做到定制化,本地部署、低成本、接入快速、将网页、文件、文本、声音、图像中的文本进行结构化的处理,支持通过文本挖掘技术实现内容标签提取、文本自动分类等功能,全方位构建企业级数据库与内容画像。 **支持企业级用户与涉密单位本地化部署。** ## 系统架构 ![系统架构图](ProIMG/系统架构图.png) ## 算法模型 ![开源算法模型](ProIMG/开源算法模型.png) ## 应用服务 本项目产品使用到的应用服务器以及对应的应用场景及用途整理如下: | 名称 | 类别 | 应用模块及用途 | 版本 | |---|---|---|---| | tomcat | web服务器 | 提供用户前端页面访问 | 8.5.2 | | minio | 分布式文件存储 | 1.文件搜索; 2.以图识图源文件存储 | 2.1.3 | ## 功能架构 ![功能架构图](ProIMG/功能架构图.png) ## 网络拓扑 ![网络拓扑图](ProIMG/网络拓扑图.png) ## 产品体验 接口地址:https://nlp.stonedt.com
微信扫码登录,直接体验产品。
![输入图片说明](ProIMG/login.png)
## 安装视频 简易版部署视频链接地址:[https://www.bilibili.com/video/BV1E84y1D7Yg/](https://www.bilibili.com/video/BV1E84y1D7Yg/) 全服务本地化部署视频链接地址: https://www.bilibili.com/video/BV1Vj411t7KV/ [![输入图片说明](ProIMG/%E5%AE%89%E8%A3%85%E8%A7%86%E9%A2%91.jpg)](https://www.bilibili.com/video/BV1E84y1D7Yg/) ## 接口文档 [![输入图片说明](ProIMG/api-doc.png)](https://docs.qq.com/doc/DQU5yQU92aW1jWWJ4) ##### 文档地址 https://docs.qq.com/doc/DQU5yQU92aW1jWWJ4
## 功能清单 [![输入图片说明](ProIMG/function_list.png)](https://docs.qq.com/sheet/DQWRvaUJ0R2FGcFVu?tab=hienxw) ##### 功能列表 https://docs.qq.com/sheet/DQWRvaUJ0R2FGcFVu?tab=hienxw
## 功能介绍 https://gitee.com/stonedtx/free-nlp-api/blob/master/function.md ## 应用场景 ##### 1)自动结构化数据 应用于深度挖掘文本、音视频、图像、办公文件中的高频词、人物、价格、甲乙方、指标参数、时间、地名、企业名称、专有名词、主题、热点、话题、正负面情感等,自动对其打上数据标签等功能,将企业原有历史沉淀海量无序的内容结构化处理,实现更精准的检索、分类、搜索、推荐能力。系统标签覆盖上百个大类、过万个小类,通用场景主题标签600+,行业关键词标签百万级。同时提供模型训练工具,边标边训练可进一步降低成本。 ##### 2)文档智能比对 依托OCR、自然语言处理、知识图谱等技术,在合同处理场景提供交易签订、合同审查、合同归档管理等应用服务;目前支持扫描件、Word、PDF等多种文档格式,能自动抽取文档的关键信息、对比文档之间的差异、审核文档潜在风险、识别提取文档中的表格。现已广泛应用于金融、制造、通信、法律、审计、媒体、银行、政府等多种文字密集型行业,赋能企业文档流程化、自动化、智能化处理。 ##### 3)内容合规审核 支持涉黄、涉政、暴恐、辱骂、广告、灌水以及自定义合规审核,运用接视频解码、自然语言处理、图像识别、语音识别、标点恢复等多项目技术完美的结合,可以很方便的将网页、文件、文本、声音、图像中的文本内进行抽取与自动识别。采用线上大量无监督训练语料,对文本内容进行安全分类。支持用户自定义标签提供训练、评估工具,可快速完成模型的调研和训练。 ##### 4)人岗精准匹配 基于大数据及机器学习建模。自动快速,抽取候选人信息,对企业用户的筛选要求进行深层理解,给企业HR推送合适的候选人。并对简历进行关键信息提取,构建人才画像,匹配精准岗位,协助HR完成招聘流程,提升工作效率。 ##### 5)热线电话分析 针对政府、企业等热线电话场景,提供语音数据做智能降噪,并借助NLP多种技术能力组合,实现表单填写、信息检索、工单分类等任务,形成有效对话文本,并且自动填写表单,实时推荐工作人员问题的答案、检索结果,强化客服人员处理能力,提升用户满意度。 ##### 6)地址自动修复 精准提取文本中缺失地址信息以及抽取特征性的地址信息,并按省、市、区、街道、详细地址的格式结构化输出,通过自然语言处理辅助地址识别,生成标准规范的结构化信息,大幅提升辖区内政府、公安、执法、企业效率。 ##### 7)评论观点抽取 将网络评论、商品评价、客服电话中的信息快速建立正负面评论观点,针对企业服务或产品的用户评论场景,帮助企业精准、全面地理解用户想法,快速构建基于评论的数据分析系统,提供自动分析评论观点等功能,支持产品优化和营销决策,同时辅助用户进行消费决策。 ## 部署文档 详见 多模态NLP自然语言处理引擎 安装部署手册:https://gitee.com/stonedtx/free-nlp-api/blob/master/install_guide.md ## 系统登录账号密码 成功部署后 打开浏览器,输入网址 `http://IP地址:8866` 即可进入系统
默认用户名:user 默认密码:123456 ## 产品演示 ##### 演示地址 [https://nlp.stonedt.com](http://nlp.stonedt.com) 用户通过关注微信公众号,扫码注册。
## 技术合作&交流 #### 联系我们 + 微信号: javabloger + 电话: 13913853100 + 邮箱: huangyi@stonedt.com + 公司官网:[www.stonedt.com](http://www.stonedt.com) 欢迎您在下方留言,或添加微信与我们交流。 扫描微信二维码,获得技术支持 或者 申请您的系统调用配额。