# tiny-search-engine **Repository Path**: weiambt/tiny-search-engine ## Basic Information - **Project Name**: tiny-search-engine - **Description**: This is an nlp project, based on TF-IDF, to produce a text sorting system based on keywords. - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 1 - **Created**: 2022-03-25 - **Last Updated**: 2024-03-17 ## Categories & Tags **Categories**: Uncategorized **Tags**: 基于关键词的文本排序检索系统, py, Python ## README ## tiny-search-engine ### 课题名称 微型搜索引擎(基于关键词的文本排序检索系统) ### 课题介绍 对于给定文本库,用户提交检索关键词,在文本库中查询与检索关键词最相关的 k 个文本(例如 k=5),并根据文本与检索关键词的相关度,对这 k 个文本进行排序,将排序后的结果返回给用户。 ### 课题要求 (1)利用 TF-IDF 模型,为文本库中的文本创建索引(如倒排索引) (2)用户输入的关键词可以是一个或多个 (3)对于返回的结果文本,需同时显示各检索关键词在结果文本中的出现 频度信息 (4)系统内支持返回结果文本的查看 ### 主要算法 TF-IDF ### 开发语言 python ### 学习此项目 https://blog.csdn.net/Supreme7/article/details/106795878?spm=1001.2014.3001.5502 ### 扩展功能 此项目有可扩展的功能,后续将抽空进行补充, - 制作一个前端展示页面 类似于百度搜索的主页(大搜索框),比如使用VUE - 制作一个后端API程序 推荐使用Flask或者django,实现API接口 - 补充数据集 本项目没有使用开源数据集,如您有找到适合本项目的数据集欢迎添加。 如果您有较高的技术水平并且愿意花费您宝贵的时间来支持本项目,您可以提交Pull Request,感谢您的支持