# OfficialAccountCrawler **Repository Path**: tealerprog/official-account-crawler ## Basic Information - **Project Name**: OfficialAccountCrawler - **Description**: 微信公号爬虫 - **Primary Language**: Python - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 2 - **Forks**: 0 - **Created**: 2023-05-20 - **Last Updated**: 2023-05-21 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # OfficialAccountCrawler #### 介绍 微信公号爬虫 #### 软件架构 软件架构说明 #### 安装教程 1. xxxx 2. xxxx 3. xxxx #### 使用说明 1. OfficialAccountCrawler为入口类 2. MySqlConfig数据库配置类,对应修改就好 3. 创建数据库之后,对应执行chapter.sql文件即可 #### 参数配置 1. __biz:公号标识 2. pass_ticket:请求票据,而且隔一段时间后(大概几个小时)就会过期,这也是为什么微信公众号比较难按固定规则进行抓取的原因 3. appmsg_token:同样理解为非固定有过期策略的票据 4. Cookie 5. uin 6. key ``` if __name__ == '__main__': biz = 'MjM5MTAwNDkwMA==' # "公号标识" pass_ticket = '8gGl8df3WZ3sAKZya742s5rSE+E0FeA07mOjDxayYNMWip9Y2t0Fa+695L9Eu9zasfIU3JZfuvXpINmQlwEhzg==' #请求票据,而且隔一段时间后(大概几个小时)就会过期,这也是为什么微信公众号比较难按固定规则进行抓取的原因 app_msg_token = '1218_njDug1GM%2FnSpIHh8MCGuT_isx9AGbVjxIbqKRA~~' # 同样理解为非固定有过期策略的票据 cookie = 'wxuin=651714222; devicetype=android-29; lang=zh_CN; version=28002339; rewardsn=; wxtokenkey=777; appmsg_token=1218_Jco6eMGeH6yUz7A9zdJycMvhUouNSH8YYGETo-ncBy60XFW-ob-P3797krmhKM0qEYyCmS9UvUW8axuY; pass_ticket=8gGl8df3WZ3sAKZya742s5rSE+E0FeA07mOjDxayYNMWip9Y2t0Fa+695L9Eu9zasfIU3JZfuvXpINmQlwEhzg==; wap_sid2=CK694bYCEooBeV9IR0dIVkM1SDl3dVY2bGJpSE8tUU4tTHpTbDdBcWt6WEd5akxKeThtSlh3WllVY21BTUVJUVZwNnFMend1b1V0NW9Kd3pfcDNDSWEwcHlmdFR2NG11SnVBVnkwWXFrU2dLRGhRc0FkbERvTTZpSzlEalpZSnJpRTRoUWhtdVQ3QnlLQVNBQUF+MMLhoaMGOA1AlU4=' uin = '777' key = '777' # 以上信息不同公众号每次抓取都需要借助抓包工具做修改 wxMps = WxDayEnglish(biz, pass_ticket, app_msg_token, cookie,uin,key) wxMps.start() # 开始爬取文章 ``` #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request 5. 如果觉得本库对您有帮助,欢迎打赏 6. 对应公号“波哥小猿” #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)