iTutor_spider发布 V1.0

用来练习selenium的小工具,为导师分析工具iTutor爬取数据
欢迎大家补充功能、提出建议!

功能清单

目前已经能够爬取指定作者所有文献的
标题
期刊
摘要
关键词
期刊核心情况
全部作者
生成方便易读的xls文件

演示

链接

https://github.com/whitewatercn/iTutor_spider

主要依赖库

selenium
xlrd

致谢

感谢 @honeymoose 的指导

@whitewatercn 不客气的。

非常感谢能够分享学习经验。

用 GitHub 来管理自己的的文档和代码其实是一个非常好习惯,这样能够了解到自己对代码的修改,同时也不会丢失。

很多博客网站的设计并不是非常靠谱,有时候也会出现很多问题,最好还是自己留有一份原始的文档版本。

1 Like

是的,之前丢过一些东西,现在所有成体系发布的东西都有自己本地备份Orz,至于闲聊就无所谓了,丢就丢了

GitHub未来也会有丢失的一天,但现在看来还是比较稳定的,不过也要做好本地备份

GitHub 其实是一个中央仓库,但是每次你在本地的修改记录是不会丢的。

就算有一天 GitHub 丢了,只要你本地仓库里面还有东西的话,你可以随便上传到其他的仓库里面。

至少目前我感觉 GitHub 还是比较稳定的,上面的东西蛮多的,暂时来说出问题的情况可能不大。

1 Like